接口说明
功能描述
在获得用户授权的前提下,通用视频人脸融合能力可以将视频中检测到的最大人脸,融合进另一个人的人脸特征,达到换脸的感官效果。 通用视频人脸融合只需要输入一张带融合人脸图像与一段视频,就可以将图像人脸融合进视频中。 适用场景:
- 每次合成独立完成,无通用模板场景。
- 仅支持视频中只有一张人脸的场景。
如需使用多人场景或有固定数量的视频模板,请参见模板视频人脸融合(MergeVideoModelFace)。
为保证生成内容的安全合法,请勿使用公众人物或涉及敏感信息的图像或视频进行融合,同时,本服务也会在合成结果的左下角处添加Generated by AI的水印内容,效果如下图所示。
- 当前能力可在视觉智能开放平台有完整的免费产品体验,您可以单击立即试用对该能力进行更直观试用以及在线购买。
- 阿里云视觉智能开放平台视觉 AI 能力 API 接入、接口使用或问题咨询等,请通过钉钉群(23109592)加入阿里云视觉智能开放平台咨询群联系我们。
应用场景
- 影视后期制作:在影视后期制作时,因为某些原因需要替换演员,通过视频人脸融合技术,可利用前期拍摄素材进行处理,让前期视频素材中的人物看起来是新的演员在表演,可以为制片方节省大量的重新拍摄成本。
- 娱乐性短视频制作:用户可以将自己的人脸和已获授权的合法视频中的人物人脸进行融合,生成趣味性视频。
特色优势
- 高保真、低违和效果:融合后的人脸保留了替换者人脸身份信息的视觉特征,而融入被替换者人脸中又无违和感。
- 表情肤色一致性:融合后的人脸最大限度保留被替换者的面目表情、肤色一致性。
- 支持复杂人脸角度:支持模板人脸偏侧一定角度,融合后的结果真实稳定。
接入指引
- 创建 AccessKey:请确保您已创建 AccessKey,如果您使用的是子账号 AccessKey,您需要给子账号赋予 AliyunVIAPIFullAccess 权限,具体操作,请参见 RAM 授权。
- 在线调试(可选):您可以通过OpenAPI Explorer在线调试能力,查看完整的调用示例代码及 SDK 依赖信息,也可以下载完整的工程。
- 开发接入步骤:
- 在 SDK 总览中选择您要接入使用的 SDK 语言。
- 在对应语言的 SDK 文档中找到 AI 类目为视频生产(videoenhan)类目的 SDK 包进行安装。
- 参考文档中提供的示例代码进行适当修改后调用。
-
示例代码:该能力常用语言的示例代码,请参见视频人脸融合示例代码,常用语言查询异步任务结果的示例代码,请参见查询异步任务结果示例代码。
-
客户端直接调用:该能力常用的客户端调用方式包括以下几种。
输入限制
- 视频类型:MP4、AVI、MKV、MOV、FLV、TS、MPG。
- 视频分辨率:大于 360×360 像素,小于 1920×1920 像素。
- 视频大小:不大于 120 MB。
- 图像格式:JPEG、JPG、PNG。
- 图像分辨率:大于等于 128×128 像素,小于等于 4000×4000 像素。
- 图像大小:不大于 20 MB。
- URL 地址不能包含中文字符。
- 视频只支持静态(恒定)帧率视频,暂不支持动态(可变)帧率视频。
- 视频时长不大于 300s,大于 300s 的视频请调用模板视频人脸融合接口。
图像质量建议
- 要求保证图像中的人脸清晰。图像中人脸尺寸建议大于 64×64 像素,人脸区域建议不大于全图区域的 2/3。
- 建议图像中人脸五官区域轮廓完整,无明显遮挡。人脸融合算法支持人脸偏侧一定角度,在偏侧角度不超过 30 度的情况下能取得更佳效果。
- 建议待融合人脸的图像中只包含一张人脸,如果包含多张人脸,则默认选择图像中最大的人脸进行融合。
推荐图像示例:
不推荐图像示例:
调用步骤
该能力为异步能力,需分两步进行调用。 第一步调用 MergeVideoFace 接口提交任务,请求成功后,得到一个任务 ID。 第二步调用 GetAsyncJobResult 接口查询结果,根据任务 ID 查询任务执行状态和结果。如果任务还在处理中,可稍等一段时间后再进行查询。
计费说明
关于通用视频人脸融合的计费方式及报价,请参见计费介绍。
流控信息
请求参数
字段名称 | 字段详情 |
---|---|
VideoURLstring | 输入视频的 URL 地址。推荐使用上海地域的 OSS 链接,对于文件在本地或者非上海地域 OSS 链接的情况,请参见文件 URL 处理。 示例值:http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/videoenhan/MergeVideoFace/MergeVideoFace1.mp4参考取值来源: ToneSdrVideo ConvertHdrVideo |
ReferenceURLstring | |
AddWatermarkboolean | 是否添加水印。取值范围如下:展开详情 示例值:True |
Enhanceboolean | 是否开启人脸美颜增强。取值范围如下:展开详情 示例值:False |
WatermarkTypestring | 水印类型。取值范围如下:展开详情 示例值:EN |
返回参数
字段名称 | 字段详情 |
---|---|
RequestIdstring | 请求 ID。 示例值:DEF90E76-B62D-45EF-8835-CA3C83842B18 |
Dataobject | 返回的结果数据内容。展开详情 |
Messagestring | 提交异步任务后的提示信息。 示例值:该调用为异步调用,任务已提交成功,请以requestId的值作为jobId参数调用同类目下GetAsyncJobResult接口查询任务执行状态和结果。 |
返回说明
查询结果
该接口为异步接口,当前并未返回真实的请求结果,您需要通过返回的 RequestId 调用 GetAsyncJobResult 接口来获取该接口的真实请求结果。详情请参见 GetAsyncJobResult 。
SDK 参考
阿里云视觉 AI 视频生产类目下的通用视频人脸融合能力推荐使用 SDK 调用,支持多种编程语言,调用时请选择 AI 类目为视频生产(videoenhan)的 SDK 包,文件参数通过 SDK 调用可支持本地文件及任意 URL,具体可参见 SDK 总览。
示例代码
该能力常用语言的示例代码,请参见通用视频人脸融合示例代码,常用语言查询异步任务结果的示例代码,请参见查询异步任务结果示例代码。
返回示例
错误码
变更历史
变更时间 | 变更内容概要 | 操作 | |
---|---|---|---|
2023-10-10 | |||
2023-08-31 | |||
2023-08-10 | |||
2022-12-16 | |||
2022-11-30 | |||
2022-10-17 |