闪剪 AI 开放平台
  1. 产品介绍
闪剪 AI 开放平台
  • 产品介绍
    • 产品简介
    • 产品定价
    • 功能介绍
    • 常见问题
    • 元数据-AI 显式标识和隐式标识说明
  • 开发指南
    • 快速接入
    • 错误码
    • 支持语种代码参照
  • 克隆
    • 专业数字人克隆
      POST
    • 极速数字人克隆
      POST
    • 声音克隆
      POST
    • 图生数字人克隆
      POST
    • 数字人/声音删除
      DELETE
  • 音频合成
    • 文本转语音
      POST
  • 视频合成
    • 数字人口播视频(无包装)
      POST
    • 智能剪辑模板列表
      GET
    • 数字人口播混剪视频
      POST
    • 真人口播混剪视频
      POST
    • 素材混剪视频
      POST
    • 新闻体视频
      POST
    • 音频转文字(ASR)
      POST
    • 自定义数字人口播混剪视频
      POST
    • 自定义素材混剪视频
      POST
    • 自定义真人口播混剪视频
      POST
  • 任务查询
    • 查询任务详情
  • 回调通知
    • 制作类接口回调数据结构
  • 相关协议
    • 用户协议
    • 隐私政策
    • 付费协议
    • 实名协议
  • 数据模型
    • 定制及制作类任务响应
    • 制作任务结果回调数据
  1. 产品介绍

常见问题

1. 资源包相关#

购买了低权益资源包后,又购买了高权益资源包,权益如何生效?
高权益资源包优先生效,叠加购买高权益资源包时,已购低权益资源包有效期会冻结,待高权益资源包消耗完毕后,会继续消耗低权益资源包;
公共并发数具体指什么?
指单模块(极速数字人、专业数字人、声音克隆、视频合成)同时间段内最多可同时提交处理的任务数;
超过并发的任务如何处理?
超并发任务会失败返回,建议自行做排队机制

2. 视频保存相关#

生成的视频保存多久?
生成的视频结果仅保留1天,生成视频后需要尽快保存;

3. 算力扣除相关#

生成的结果视频扣除算力小于1算力时,按照1算力计算,保留两位小数;

4. 数字人审核相关#

数字人定制为何需要授权视频?
因合规部门要求,使用用户形象训练数字人需要明确得到用户的授权;

5. 数字人克隆时长#

** 专业版**
数字人训练视频时长 30~120秒,对应训练时间1~6小时;
数字人训练视频时间越长、文件越大,对应训练时间越长
** 极速版**
数字人训练视频时长 5~60秒,没有训练时间;
极速数字人首次制作视频时间比第二次制作视频时间长3-5分钟;
训练视频参考:

6. 授权视频#

授权视频的内容整体含义是明确授权品牌
如下方视频中,授权对象是“闪剪”,品牌名则传“闪剪”
案例:我是xxx(真实姓名),我授权【闪剪】使用视频中的肖像、声音,为我生成定制数字人及声音,并在本人【闪剪】账号中创作使用。

7. 数字人克隆视频要求/数字人训练失败原因#

为了获得更理想的效果,请在光线充足、安静的环境下录制。拍摄视频时,请注意不要遮挡面部。
口播话术没有要求
第一秒闭嘴
不能挡住嘴巴
不能拍侧脸,侧脸幅度不大于45度
不能多人脸出现在画面
保持人物一直在画面中
image.png

8. 声音克隆要求#

录制过程,请保持环境安静,没有杂音、噪音、回声和混响
录制一段单人说话的音频,建议录制时麦克风离嘴巴大约10厘米的距离
录音时,要保持情绪稳定,语速均匀,就像平时聊天一样自然
录音建议用普通话,尽量不要有方言、英文或字母
录制的语气也会被克隆,请按照期望的语气进行朗读

录音建议#

环境选择:
录音环境的选择主要考虑降低噪音和混响,建议使用 10 平方米以内的小型房间进行录音,特别是配置吸音装置的房间,录音效果更佳。
如条件允许,可以使用价格较低的吸音棉对房间进行改造,改变声波的平面反射为漫反射,从而降低混响,提高录音质量。
噪音控制
室外噪音:关闭门窗缓解噪音。
室内噪音:室内噪音主要来自空调、风扇(含电脑风扇)、日光灯镇流器、人声等。
可以利用手机录制环境声音,放大音量倾听录音,识别并关闭噪音源。
混响控制
混响是指声音在空间中反射、折射、扩散并逐渐衰减的过程所产生的听觉效果。声波在墙壁、玻璃上等光滑平面上反射时,会导致声音浑浊。
录制声音时,建议不要选择空旷的房间,尽量选用配有吸音设施的场所,或摆放不规则的环境,降低混响影响。日常办公区域和会议室通常存在较高混响,不建议使用其作为录音环境。
操作说明
普通的卧室是相对常见的理想录音环境,录音时需注意:
与手机保持约 10 厘米距离,避免太近/太远造成喷麦和电流问题。
关闭门窗,降低室外噪音。
关闭空调/电扇,减少内部噪音干扰。
拉上窗帘,降低玻璃的声音反射。
打开柜门、使用衣物、床单等覆盖柜面/桌面,降低光滑平面的声音反射,提高录音质量。
录音文案
在录音前熟悉文案,确定好人设及演绎风格,避免“读稿”,以免复刻的效果与您的心理预期不符。
录音
参考文案内容,自然表达。
发音清晰,吐字清楚,句与句之间断句清晰,每句之间停顿。
录音过程中不要有喘息声或其他声响。
通过多次录制找到最佳状态,不断提升录音质量。

9. 何为身份栏#

“身份栏”是视频画面上用来介绍“这个人是谁”的标签或字幕。它是一个非常重要的制作元素,用于提升视频的信息量和观看体验,如图所示
image

10. 制作视频失败常见原因:#

1.
数字人不按要求拍摄
2.
文案内容审核不通过,审核类目:黄、赌、毒、涉政
3.
素材内容审核不通过,审核类目:黄、赌、毒、涉政
4.
素材资源不可访问,素材包含:真人口播的视频、插入的素材、音频地址、背景音乐地址等
5.
素材不符合格式要求,要求详见具体接口返回内容

11. 相关资源审核不通过#

按照合规部门要求,制作视频的内容需要进行合规审查,当接口返回【相关资源审核不通过】时,请检查素材、文案、音频、音乐等相关资源时否有涉及黄、赌、毒、涉政之类的内容。

12, 接口回调,接口收不到怎么办#

制作任务成功或失败出结果才会触发回调通知调用方,中间态不会调,回调失败的情况下重试三次。三次回调失败,可调用【查询任务详情】接口,查询最终结果

13. 【元数据】具体指的是什么:#

请查看👉 https://shanjian-openapi.apifox.cn/7461695m0

14.文案、素材审核不过#

文案、素材则涉及政治、色情、暴力等归为行为
提示词参考:
文案、素材可能包含违规内容,如涉及政
治、色情、暴力等违法、不良或不实信
息,请清除违规内容后重试。

15.没有传音乐,为什么视频会有音乐#

部分模板为了效果更佳,会自带音乐。
"audioSwitch": false会完全关闭背景音乐(内置+传递的audioUrl都不生效)
"audioSwitch": true + 传audioUrl(使用audioUrl作为背景音乐)
"audioSwitch": true + 不传audioUrl(使用内置背景音乐,但取决于模版有没有配置)

16. 新闻体视频,视频和所选的模板效果不一致#

行数限制,新闻体行数建议小于、等于模板封面的行数,超出行数,会显示默认模板,默认模板如下:
image

17.域名白名单:#

视频文件
数字人纯口播(无包装)不添加数字水印:
https://ai-res-bhb-1300308946.cos.ap-guangzhou.myqcloud.com
数字人纯口播(无包装)添加数字水印:
https://vod-effect-new-1300308946.cos.ap-beijing.myqcloud.com
所有的口播混剪视频:
https://vod-vcr.oss-cn-beijing.aliyuncs.com
音频文件:
v1、v2、v3、s1不加停顿和v1加停顿:
https://mus-effect.oss-cn-beijing.aliyuncs.com
v2、v3、s1加停顿:
https://vod-vcr.oss-cn-beijing.aliyuncs.com
修改于 2025-12-12 03:22:31
上一页
功能介绍
下一页
元数据-AI 显式标识和隐式标识说明
Built with