闪剪 AI 开放平台
产品介绍
复制页面
闪剪 AI 开放平台
产品介绍
产品简介
产品定价
功能介绍
常见问题
元数据-AI 显式标识和隐式标识说明
开发指南
快速接入
错误码
支持语种代码参照
克隆
专业数字人克隆
POST
极速数字人克隆
POST
声音克隆
POST
图生数字人克隆
POST
数字人/声音删除
DELETE
音频合成
文本转语音
POST
视频合成
数字人口播视频(无包装)
POST
智能剪辑模板列表
GET
数字人口播混剪视频
POST
真人口播混剪视频
POST
素材混剪视频
POST
新闻体视频
POST
音频转文字(ASR)
POST
自定义数字人口播混剪视频
POST
自定义素材混剪视频
POST
自定义真人口播混剪视频
POST
任务查询
查询任务详情
回调通知
制作类接口回调数据结构
相关协议
用户协议
隐私政策
付费协议
实名协议
数据模型
定制及制作类任务响应
制作任务结果回调数据
产品介绍
复制页面
常见问题
1. 资源包相关
#
购买了低权益资源包后,又购买了高权益资源包,权益如何生效?
高权益资源包优先生效,叠加购买高权益资源包时,已购低权益资源包有效期会冻结,待高权益资源包消耗完毕后,会继续消耗低权益资源包;
公共并发数具体指什么?
指单模块(极速数字人、专业数字人、声音克隆、视频合成)同时间段内最多可同时提交处理的任务数;
超过并发的任务如何处理?
超并发任务会失败返回,建议自行做排队机制
2. 视频保存相关
#
生成的视频保存多久?
生成的视频结果仅保留1天,生成视频后需要尽快保存;
3. 算力扣除相关
#
生成的结果视频扣除算力小于1算力时,按照1算力计算,保留两位小数;
4. 数字人审核相关
#
数字人定制为何需要授权视频?
因合规部门要求,使用用户形象训练数字人需要明确得到用户的授权;
5. 数字人克隆时长
#
** 专业版**
数字人训练视频时长 30~120秒,对应训练时间1~6小时;
数字人训练视频时间越长、文件越大,对应训练时间越长
** 极速版**
数字人训练视频时长 5~60秒,没有训练时间;
极速数字人首次制作视频时间比第二次制作视频时间长3-5分钟;
训练视频参考:
6. 授权视频
#
授权视频的内容整体含义是明确授权品牌
如下方视频中,授权对象是“闪剪”,品牌名则传“闪剪”
案例:我是xxx(真实姓名),我授权【闪剪】使用视频中的肖像、声音,为我生成定制数字人及声音,并在本人【闪剪】账号中创作使用。
7. 数字人克隆视频要求/数字人训练失败原因
#
为了获得更理想的效果,请在光线充足、安静的环境下录制。拍摄视频时,请注意不要遮挡面部。
口播话术没有要求
第一秒闭嘴
不能挡住嘴巴
不能拍侧脸,侧脸幅度不大于45度
不能多人脸出现在画面
保持人物一直在画面中
8. 声音克隆要求
#
录制过程,请保持环境安静,没有杂音、噪音、回声和混响
录制一段单人说话的音频,建议录制时麦克风离嘴巴大约10厘米的距离
录音时,要保持情绪稳定,语速均匀,就像平时聊天一样自然
录音建议用普通话,尽量不要有方言、英文或字母
录制的语气也会被克隆,请按照期望的语气进行朗读
录音建议
#
环境选择:
录音环境的选择主要考虑降低噪音和混响,建议使用 10 平方米以内的小型房间进行录音,特别是配置吸音装置的房间,录音效果更佳。
如条件允许,可以使用价格较低的吸音棉对房间进行改造,改变声波的平面反射为漫反射,从而降低混响,提高录音质量。
噪音控制
室外噪音:关闭门窗缓解噪音。
室内噪音:室内噪音主要来自空调、风扇(含电脑风扇)、日光灯镇流器、人声等。
可以利用手机录制环境声音,放大音量倾听录音,识别并关闭噪音源。
混响控制
混响是指声音在空间中反射、折射、扩散并逐渐衰减的过程所产生的听觉效果。声波在墙壁、玻璃上等光滑平面上反射时,会导致声音浑浊。
录制声音时,建议不要选择空旷的房间,尽量选用配有吸音设施的场所,或摆放不规则的环境,降低混响影响。日常办公区域和会议室通常存在较高混响,不建议使用其作为录音环境。
操作说明
普通的卧室是相对常见的理想录音环境,录音时需注意:
与手机保持约 10 厘米距离,避免太近/太远造成喷麦和电流问题。
关闭门窗,降低室外噪音。
关闭空调/电扇,减少内部噪音干扰。
拉上窗帘,降低玻璃的声音反射。
打开柜门、使用衣物、床单等覆盖柜面/桌面,降低光滑平面的声音反射,提高录音质量。
录音文案
在录音前熟悉文案,确定好人设及演绎风格,避免“读稿”,以免复刻的效果与您的心理预期不符。
录音
参考文案内容,自然表达。
发音清晰,吐字清楚,句与句之间断句清晰,每句之间停顿。
录音过程中不要有喘息声或其他声响。
通过多次录制找到最佳状态,不断提升录音质量。
9. 何为身份栏
#
“身份栏”是视频画面上用来介绍“这个人是谁”的标签或字幕。它是一个非常重要的制作元素,用于提升视频的信息量和观看体验,如图所示
10. 制作视频失败常见原因:
#
1.
数字人不按要求拍摄
2.
文案内容审核不通过,审核类目:黄、赌、毒、涉政
3.
素材内容审核不通过,审核类目:黄、赌、毒、涉政
4.
素材资源不可访问,素材包含:真人口播的视频、插入的素材、音频地址、背景音乐地址等
5.
素材不符合格式要求,要求详见具体接口返回内容
11. 相关资源审核不通过
#
按照合规部门要求,制作视频的内容需要进行合规审查,当接口返回【相关资源审核不通过】时,请检查素材、文案、音频、音乐等相关资源时否有涉及黄、赌、毒、涉政之类的内容。
12, 接口回调,接口收不到怎么办
#
制作任务成功或失败出结果才会触发回调通知调用方,中间态不会调,回调失败的情况下重试三次。三次回调失败,可调用【查询任务详情】接口,查询最终结果
13. 【元数据】具体指的是什么:
#
请查看👉
https://shanjian-openapi.apifox.cn/7461695m0
14.文案、素材审核不过
#
文案、素材则涉及政治、色情、暴力等归为行为
提示词参考:
文案、素材可能包含违规内容,如涉及政
治、色情、暴力等违法、不良或不实信
息,请清除违规内容后重试。
15.没有传音乐,为什么视频会有音乐
#
部分模板为了效果更佳,会自带音乐。
"audioSwitch": false会完全关闭背景音乐(内置+传递的audioUrl都不生效)
"audioSwitch": true + 传audioUrl(使用audioUrl作为背景音乐)
"audioSwitch": true + 不传audioUrl(使用内置背景音乐,但取决于模版有没有配置)
16. 新闻体视频,视频和所选的模板效果不一致
#
行数限制,新闻体行数建议小于、等于模板封面的行数,超出行数,会显示默认模板,默认模板如下:
17.域名白名单:
#
视频文件
数字人纯口播(无包装)不添加数字水印:
https://ai-res-bhb-1300308946.cos.ap-guangzhou.myqcloud.com
数字人纯口播(无包装)添加数字水印:
https://vod-effect-new-1300308946.cos.ap-beijing.myqcloud.com
所有的口播混剪视频:
https://vod-vcr.oss-cn-beijing.aliyuncs.com
音频文件:
v1、v2、v3、s1不加停顿和v1加停顿:
https://mus-effect.oss-cn-beijing.aliyuncs.com
v2、v3、s1加停顿:
https://vod-vcr.oss-cn-beijing.aliyuncs.com
修改于
2025-12-12 03:22:31
上一页
功能介绍
下一页
元数据-AI 显式标识和隐式标识说明