ai数字人克隆采集规范分享! -凯发k8国际

`

ai数字人克隆采集规范分享!

 

数字人直播的时代已经来临,使用青否数字人saas系统数字人源码:zhibo175)去生成数字人,那如何能得到自己想要的效果呢?需要注意一下几点:

一.摄影棚灯光方案

中型(15m²左右)摄影棚​

适用于美妆/珠宝等直播,近距离细节展示,高色彩还原度​

 

大型(20m²左右)站播适用​

适用于服装鞋帽/家居等,主播站立演示穿搭/使用效果的场景​

二.数字人克隆 - 视频采集规范

训练素材录制要求

1、视频时长:训练素材要求5-10分钟;

2、拍摄要求:推荐直接用剪映录制,如果用相机更好;分辨率要求 >= 1080*1920(推荐分辨率为4k),fps不能低于25帧;拍摄主要影响因素是噪音,其次是灯光。

3、噪音:录制时要求环境安静不能有噪音,爆音,回音,最好选择安静的环境拍摄,有降噪麦克风。

4、灯光:灯光要求保证人物脸部,嘴巴,牙齿等五官细节清晰可见,光线均匀,无阴影。

5、视频画面:人物头像不能超过屏幕1/3,人脸尺寸大于300*300px;录制时推荐绿幕背景,后期可以更换各种背景;绿幕平整无褶皱,人距离绿幕2米远。

 

 

6、口播内容:内容不限,推荐选模特熟悉的内容,准备6000字文稿;讲的过程说错也没关系,继续讲就可以;千万不要一直说重复的内容。

7、服饰妆造注意事项:避免反光材质衣物;避免半透丝纱材质衣物;避免蕾丝材质的衣物;避免与绿幕相近的衣物以及绿色元素;

首饰:避免佩戴宽松易滑动晃动的首饰,比如项链、容易晃动的耳环(耳钉是可以的)、带链子的眼镜;

妆发:妆容自然得体,头发整理好避免出现散发碎发以及发缝;

8、人物动作:动作自然,与应用场景匹配;动作尽量通用,避免指向性动作;手不挡脸,抬手不过肩;表情动作自然,避免大角度侧脸;避免身体晃动,避免大幅度和迅速的动作;口播时,嘴巴注意张开,口齿清晰,发音标准,说话速度不能太快;避免舔嘴,吞咽,撅嘴,皱眉,摸头,摸脸等小动作。

9、其他注意事项:人物面部不能有遮挡,灯光要求脸部轮廓,牙齿嘴唇清晰可见;人物不能过分瘦脸,美白,可能造成轮廓不清晰。

推理素材录制要求:

1、  拍摄要求同训练视频一致;

2、  素材要求20-30s;

3、  录制过程中全程静默,不说话,前5s不动,中间做通用手势,肢体动作,表情动作自然,后5s不动。

三.声音克隆 - 音频采集规范

1、音频时长:有效音频时长20分钟,如果带口音,音频建议不少于30分钟;

2、录音准备

根据不同使用需求,准备5000字左右的文本内容,内容和应用场景(朗读、直播、日常讲话等)语境相符;

3、录音环境:录音环境安静,环境底噪小于40db,可使用“分贝仪”app测试录音环境底噪;

录制时保持无回音、无混响、无噪声等;

4、录音设备及录音参数:录音设备推荐降噪麦克风/小蜜蜂,条件允许建议使用防风棉衣或防喷罩;推荐使用48khz采样率录制音频;推荐无损音质格式保存音频,如: wav、 fiv、m4a,不能使用压缩格式保存音频,如:mp3;

5、录音人:录音人不宜离麦太近,防止喷麦和录入呼吸声连贯说完一句话;发音清晰、吐字清楚,句与句之间断句清楚;

句与句之间停顿1~2秒;保持语境风格一致,避免多种情绪混杂。

按照以上要求去拍摄和录制,上传到青否数字人saas系统后台,生成数字人即可。

 

分享到:
评论

相关推荐

    随着医学影像技术的快速发展及人工智能(artificial intelligence, ai)的蓬勃兴起,人工智能技术在医学影像学领域的应用正在如火如荼的进行着。人工智能的最终目的是让人类更好的工作与生活,人工智能与医疗产业相...

    ai数字人视频素材完整库

    由于采用了人工智能、结构化及非结构化通用采集算法,因此商剑信息采集软件可以通用采集任何结构的信息,将网络雷达、舆论监督、数据库采集、文章采集、新闻采集、邮件采集、关键字采集、结构化信息采集、非结构化...

    openai 人工智能区块链平台工具,数据采集,模型调用 openai 人工智能区块链平台工具,数据采集,模型调用 openai 人工智能区块链平台工具,数据采集,模型调用 openai 人工智能区块链平台工具,数据采集,模型调用 ...

    人工智能算法金融应用评价规范.pdf

    本项目可以充当时下流行的虚拟人、虚拟主播、数字人,等仿人形数字形象的内核部分。 ​ 使用ue、c4d、daz、live2d等三维引擎软件开发的数字形象可以与本“数字人控制器”对接,从而实现虚拟主播、数字导游、数字助手...

    ai关键词!!!!!!!!!

    手把手教你制作ai数字人:ai 数字人的制作,只需要修改json 代码即可,轻松搞定自己的数字人。

    自己写的,仅供参考,原本项目为ai数据采集,主要为医疗图像采集作用。界面完整。

    python生成虚拟数字人&虚拟直播间搭建,几行代码轻松搞定! 温馨提示: 1、要成功运行代码,需要安装cuda和cudnn,教程可以网上搜,使用gpu生成更高效; 2、需要自己录制一段声音,命名为text2voicetest.mp3,也可以...

    时空人工智能赋能数字孪生城市白皮书(2021) -2021世界人工智能大会.pdf

    2020全套ai教程。1. 内容齐全(视频 课件 代码),某站视频不全,少了好几个学习阶段,且没有课件。2. 经过压缩包和加密,链接基本不会失效。3. 网上找不到,即使找到了也是经过加密的,无法播放,必须买特殊软件...

    数字人说话工具wav2lip离线版v1.0 1、ai换脸软件v3.0离线版windows版本 https://download.csdn.net/download/qq_24252589/88427155 2、mac版本ai换脸软件离线版 ...

    fay是一个完整的开源项目,包含fay控制器及数字人模型,可灵活组合出不同的应用场景:虚拟主播、现场推销货、商品导购、语音助理、远程语音助理、数字人互动、数字人面试官及心理测评、贾维斯、her。开发人员可以...

    在人工智能、虚拟现实等新技术浪潮的带动下,虚拟数字人制作过程得到有效简化、各方面性能获得飞跃式提升,开始从外观的数字化逐渐深入到行为的交互化、思想的智能化。以虚拟主播、虚拟员工等为代表的数字人成功进入...

    人工智能对数字媒体艺术实践的影响.pdf

    ai中台,人工智能,人脸识别,语音识别,ai,业务中台,技术中台,数字人,智能客服,语音外呼,智能催收,刷脸支付

    人工智能辅助诊断技术管理规范(2017版).docx

    【精品】中智游——互联网大数据人工智能旅游智慧数据采集旅游大数据分析项目62页.pdf

    ai 人工智能整体凯发k8国际娱乐官网入口的解决方案

global site tag (gtag.js) - google analytics
网站地图