大家可能都知道通过一张人像图片和一段语音就可以生成数字人口播视频,而声音可以采用ChatGPT等文案通过TTS合成,所以制作这样的数字人视频工具非常快速。
常见的工具比如国外的d-id,heygen,synthesia, 国内的腾讯智影、闪剪、来画、万兴播爆、硅基智能、跃迁智能等。但是大部分这些工具最后都是需要付费使用的,费用一般是按分钟计费,一般是几元到几十元一分钟不等,都是在云端生成,有米的同学不妨尝试下。今天技术控老李向你推荐免费的数字人口播视频生成工具,亲测有效。
1. SadTalker
OpenTalker/SadTalker: [CVPR 2023] SadTalker:Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation (github.com)
提醒:这是开源软件,可以自行下载安装在本地或者通过Stable Diffusion WebUI插件安装,需要比较好的独立显卡电脑和IT技能。
2. Kreado AI
KreadoAI_AI video creation platform/AI视频创作平台/kreadoai.com
直接访问注册使用
3. IOS APP Photospeak
苹果手机端安装使用,上传人像图片以后,会自动对齐人脸关键的眼睛、嘴唇、鼻子等关键部位,嘴巴一定要紧闭状态。选择角色图片后,然后选择录音即可合成数字人视频。值得注意的是,这家日本公司还有更多的APP可以免费使用,可以让动物和植物也动起来,非常有趣。
如果有更多的类似免费工具,请留言。
转载 · 知乎作者:技术控老李
原文地址:https://www.zhihu.com/question/592101575/answer/3104278277