只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。
功能特性 🎯
- 完整的 MVC架构,代码 结构清晰,易于维护,支持
API
和Web界面
- 支持视频文案 AI自动生成,也可以自定义文案
- 支持多种 高清视频 尺寸
- 竖屏 9:16,
1080x1920
- 横屏 16:9,
1920x1080
- 竖屏 9:16,
- 支持 批量视频生成,可以一次生成多个视频,然后选择一个最满意的
- 支持 视频片段时长 设置,方便调节素材切换频率
- 支持 中文 和 英文 视频文案
- 支持 多种语音 合成,可 实时试听 效果
- 支持 字幕生成,可以调整
字体
、位置
、颜色
、大小
,同时支持字幕描边
设置 - 支持 背景音乐,随机或者指定音乐文件,可设置
背景音乐音量
- 视频素材来源 高清,而且 无版权,也可以使用自己的 本地素材
- 支持 OpenAI、Moonshot、Azure、gpt4free、one-api、通义千问、Google Gemini、Ollama、 DeepSeek、 文心一言 等多种模型接入
- 中国用户建议使用 DeepSeek 或 Moonshot 作为大模型提供商(国内可直接访问,不需要VPN。注册就送额度,基本够用)
后期计划 📅
- GPT-SoVITS 配音支持
- 优化语音合成,利用大模型,使其合成的声音,更加自然,情绪更加丰富
- 增加视频转场效果,使其看起来更加的流畅
- 增加更多视频素材来源,优化视频素材和文案的匹配度
- 增加视频长度选项:短、中、长
- 支持更多的语音合成服务商,比如 OpenAI TTS
- 自动上传到YouTube平台
视频演示 📺
竖屏 9:16
▶️《如何增加生活的乐趣》
▶️ 《金钱的作用》
▶️《生命的意义是什么》
横屏 16:9
▶️《生命的意义是什么》
▶️ 《为什么要运动》
配置要求 📦
- 建议最低 CPU 4核或以上,内存 8G 或以上,显卡非必须
- Windows 10 或 MacOS 11.0 以上系统
快速开始 🚀
下载一键启动包,解压直接使用(路径不要有 中文、特殊字符、空格)
Windows
- 百度网盘(1.2.1 最新版本): https://pan.baidu.com/s/1biKrwGrGL6s0Z4vLF9YExQ?pwd=MQTK 提取码: MQTK
下载后,建议先双击执行 update.bat
更新到最新代码,然后双击 start.bat
启动
启动后,会自动打开浏览器(如果打开是空白,建议换成 Chrome 或者 Edge 打开)
第一步:先展开上面的基础设置
第二步:点击链接,去对应的大模型提供商处获取API Key,并将其填入对应的输入框中
绝大部分大模型网站注册就会送很多的API额度,基本上够用了,除非你的需求量特别特别大,或者只想要用更好的大模型,例如:OpenAI。可以考虑选择付费购买API额度。
注意:如果选择国外的大模型,需要使用VPN工具开启全局流量访问外网
第三步:按照步骤逐一生成文案、关键词,并进行视频配置
字幕生成 📜
当前支持2种字幕生成方式:
- edge: 生成
速度快
,性能更好,对电脑配置没有要求,但是质量可能不稳定 - whisper: 生成
速度慢
,性能较差,对电脑配置有一定要求,但是质量更可靠
。
可以修改 config.toml
配置文件中的 subtitle_provider
进行切换
建议使用 edge
模式,如果生成的字幕质量不好,再切换到 whisper
模式
注意:
- whisper 模式下需要到 HuggingFace 下载一个模型文件,大约 3GB 左右,请确保网络通畅
- 如果留空,表示不生成字幕。
由于国内无法访问 HuggingFace,可以使用以下方法下载
whisper-large-v3
的模型文件
下载地址:
- 百度网盘:https://pan.baidu.com/s/11h3Q6tsDtjQKTjUu3sc5cA?pwd=xjs9
- 夸克网盘:https://pan.quark.cn/s/3ee3d991d64b
模型下载后解压,整个目录放到 .\MoneyPrinterTurbo\models
里面, 最终的文件路径应该是这样: .\MoneyPrinterTurbo\models\whisper-large-v3
背景音乐 🎵
用于视频的背景音乐,位于项目的 resource/songs
目录下。
当前项目里面放了一些默认的音乐,来自于 YouTube 视频,如有侵权,请删除。
字幕字体 ✏️
用于视频字幕的渲染,位于项目的 resource/fonts
目录下,你也可以放进去自己的字体。