Pixelle-Video——输入一句话，AI 全自动帮你做短视频的开源引擎——墨涩网

2026年5月14日 AI大模型墨涩

Pixelle-Video AI全自动短视频引擎

刷短视频的时候，你有没有想过：那些画面精美、配乐到位、解说流畅的视频，到底要花多久才能做出来？

答案可能让你意外——3 分钟，一句话的事。

今天给大家介绍一个开源项目：Pixelle-Video，一个 AI 全自动短视频引擎。你只需要输入一个主题，它就能自动帮你写文案、生成配图、合成语音、添加背景音乐、最后直接输出成品视频。零剪辑经验，零门槛。

一句话定位

Pixelle-Video = 全自动短视频引擎。输入主题，输出成品视频。

跟那些只能生成图片或者只能生成片段的工具不同，Pixelle-Video 把整个视频生产链路打通了：从一句主题到一条完整的短视频，中间全部自动化。

它到底能干啥？

举个例子，你输入「为什么要养成阅读习惯」，Pixelle-Video 会自动完成以下所有步骤：

✍️ AI 写文案 — 自动生成分镜脚本和解说词
🎨 AI 生成配图 — 每个分镜自动配一张匹配的插图
🗣️ AI 语音合成 — 把解说词转成自然流畅的语音
🎵 加背景音乐 — 自动配 BGM
🎬 合成视频 — 所有素材一键合成最终视频

整个过程大概 2-5 分钟，出来就是一条可以直接发平台的短视频。

技术架构：ComfyUI 工作流驱动

Pixelle-Video 最核心的设计思路是：所有 AI 能力都通过 ComfyUI 工作流 JSON 文件来定义。

这意味着什么？你想把图像生成从 FLUX 换成 Qwen？不用改一行代码，指向另一个 workflow JSON 文件就行。想升级 TTS 引擎？同样操作。这种架构让 Pixelle-Video 在模型灵活性上吊打同类工具。

整体架构分四层：

应用层 — Streamlit Web UI，用户交互界面
编排层 — 视频生成管线，负责流程编排
能力层 — ComfyUI 工作流 JSON，定义具体模型和参数
执行层 — ComfyUI 运行环境，执行实际生成

支持的组件

LLM 文案生成

支持 GPT、通义千问、DeepSeek、Ollama 等多种大模型，想用哪个用哪个。

图像生成

通过 ComfyUI 工作流支持 FLUX、Qwen 等模型，也可以用 RunningHub 云端服务。

视频生成

支持 WAN 2.1、WAN 2.2、Nano Banana 等模型。

语音合成

支持 Edge-TTS、Index-TTS、ChatTTS，还支持声音克隆。多语言多音色随便选。

视频合成

内置 FFmpeg 管线，图文混合、背景叠加、字幕生成一条龙。

怎么装？

Windows 用户（最简单）

从 GitHub Releases 下载整合包，解压后双击 start.bat 就行。不需要装 Python、FFmpeg 或任何依赖。零门槛。

macOS / Linux 用户

git clone https://github.com/AIDC-AI/Pixelle-Video.git
cd Pixelle-Video
curl -LsSf https://astral.sh/uv/install.sh | sh
uv sync
uv run streamlit run web/app.py

浏览器打开 http://localhost:8501 就能用了。

费用：可以完全免费

Pixelle-Video 的费用方案很灵活：

完全免费：LLM 用 Ollama 本地运行 + ComfyUI 本地部署 = 0 元。需要 NVIDIA 显卡（6GB+ 显存）。
推荐方案：LLM 用通义千问（3 段视频约 0.01-0.05 元）+ ComfyUI 本地部署。性价比极高。
云端方案：LLM 用 OpenAI API + 图像用 RunningHub 云端。费用高但无需本地显卡。

对普通用户来说，推荐方案基本够用了，几分钱就能生成一条视频。

跟同类工具比怎么样？

MoneyPrinterTurbo — 同类视频生成工具，但 Pixelle-Video 通过 ComfyUI 工作流架构实现了更强的模型灵活性
NarratoAI — 偏重影视解说自动化，Pixelle-Video 更通用
Pixelle-MCP — 同一团队开发的 ComfyUI MCP 服务器，是 Pixelle-Video 的底层依赖

适合谁用？

自媒体创作者：批量生产知识科普类短视频，输入主题一键生成
教育培训：快速制作课程解说视频
营销推广：产品介绍、品牌故事等短视频素材自动生成
个人用户：旅游 Vlog、生活记录等趣味短视频

小结

Pixelle-Video 目前在 GitHub 上拿了 13600+ Stars，是同类项目里最活跃的之一。它的核心优势在于 ComfyUI 工作流驱动的架构——不改代码就能灵活替换模型，扩展性很强。

对于需要批量生产短视频的人来说，这个工具的价值是实实在在的：零成本、全自动、3 分钟出片。Windows 整合包一键启动，对小白非常友好。

如果你有 NVIDIA 显卡（6GB+），完全可以本地跑起来，一分钱不花。没有显卡也能用云端方案，几分钱一条视频。

感兴趣的同学可以去 GitHub 看看，开源免费，折腾不亏。

相关链接：

GitHub：https://github.com/AIDC-AI/Pixelle-Video
官方文档：https://aidc-ai.github.io/Pixelle-Video/zh/

文章作者：<墨涩>

文章链接：

免责声明：本站为资源分享站，所有资源信息均来自网络，您必须在下载后的24个小时之内从您的电脑中彻底删除上述内容；版权争议与本站无关，所有资源仅供学习参考研究目的，如果您访问和下载此文件，表示您同意只将此文件用于参考、学习而非其他用途，否则一切后果请您自行承担，如果您喜欢该程序，请支持正版软件，购买注册，得到更好的正版服务。

本站为非盈利性站点，并不贩卖资源，不存在任何商业目的及用途，网站会员捐赠是您喜欢本站而产生的赞助支持行为，仅为维持服务器的开支与维护，全凭自愿无任何强求。

版权声明：本文采用知识共享署名4.0国际许可协议BY-NC-SA 进行授权
文章作者：<墨涩>
文章链接：
免责声明：本站为资源分享站，所有资源信息均来自网络，您必须在下载后的24个小时之内从您的电脑中彻底删除上述内容；版权争议与本站无关，所有资源仅供学习参考研究目的，如果您访问和下载此文件，表示您同意只将此文件用于参考、学习而非其他用途，否则一切后果请您自行承担，如果您喜欢该程序，请支持正版软件，购买注册，得到更好的正版服务。
本站为非盈利性站点，并不贩卖软件，不存在任何商业目的及用途，网站会员捐赠是您喜欢本站而产生的赞助支持行为，仅为维持服务器的开支与维护，全凭自愿无任何强求。