Pixelle-Video——输入一句话,AI 全自动帮你做短视频的开源引擎——墨涩网

Pixelle-Video AI全自动短视频引擎

刷短视频的时候,你有没有想过:那些画面精美、配乐到位、解说流畅的视频,到底要花多久才能做出来?

答案可能让你意外——3 分钟,一句话的事

今天给大家介绍一个开源项目:Pixelle-Video,一个 AI 全自动短视频引擎。你只需要输入一个主题,它就能自动帮你写文案、生成配图、合成语音、添加背景音乐、最后直接输出成品视频。零剪辑经验,零门槛。

一句话定位

Pixelle-Video = 全自动短视频引擎。输入主题,输出成品视频。

跟那些只能生成图片或者只能生成片段的工具不同,Pixelle-Video 把整个视频生产链路打通了:从一句主题到一条完整的短视频,中间全部自动化。

它到底能干啥?

举个例子,你输入「为什么要养成阅读习惯」,Pixelle-Video 会自动完成以下所有步骤:

  • ✍️ AI 写文案 — 自动生成分镜脚本和解说词
  • 🎨 AI 生成配图 — 每个分镜自动配一张匹配的插图
  • 🗣️ AI 语音合成 — 把解说词转成自然流畅的语音
  • 🎵 加背景音乐 — 自动配 BGM
  • 🎬 合成视频 — 所有素材一键合成最终视频

整个过程大概 2-5 分钟,出来就是一条可以直接发平台的短视频。

技术架构:ComfyUI 工作流驱动

Pixelle-Video 最核心的设计思路是:所有 AI 能力都通过 ComfyUI 工作流 JSON 文件来定义

这意味着什么?你想把图像生成从 FLUX 换成 Qwen?不用改一行代码,指向另一个 workflow JSON 文件就行。想升级 TTS 引擎?同样操作。这种架构让 Pixelle-Video 在模型灵活性上吊打同类工具。

整体架构分四层:

  • 应用层 — Streamlit Web UI,用户交互界面
  • 编排层 — 视频生成管线,负责流程编排
  • 能力层 — ComfyUI 工作流 JSON,定义具体模型和参数
  • 执行层 — ComfyUI 运行环境,执行实际生成

支持的组件

LLM 文案生成

支持 GPT、通义千问、DeepSeek、Ollama 等多种大模型,想用哪个用哪个。

图像生成

通过 ComfyUI 工作流支持 FLUX、Qwen 等模型,也可以用 RunningHub 云端服务。

视频生成

支持 WAN 2.1、WAN 2.2、Nano Banana 等模型。

语音合成

支持 Edge-TTS、Index-TTS、ChatTTS,还支持声音克隆。多语言多音色随便选。

视频合成

内置 FFmpeg 管线,图文混合、背景叠加、字幕生成一条龙。

怎么装?

Windows 用户(最简单)

从 GitHub Releases 下载整合包,解压后双击 start.bat 就行。不需要装 Python、FFmpeg 或任何依赖。零门槛。

macOS / Linux 用户

git clone https://github.com/AIDC-AI/Pixelle-Video.git
cd Pixelle-Video
curl -LsSf https://astral.sh/uv/install.sh | sh
uv sync
uv run streamlit run web/app.py

浏览器打开 http://localhost:8501 就能用了。

费用:可以完全免费

Pixelle-Video 的费用方案很灵活:

  • 完全免费:LLM 用 Ollama 本地运行 + ComfyUI 本地部署 = 0 元。需要 NVIDIA 显卡(6GB+ 显存)。
  • 推荐方案:LLM 用通义千问(3 段视频约 0.01-0.05 元)+ ComfyUI 本地部署。性价比极高。
  • 云端方案:LLM 用 OpenAI API + 图像用 RunningHub 云端。费用高但无需本地显卡。

对普通用户来说,推荐方案基本够用了,几分钱就能生成一条视频。

跟同类工具比怎么样?

  • MoneyPrinterTurbo — 同类视频生成工具,但 Pixelle-Video 通过 ComfyUI 工作流架构实现了更强的模型灵活性
  • NarratoAI — 偏重影视解说自动化,Pixelle-Video 更通用
  • Pixelle-MCP — 同一团队开发的 ComfyUI MCP 服务器,是 Pixelle-Video 的底层依赖

适合谁用?

  • 自媒体创作者:批量生产知识科普类短视频,输入主题一键生成
  • 教育培训:快速制作课程解说视频
  • 营销推广:产品介绍、品牌故事等短视频素材自动生成
  • 个人用户:旅游 Vlog、生活记录等趣味短视频

小结

Pixelle-Video 目前在 GitHub 上拿了 13600+ Stars,是同类项目里最活跃的之一。它的核心优势在于 ComfyUI 工作流驱动的架构——不改代码就能灵活替换模型,扩展性很强。

对于需要批量生产短视频的人来说,这个工具的价值是实实在在的:零成本、全自动、3 分钟出片。Windows 整合包一键启动,对小白非常友好。

如果你有 NVIDIA 显卡(6GB+),完全可以本地跑起来,一分钱不花。没有显卡也能用云端方案,几分钱一条视频。

感兴趣的同学可以去 GitHub 看看,开源免费,折腾不亏。

相关链接:

  • GitHub:https://github.com/AIDC-AI/Pixelle-Video
  • 官方文档:https://aidc-ai.github.io/Pixelle-Video/zh/

版权声明:本文采用知识共享 署名4.0国际许可协议BY-NC-SA 进行授权

文章作者:<墨涩>

文章链接:

免责声明:本站为资源分享站,所有资源信息均来自网络,您必须在下载后的24个小时之内从您的电脑中彻底删除上述内容;版权争议与本站无关,所有资源仅供学习参考研究目的,如果您访问和下载此文件,表示您同意只将此文件用于参考、学习而非其他用途,否则一切后果请您自行承担,如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。

本站为非盈利性站点,并不贩卖资源,不存在任何商业目的及用途,网站会员捐赠是您喜欢本站而产生的赞助支持行为,仅为维持服务器的开支与维护,全凭自愿无任何强求。

上一篇 WorkBuddy vs QClaw:腾讯两个AI助手到底该用哪个?——墨涩网