网易首页 > 网易号 > 正文 申请入驻

哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw

0
分享至



2026 年,国产视频生成模型频频出圈,在视频生成模型快速迭代的今天,生成一个 5 秒至 15 秒视频让人惊艳的画面片段已经不再新鲜。然而,能不能从一句简单想法出发,自动生成剧情流畅完整、主体和场景一致的长视频?

受视频大模型生成时长限制,现有 AI 长视频生成需分段独立创作,因缺失跨片段的约束机制,导致生成视频存在人物、场景及叙事跨片段不一致的问题;同时依赖人工微调提示词,存在生成效率低、成本消耗大的核心瓶颈。因此,如何构建长程、统一的跨片段时空约束机制,实现连贯一致的长视频生成,是亟待解决的关键科学、技术和工程难题。

早在 2023 年大模型快速发展期,哈工大张民教授立知大模型团队已开展多模态大模型驱动的视频内容创作智能体研究,并全球首发开源了电影制作智能体 FilmAgent 与动画片生成智能体 Anim-Director,受到国内外智能体研究者与文艺创作者的广泛关注。

  • FilmAgent 项目链接:https://github.com/HITsz-TMG/VideoClaw/tree/main/FilmAgent
  • Anim-Director 项目链接:https://github.com/HITsz-TMG/Anim-Director)

三年来,哈工大张民团队与阿里巴巴深入合作,在大模型视频创作领域稳步迭代,已发表 3 篇 SIGGRAPH、3 篇 ACL 等学术成果,多款开源工具陆续落地。

第一代技术方案是基于大模型与工具深度交互范式,并开源了 ComfyUI-Copilot、FilmAgent、Anim-Director 等视频生成框架,覆盖 3D 虚拟环境、工作流辅助、动画片创作等场景,主打视频创作流程自动化与效率提升。



视频内容创作智能体技术演进脉络

近几日,哈工大团队联合阿里巴巴正式推出第二代多智能体高效协作视频生成框架,全面突破能力和效率边界,Pixelle-Video 实现基于 ComfyUI 平台的全自动短视频生成;全新长视频创作框架 VideoClaw 支持短剧制作与剧情无限续写,解锁无限长视频创作能力。面向长视频生成的 AI 视频创作系统VideoClaw致力于将复杂的视频生成任务拆解为可观察、可干预、可迭代的视频生产线



  • VideoClaw (1.3K⭐): https://github.com/HITsz-TMG/VideoClaw
  • ComfyUI-Copilot (5.2K⭐): https://github.com/AIDC-AI/ComfyUI-Copilot
  • Pixelle-Video (20.8K⭐): https://github.com/AIDC-AI/Pixelle-Video

多智能体协作:从创意到可执行的影视流水线

VideoClaw 将长视频生成拆解为一套多智能体协作流程:用户只需要输入一句灵感或故事梗概,系统便会调度由大模型驱动的 “数字化剧组”,依次完成剧本扩写、角色与场景设定、分镜规划、关键帧构图、视频分段生成、音频合成与后期拼接等任务。



VideoClaw 框架图

相比传统黑盒式视频生成,VideoClaw 将复杂任务拆成多个可见、可控、可回溯的生产环节,每完成剧本、角色场景、分镜等阶段,系统默认暂停并展示阶段性产物,让创作者能在关键节点介入修改。除了提供功能完备的WebUI供创作者进行精细化调整外,VideoClaw 支持集成至微信、飞书等日常通讯软件来调用。

场记库与长程上下文:

支撑连贯叙事和视觉一致

长视频生成困难的地方并不只是时长,而是如何让剧情、人物、道具和场景在多个镜头之间保持一致。因此,VideoClaw 引入了多阶段上下文管理机制,构建类似「场记」的状态库,将角色关系、空间位置、场景分镜和版本信息等沉淀为可复用的结构化资产,为后续生成提供参考约束。



场记状态库示意图

借助这种显式状态管理,VideoClaw 能够支持故事的无限续写,让视频一段接一段地延展,剧情冲突自然升级,人物互动基于已有情节继续推进。

VLM 闭环质检:迭代质量优化机制

VideoClaw 将视觉语言模型(VLM)嵌入视频生成的关键流程中,在图片、关键帧和视频片段等中间产物生成后启动审查:一方面比对画面内容是否符合剧本设定和分镜要求,另一方面检查人物、场景和叙事逻辑是否出现偏移。



迭代质量优化机制示例

在具体执行中,系统可为同一创作任务并行生成多个候选版本,并由 VLM 进行多维度综合评估,筛选出最符合要求的结果。若所有候选版本都未达到预设质量阈值,VLM 会进一步输出具体的诊断报告,例如人物或场景不一致,并据此触发回溯与重新生成

VideoClaw 生成视频案例

VideoClaw 支持多种安装方式,满足不同开发者和用户的需求,覆盖 Linux/Mac/Windows 快速安装、前端页面支持、OpenClaw 自动配置、以及 ClawHub 安装。

案例 1:影视二创

为《给阿嬷的情书》电影二创完美结局:在另一个时空,木生归乡,与淑柔相守一生,终得圆满。

视频以蒙太奇串联半生岁月:木生带信归家与淑柔、孩子相拥,一家三口乘车合影;骑车画面随蒙太奇岁月流转,二人暮年收到南枝寄来的家书与腊肉。镜头切换,南枝异地写信渐老,最后归来相聚院中晒木棉。



案例 2:写实短剧

输入剧情描述:程序员男主之前天天被老板 PUA,最后惨遭裁员。后来用 OpenClaw 创建一人公司,翻身收购原老板公司。

根据上述描述生成了 6 集的短剧,此处展示第一集,后续集数逐渐满足描述中的剧情。此后,VideoClaw 额外续写两集内容,生成的剧情聚焦 OpenClaw 衍生的网络安全隐患与行业规范管控问题。

案例 3:科幻漫剧

输入文件为刘慈欣《乡村教师》小说。根据该小说生成了 5 集漫剧,此处展示第一集。

总结与展望

VideoClaw 是一套流程可控、支持迭代的多智能体长视频创作框架。从团队初代工作流提效工具 ComfyUI-Copilot,到第二代日常短视频制作工具 Pixelle-Video 和长视频一键创作工具 VideoClaw,该系列方案不仅验证了智能体驱动影视创作的落地路径,也实现了从流程辅助提效到全链路智能化生成的升级。该系列开源项目的发布,为行业带来了一套开箱即用的视频生产智能体框架,期望助力 AI 视频生成与多模态创作领域的研究与应用发展。

参考文献

[SIGGRAPH Asia 2024] Zhenran Xu, Longyue Wang, Jifang Wang, Zhouyi Li, Senbao Shi, Xue Yang, Yiyu Wang, Baotian Hu, Jun Yu, Min Zhang. FilmAgent: Automating Virtual Film Production Through a Multi-Agent Collaborative Framework.

[SIGGRAPH Asia 2024] Yunxin Li, Haoyuan Shi, Baotian Hu, Longyue Wang, Jiashun Zhu, Jinyi Xu, Zhen Zhao, Min Zhang. Anim-Director: A Large Multimodal Model Powered Agent for Controllable Animation Video Generation.

[ACL 2025] Zhenran Xu, Xue Yang, Yiyu Wang, Qingli Hu, Zijiao Wu, Longyue Wang, Weihua Luo, Kaifu Zhang, Baotian Hu, Min Zhang. ComfyUI-Copilot: An Intelligent Assistant for Automated Workflow Development.

[SIGGRAPH Asia 2025] Haoyuan Shi, Yunxin Li, Xinyu Chen, Longyue Wang, Baotian Hu, Min Zhang. AniMaker: Multi-Agent Animated Storytelling with MCTS-Driven Clip Generation.

[ACL 2026] Zhenran Xu, Yiyu Wang, Yunxin Li, Muyang Ye, Xue Yang, Kai Chen, Longyue Wang, Weihua Luo, Baotian Hu, Min Zhang. ComfyFlow: Benchmarking LLMs for AIGC Workflow Generation.

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
看困了?德约卡夫在西班牙与沙特的比赛中睡着被抓拍

看困了?德约卡夫在西班牙与沙特的比赛中睡着被抓拍

懂球帝
2026-06-22 04:29:04
三大指数集体翻绿,沪指下跌0.32%

三大指数集体翻绿,沪指下跌0.32%

每日经济新闻
2026-06-22 09:44:07
墙倒众人扶,没想到,曾被人民日报点名表扬的李维刚,如今更牛了

墙倒众人扶,没想到,曾被人民日报点名表扬的李维刚,如今更牛了

趣文说娱
2026-06-17 21:27:16
伊布:哈兰德球商很高,不像有些球员爱强行做超出能力的事情

伊布:哈兰德球商很高,不像有些球员爱强行做超出能力的事情

懂球帝
2026-06-22 11:37:51
杭师大男生《为什么女拳打不起来》演讲火了,女生威胁:别想上岸

杭师大男生《为什么女拳打不起来》演讲火了,女生威胁:别想上岸

林林先生
2026-06-20 08:00:07
美国的小费,还得靠外国人来治!700美元账单分文未留,纽约服务员当场傻眼

美国的小费,还得靠外国人来治!700美元账单分文未留,纽约服务员当场傻眼

桃叶渡春
2026-06-22 05:58:30
出狱人员纷纷吐槽:如今坐牢,和几十年前大不一样!说出来不敢信

出狱人员纷纷吐槽:如今坐牢,和几十年前大不一样!说出来不敢信

一曲一场談
2026-06-21 00:24:30
两大核武国家,“水仗”升级

两大核武国家,“水仗”升级

中国新闻周刊
2026-06-21 19:23:56
湖北一富豪当街殴打迈巴赫车主,知情人称:那是他女儿,打死活该

湖北一富豪当街殴打迈巴赫车主,知情人称:那是他女儿,打死活该

黑猫故事所
2025-04-14 18:45:09
日本4-0大胜,赛后,看看中国球迷都怎么说

日本4-0大胜,赛后,看看中国球迷都怎么说

小楼侃体育
2026-06-21 15:02:41
张国立也没料到,那个被他儿子暴打的童瑶,早已让他们高攀不上

张国立也没料到,那个被他儿子暴打的童瑶,早已让他们高攀不上

悠悠说世界
2026-06-22 03:23:41
电动车或将要被取代?多地开始大批投放!新型代步车已经正式登场

电动车或将要被取代?多地开始大批投放!新型代步车已经正式登场

离离言几许
2026-06-20 01:16:13
最年轻被制裁者诞生,卢比奥揭露惊人现实

最年轻被制裁者诞生,卢比奥揭露惊人现实

西楼饮月
2026-06-21 19:45:27
一个被全世界嘲笑了20年的算法,最后成了ChatGPT的大脑

一个被全世界嘲笑了20年的算法,最后成了ChatGPT的大脑

新浪财经
2026-06-19 17:31:16
一场91-81!验出中国男篮最大水货,郭士强或弃用!

一场91-81!验出中国男篮最大水货,郭士强或弃用!

工从昊懂球阿靖
2026-06-21 22:29:23
西藏网友发现“冬虫夏草”在爬行?表示要吃掉!网友:是旱厕精灵

西藏网友发现“冬虫夏草”在爬行?表示要吃掉!网友:是旱厕精灵

狸猫之一的动物圈
2026-06-21 09:19:02
工行、农行、中行、建行、交行,集体宣布→

工行、农行、中行、建行、交行,集体宣布→

城市速递
2026-06-21 20:46:12
亏损超1.5亿,胡歌尽力了,2026年端午档第一票房惨案诞生了‍

亏损超1.5亿,胡歌尽力了,2026年端午档第一票房惨案诞生了‍

靠谱电影君
2026-06-19 21:52:51
江西省政协原副主席尹建业严重违纪违法被“双开”

江西省政协原副主席尹建业严重违纪违法被“双开”

界面新闻
2026-06-22 11:03:42
承认能力不足不丢人,丢人的是非要说自己“赢”了

承认能力不足不丢人,丢人的是非要说自己“赢”了

作家加野
2026-06-18 11:04:05
2026-06-22 13:03:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13323文章数 142677关注度
往期回顾 全部

科技要闻

智谱盘中狂飙超40%,市值破万亿港元

头条要闻

37岁男子爱上女主播月赚5千打赏14万 父亲:智商有问题

头条要闻

37岁男子爱上女主播月赚5千打赏14万 父亲:智商有问题

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

韩红帮冯小刚宣传,结果翻车了…

财经要闻

“床垫界的特斯拉”破产了

汽车要闻

全面提升 全新理想L8 livis将家用舒适再进化

态度原创

艺术
时尚
教育
旅游
军事航空

艺术要闻

冷军 人物油画写生8幅

不得不说,“T恤+九分裤”真的很适合夏天,清爽减龄又高级!

教育要闻

代词指代:英语作文连贯性的“隐形杀手”,你真的掌握了吗?

旅游要闻

2026端午国内旅游收入增8.1% 体验消费主导市场 民宿长住成暑期最大风口

军事要闻

东风-17发射状态首次公开 多车齐射场面硬核

无障碍浏览 进入关怀版