网易首页 > 网易科技 > 网易科技 > 正文

对话智谱AI CEO张鹏:视频生成是AGI必经之路,超级App将在“不知不觉”中到来

0
分享至
所谓超级APP不一定是大家理解的“超级”,它可能是在循序渐进、潜移默化过程当中让大家真的爱上,然后习惯使用的工具。这件事的发生,不一定是阶梯状或者阶跃式的。


出品|网易科技《态度AGI》对话栏目

作者|丁广胜

“让大家体验一下目前视频生成每人可用的前提下能做到什么程度,而不是关在实验里。”

智谱AICEO张鹏说,这是发布清影(Ying)的初衷,今天,AI视频生成再添猛将。

清影是一个视频模型,它能干什么,一句话表述就是:只要你有好的创意(几个字到几百个字),再加上一点点耐心(30秒),清影(Ying)就能生成1440x960清晰度的高精度视频。

本次清影(Ying)底座的视频生成模型是CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了Sora的算法设计,它也是一个DiT架构,通过优化,CogVideoX 相比前代(CogVideo)推理速度提升了6倍。

智谱清影(Ying)AI视频生成(寻人启事) (来源:网易科技报道)

“我们积极在模型层面探索更高效的scaling方式。”张鹏表示:“随着算法、数据不断迭代,相信Scaling Law将继续发挥强有力作用。”

在接受采访时,张鹏谦虚的说到,清影(Ying)上线,主要是阶段性成果,还不完美。他坦言,“我们和世界顶级水平之间有差距。但虽然我们承认差距,但这条路还得自己走,我们在追求技术高度的同时,也同步追求技术的可普及性,这是我们的特点。”

问及清影(Ying)是否朝着超级App努力,张鹏表示,所谓超级APP它不一定是大家理解的“超级”,它可能是在循序渐进、潜移默化过程当中让大家真的爱上,然后习惯使用这个工具。这件事的发生,不一定是阶梯状或者阶跃式的。

关于AGI路径,他认为,视频生成并不孤立来看,它是多模态或者AGI多模态路径当中的一环,是AGI必须要走的路!

以下为网易科技等媒体对话精选实录(作不改变原意的调整):

问:清影(Ying)是不是有商业化考量了,后续商业化的策略是什么,比较偏向于2C还是2B?

张鹏:清影(Ying)功能上线,主要是阶段性成果,要说它多么完美还不是,还需要阶段性解决,给大家汇报一下我们的进展,让大家体验一下目前视频生成这样的事情在每人可用的前提下能做到什么程度,而不是关在实验室里或者在很小的概率上生成出什么东西。

从现在这个阶段来说,无论是2C还是2B,纯粹走向大规模商业化还比较早期。为了公平起见,除了C端和B端,还有创作者们也都能享受这个能力,所以在开放平台开放了API,它有一定的收费,这是为了统一计费方式,但是这样的形式比较亲民。大家知道生成视频成本代价也是非常高的,稍稍收回来一点点也是比较好的事。

问:除了智谱之外,很多企业发布了新的AI生成视频产品,大家都往可控性做优化,您觉得清影的优势在哪里?

张鹏:第一是技术层面,视频本身的可控。我们认为内容生成,尤其是视频内容生成将来绝大部分情况下还是由人用语言的方式控制。所以如何从文字到语言或者一个简图到语言,这样的方式更可控,这才是真正的可控,更高层面的可控,这是技术层面的事情。

第二个层面就是安全,生成的内容,因为视频信号里包括的内容和细节更多,要保证生成出来的东西符合你的要求,而且还保证安全,可控肯定是非常重要的一个点,所以我相信所有做视频生成团队都很重视这块内容。

最后,生成出来这件事情如果能做到商业化应用,可控也是必要的条件,你要非常精准表达创作者意图,而且要让大家买单,可控也是非常重要的一件事。

问:Sora还没有开放给公众使用,智谱AI开放了,这背后是如何思考的?如何前期准备的?

张鹏:首先Sora效果还是不错的,刚才我也提到了,今天还是一个初步的阶段性成果,还达不到像Sora演示出来那么好的,那么长的视频,这个还需要更多的努力。

我们从来都坦诚承认我们和OpenAI、和世界顶级水平之间的差距。但是,虽然我们承认之间的差距,但是走的这条路还得自己走,我们在不断用自己的方式往前追赶,让所有人可以用,所以我们是在追求技术高度的同时,也同步追求技术的可普及性和成本,这也是我们团队的特点。

问:智谱清言或者这个新产品怎么提高活跃度,如何才能做成超级APP、杀手级APP?

张鹏:这是个思路问题。我们认为清言APP定位是人工智能助手。助手意思是帮你解决工作学习生活当中的实际的问题,是要帮你做生产力提效,学习效率提升,工作便利的提升等等这些方面的事情。

可能你会觉得它好像不是那么好玩,不是那么像娱乐工具一样吸引你,但我们也认为所谓超级APP可能它不一定是这样的“超级”,是循序渐进、在潜移默化过程当中让大家真的爱上使用、习惯上使用这个工具。

所以可能这个改变并不一定是阶梯状或者阶跃式改变,可能是潜移默化的改变。

我们认为,与其不断预测这件事,还不如踏踏实实一点一点做这件事。

问:现在模型都是DiT架构,咱们在这方面有没有一些创新?

张鹏:第一个算力上DiT+Tansformer这类方面,大家知道Sora也是这种方案,我们也是采用这种方案,但是因为技术细节上的公开和不透明,很多地方需要自己摸索。然后算力这件事,我不是太同意生成视频这件事情会小于文字生成这件事情,可能未来很多都会变成多模态信号融合,但以视觉信号为主,人的大脑目前还是冲击力最强的。

比如,PPT为什么比传统方式要更被人接受,是因为有更主观的视觉信号,把文字转换成结构化的信息,那未来就会是视频的形式,所有内容都转成视觉形式,没有所谓的PPT,这有待大家一起探讨。

问:智谱做视频生成,是不是只是在整个模型矩阵中的一部分,还是说未来希望让它能够独立形成商业闭环?

张鹏:视频生成并不孤立来看,是放到整个技术和产品发展路线当中来看,我们认为它是多模态或者AGI多模态路径当中的一环。

我们认为它是AGI里必须要走的路径,从产品角度来讲会不会单独成为一个单独的产品去商业化落地,我觉得这是肯定的,只要市场有需求,作为一个公司就应该做商业化的事情,这是两件事。

问:文生视频技术对影视行业有哪些改变?智谱和bilibili和华策都有合作,会不会出现AI取代长视频拍摄的情况?

张鹏:从技术发展角度来说大家认为这是很好的事情,是很重要的方向,对影视行业的变化是有积极的意义。但是目前来讲,用来做一些辅助的工作是可以的,甚至做一些小规模的创作,但真正要达到改变电影的制作等,这些更高要求的事情可能还得有一段路去走。

问:智谱AI今年的重点是落地产业,那现在布局包括B端C端和多模态,资金包括您的精力如何分配?

张鹏:确实做大模型这件事太烧钱了,而且确实也面临市场上的需求,你要商业化落地,所以我们是分层次去做。最基础的技术突破创新是我们消耗资源,消耗算力方面是最大的部分,商业化层面是在这个基础之上推进的,但商业化这个事情在我们看来还是根源于你的技术创新和驱动做这件事,我们不太希望说研究是一张皮,商业化,我们的产品,服务客户是另外一张皮,这样的割裂对企业来讲会面临一个问题,就是怎么样分配资源,我们希望是贯通的,商业化过程当中,服务客户过程当中就是以我们的技术和产品核心能力驱动的,客户需求和反馈是我们技术往前创新突破和迈进的驱动力,让两者比较好的闭环,我们努力做到这样的事情。

记者:清影(Ying)当下有没有绑定的种子用户画像和重点关注的场景?

张鹏:像线上电商营销、媒体的需求等,包括社交上的短视频等需求,主要是这些比较旺盛,但是我相信肯定不仅止于这些客户。

问:未来从文本模型到视频生成模型、多模态模型以后,传统程序员在开源多模态模型开发中会扮演什么角色?

张鹏:文本模型相对于视频多模态模型先跑了一段时间,现在这个模式是未来视频或者多模态也会往这个方向走,模式也类似,开发者社区里很多人在做技术建设,风格化等一些事情,这些事情都是开源社区充满热情的一些人做的事情,慢慢会积累成一定的套路,通过的方法论都会迁移到多模态的模型上。

记者:Sora作为视频生成模型出来,还提出来一个“世界模型”,智谱AI有没有对世界模型和物理世界的研究?

张鹏:很多的讨论还没有定论。我们的观点和OpenAI比较相近,对于人的大脑来说,或者人对世界的认知,除了语言以外,视觉、听觉、嗅觉各种各样的感官是综合在一起的,人为什么看似学习的速度、效率没有计算机那么快,但是人的智能比计算机高,就是在于人的大脑的学习过程会远比现在的更复杂,不同模态之间信号的互相验证和交叉。所谓世界模型的路径上,跨模态是非常重要的事情,一步一步来吧。

记者:你们 是从什么时候开始做清影(Ying)的,团队规模、产品研发投入是什么样?

张鹏:从2021年开始就布局这件事,这个过程当中也不断积累其他相关的东西。我们认为本身做大模型这件事最终目标想要实现AGI,本质上还是在于如何对现实世界里的信号、数据进行提炼、压缩、学习的过程,这个事情可能语言是密度最高的,相对来说比较容易,而且是人机交互当中非常重要的环节。然后,语言模型转去做多模态模型,我认为,单模态的建模,语言模态的建模,跨模态的建模,最终会走向本质的物理世界统一的表示,大家追求的是同一个真理,只是走不同的路而已,可能是这样一个结局。

关于《态度AGI》

网易科技重磅推出系列对话栏目《态度AGI》。过去三年,AI变革风起云涌,全球科技秩序正在重构,通往AGI的道路或许正在悄然临近。本栏目以AGI为题,将对话100位AI专家、企业家、投资人,试图拨开云雾,与大家一道见证AGI时代的到来。第八期对话智谱AICEO张鹏。

往期回顾:

《态度AGI》第一期:对话李开复:大模型创业狂奔一年 中美差距缩小 我十年不套现

《态度AGI》第二期:对话王小川:我们不跟进大模型价格战

《态度AGI》第三期:对话戴文渊:大模型价格战不解决核心问题

《态度AGI》第四期:智源研究院院长王仲远:GPT4不是国内大模型的尽头

《态度AGI》第五期:对话朱啸虎:5年后将没有独立的大模型公司存在,因为没有商业模式

《态度AGI》第六期:对话梅花创投吴世春:“中国大模型五虎”想要跑出来非常难

《态度AGI》第七期:对话跃然创新CEO李勇:做大模型应用 如何和巨头错位竞争

延伸阅读
相关推荐
热点推荐
官宣!10人留洋西班牙,第一批已出发,并入西班牙联赛,与皇马PK

官宣!10人留洋西班牙,第一批已出发,并入西班牙联赛,与皇马PK

小金体坛大视野
2024-09-16 11:05:02
华为祭出三折手机,美硅谷工程师破大防:这是他们从我们这夺走的

华为祭出三折手机,美硅谷工程师破大防:这是他们从我们这夺走的

小柱解说游戏
2024-09-16 16:53:40
收复故土时机降临?英专家鼓动我国趁机拿下远东,背后有何目的?

收复故土时机降临?英专家鼓动我国趁机拿下远东,背后有何目的?

阵匠
2024-09-17 00:27:07
75岁老人在招商银行买了一份千万终身寿险 每年保费200万 连续缴5年

75岁老人在招商银行买了一份千万终身寿险 每年保费200万 连续缴5年

金融界
2024-09-11 09:39:55
洛阳一外卖员因顾客态度不好向其饭菜撒尿?警方:假的,编造者已拘留

洛阳一外卖员因顾客态度不好向其饭菜撒尿?警方:假的,编造者已拘留

网易号社区管理员
2024-09-16 18:29:10
院长办公室里大沙发干嘛用的?我生理期躺上去一次 再也不敢来了

院长办公室里大沙发干嘛用的?我生理期躺上去一次 再也不敢来了

情感得事
2023-08-24 12:52:33
心态好的人,都有这3种好习惯,有一种就很了不起

心态好的人,都有这3种好习惯,有一种就很了不起

知和大叔
2024-09-13 23:47:27
北京市高校排名大调整:中国农大第7,北工商第37,北物资第52

北京市高校排名大调整:中国农大第7,北工商第37,北物资第52

王晓爱体彩
2024-09-16 20:58:45
大反转!在新加坡海淘了6000块的物品退不回去,找到原因后淘宝1小时秒退到账

大反转!在新加坡海淘了6000块的物品退不回去,找到原因后淘宝1小时秒退到账

新加坡眼
2024-09-14 19:06:19
蒲奕安终于搬石头砸自己的脚,学历被网友扒了个精光

蒲奕安终于搬石头砸自己的脚,学历被网友扒了个精光

魔都姐姐杂谈
2024-09-14 08:54:18
福建莆田一对家长出轨,最新后续来了!两人的电话号码已被打爆

福建莆田一对家长出轨,最新后续来了!两人的电话号码已被打爆

魔都姐姐杂谈
2024-09-15 10:23:43
真相大白!ABC被指操控总统辩论场,特朗普遭遇不公平对待

真相大白!ABC被指操控总统辩论场,特朗普遭遇不公平对待

国际情爆猿
2024-09-16 03:27:46
地球爆发不明物体震动!引发200米高海啸,整个地球狂震9天!

地球爆发不明物体震动!引发200米高海啸,整个地球狂震9天!

徐德文科学频道
2024-09-14 22:45:12
你见过最主动的女生是什么样的?网友们也太会了!

你见过最主动的女生是什么样的?网友们也太会了!

滑稽斑马呀
2024-06-18 18:38:21
向世界警告,谁动我兄弟就灭谁!如今枪口却对准中国

向世界警告,谁动我兄弟就灭谁!如今枪口却对准中国

华人星光
2024-09-10 17:36:07
女白领被要求每天给领导带饭但不给钱!涉事女领导正脸曝光!

女白领被要求每天给领导带饭但不给钱!涉事女领导正脸曝光!

远荐
2024-09-14 12:27:57
广东男子和情人私会,不慎被岳母发现:答应我一件事就帮你保密

广东男子和情人私会,不慎被岳母发现:答应我一件事就帮你保密

凯裕说故事
2024-09-11 09:14:30
朝鲜真的贫穷落后吗?为何国家虽不富裕,老百姓的幸福感却很高?

朝鲜真的贫穷落后吗?为何国家虽不富裕,老百姓的幸福感却很高?

烛下青史
2024-09-15 21:36:53
马塔谈J联赛效力经历:出场机会少感到失落,日本球员值得学习

马塔谈J联赛效力经历:出场机会少感到失落,日本球员值得学习

直播吧
2024-09-16 12:05:06
油价一夜“变天”!9月15日调整后92/95号汽油价格,新麦价格咋样

油价一夜“变天”!9月15日调整后92/95号汽油价格,新麦价格咋样

猪友巴巴
2024-09-14 14:11:02
2024-09-17 01:48:49

科技要闻

能和马斯克干架的人,还在继续折腾

头条要闻

辛选指定鉴定机构:三只羊所售茅台72瓶不符合正品特征

头条要闻

辛选指定鉴定机构:三只羊所售茅台72瓶不符合正品特征

体育要闻

残阵拿下热刺 阿森纳多亏有这个秘密武器

娱乐要闻

林志颖曝儿子15岁身高超175,妈妈立功

财经要闻

宗馥莉正面对决钟睒睒

汽车要闻

舒适省油空间全能 瑞虎9 C-DM静态体验

态度原创

数码
教育
健康
公开课
军事航空

数码要闻

美国食品药品管理局批准苹果Apple Watch睡眠呼吸暂停检测功能

教育要闻

高考失利,复读 or 将就

炉甘石洗剂,凭啥成了止痒全能王?

公开课

改变人生的10件小事

军事要闻

台岛以东 “万吨大驱”作为航母编队哨舰实战演练

无障碍浏览 进入关怀版
×