网易首页 > 网易号 > 正文 申请入驻

视频生成迎来GPT时刻?

0
分享至

生成式AI的出现注定将颠覆越来越多的行业!这次是视频制作,一家仅成立半年左右、提供视频生成服务的初创公司,让人人都可以当自己故事的导演。这家公司就是由两个华裔女性创立的Pika Labs。

退学创业

在介绍Pika Labs之前,首先了解一下它的两位美女创始人。这两位创始人分别是Demi Guo和Chenlin Meng,她们都是斯坦福大学人工智能实验室的前博士生,为了创办Pika Labs,两人都选择从斯坦福大学退学(好像已经习以为常)。

图:左为Demi Guo,右为Chenlin Meng

(图片来自网络)

Demi Guo目前担任Pika Labs 创始人兼CEO,她高中时期进入IMO (International Math Olympiad)国家集训队,并于2015年IOI(International Olympiad in Informatics)中获得银牌。

在哈佛大学获得数学学士学位时,Demi同时攻读了计算机科学硕士学位,并转至斯坦福大学攻读博士学位,师从Ron Fedkiw和Chris Manning两位教授,进行图形学和NLP交叉领域的研究。除此之外,Demi在大二间隔学期时期就成为了Meta AI Research最年轻的全职员工,也在Microsoft、Google Brain、Epic Games等公司实习,拥有很强的工程和科研能力。

Chenlin Meng则是Pika Labs的联合创始人兼CTO,在斯坦福大学攻读数学学士学位期间即在Stefano Ermon教授指导下开始学习研究生课程,并在本科期间就发表了5篇Generative AI方向的论文,完成本科学业后,Chenlin继续在斯坦福大学攻读计算机博士学位,在3年时间中发表了30多篇论文,其中,她参与创作的DDIM论文是内容生成的重要论文之一,DDIM是一种重要的内容路线,OpenAI的DALLE-2、Google Imagen以及Stable Diffusion等模型都使用了这一方法。

Pika诞生

为何两个拥有如此出色履历的两位女性会选择退学创业,而且瞄准的是视频创作领域呢?

Demi Guo在接受媒体采访时表示,她对创意行业和用AI赋能内容创作一直很感兴趣,很有热情,也一直想往这个方向创业,攻读博士学位时也是选了AI和creation方向。她在博士期间的两位导师,分别是做AI的Christopher Manning,现在是斯坦福大学人工智能实验室的主任。另一位是Ron Fedkiw,是专攻创意和电影行业的,得过两次奥斯卡奖,也参与过《加勒比海盗》、《星球大战》等电影的特效制作。

去年冬天,Demi Guo和几名斯坦福大学计算机科学博士班的同学,想要尝试使用生成式AI技术制作一部电影,去参加首届‘AI电影节’。同时,他们还邀请了一位得过两次艾美奖的编辑来共同制作电影。值得一提的是,这次电影节的赞助商就是AI生产视频初创公司Runway。

Demi Guo起初以为,凭借他们过硬的技术团队以及有创意的编剧,制作电影应该不难。但当他们实际制作时,她和她的博士同学们在使用了Runway、Photoshop等专业工具,并耗费了大量精力后,制作的AI电影最后还是没有入围,最终获奖的是专业创意人士。

这让Demi Guo意识到,尽管目前的AI技术已经获得很大突破,但将其用于视频制作对于外行人来说仍然非常繁琐。她想为什么不能有一款为非创意专业人士量身定做的视频生成工具,外行人也可以轻松进行创作呢?

基于此,在2023年4月,Demi Guo和Chenlin Meng从斯坦福大学退学,创立了Pika Labs,致力于开发普通人也能很方便使用的AI视频生成器。

发展迅速

虽然只创立了半年左右的时间,今年7月,Pika Labs才在Discord推出服务器,Pika1.0也刚刚在11月发布,但目前Pika的用户数已经达50万名,每周在Pika上生成的视频数达上百万,公司也连续完成了三轮融资,总融资额达到了5500万美元。其中,前两轮由前GitHub首席执行官Nat Friedman领投,最近一轮则来自Lightspeed Venture Partners的3500万美元A轮融资。目前,Pika Labs的估值已经达到了2-3亿美元。

在短短的半年左右的时间内,获得如此发展已属不易,但Demi Guo觉得,虽然公司发展比较顺利,但他们团队对此并不意外,他们还觉得现在的发展和预期中比起来,做得还不够好(多少有点凡尔赛了)。

而他们能取得目前的成绩离不开他们团队的每个人以及他们的领先技术。Pika Labs目前的团队人数还较少,仅有4名全职人员。Demi Guo和Chenlin Meng之前介绍过,另一位Kalin Chen是团队第三位创始人及创始工程师,他拥有CMU的ML&CV硕士学位;还有一个是Matan Cohen-Grumi,他在创意领域拥有丰富的经验。

另外,Pika Labs有很多实习生和兼职人员,他们大多是 麻省理工学院和斯坦福大学的博士和本科生,大多都有竞赛经历或者发过很多论文,所以Pika Labs的团队技术背景很强。

另一方面,Pika Labs发布的Pika1.0的可操作性很强,用户可以通过文字就能够生成非常贴近且生动的视频。不仅如此,用户还可以对生成后的视频进行逐帧的修改和再加工。此外,Pika 1.0也允许用户上传自己的视频片段,并使用生成式AI来编辑和重新构想场景,这让其成为了目前最有用的AI视频工具之一。

优秀的团队+出色的产品让Pika Labs成为了视频生成领域的一匹黑马。

未来挑战

AI生成视频和AI生成图片的模型有共同之处,但也有很大的差异,如视频需要确保流畅性、动作,以及视频比图像更大,需要更大的GPU内存。此外,视频生成还需要考虑逻辑问题和如何生成,是一帧一帧生成,还是一起生成,目前大多数的模型都是一起生成,缺点就是视频的时长比较短。

Chenlin认为:“视频的每一帧都是一张图片,但处理起来比图片困难很多。视频的每一帧的生成质量都要高,相邻帧之前还要有关联性。此外,控制视频生成更难,因为模型需要生成每一帧发生的事情,但用户则不会希望为每一帧都提供详细的描述。”

所以,对于目前视频生成面临的技术挑战,Demi Guo认为主要有两方面,一是时长,跟时长相关的是动作的意义。所有模型都很容易做一个扩展的功能,把视频时长延长很多,但这样的延长没有意义,因为它生成的动作没有意义。所以我们不仅要延长视频制作的时长,还要关注动作的意义,看它到底能做多复杂的动作。

另一个是视频的清晰度也需要进一步提高。现在的生成视频的分辨率一般为720p,虽然已经有所突破,但还没有达到电影级的水平。还有就是视频的流畅性也需要进一步加强。

AI技术的不断发展,是否会催生出一个AI时代的‘好莱坞’,我们目前还不得而知。但Demi Guo表示,也许明年AI视频生成就会迎来GPT时刻。目前的视频生成还处于类似于GPT-2时期,很可能在未来一年内有一个显著提升。

不可否认的是,AI技术必将会给影视行业带来不小的变化。但Demi Guo同时也认为,AI还是无法完全替代艺术创作者。就如上述他们的那个电影制作团队有这么多AI方面的博士生,还找了很好的编剧,但还是很难做出一个很好的电影作品。所以,AI能做的是高效生成内容,给创作带来无限可能,但要选择哪种可能,还是要有艺术家来导演。

其实,不仅仅是对于影视行业,其它行业也一样,AI技术只能是一个辅助性的手段,最终还是需要人类创作者进行掌舵。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
记者,首先要有良知!徐德智辟谣没有中国人质,手舞足蹈

记者,首先要有良知!徐德智辟谣没有中国人质,手舞足蹈

大风文字
2024-11-27 10:15:40
曝某国产汽车大厂给供应商提要求:1月1日起供应零部件降价10%

曝某国产汽车大厂给供应商提要求:1月1日起供应零部件降价10%

小萝卜丝
2024-11-27 09:50:37
A股:所有人做好准备,行情已到达极限,大A或要历史重演了

A股:所有人做好准备,行情已到达极限,大A或要历史重演了

明心
2024-11-27 09:05:03
现实版《消失的她》!为骗巨额保金,辽宁一男子推妻坠海致其身亡,法院判了

现实版《消失的她》!为骗巨额保金,辽宁一男子推妻坠海致其身亡,法院判了

极目新闻
2024-11-27 09:02:35
体育总局开始调查吴柳芳,工作人员表态,她未来堪忧,已暂停直播

体育总局开始调查吴柳芳,工作人员表态,她未来堪忧,已暂停直播

辣条小剧场
2024-11-26 16:28:53
网传某知名寺庙的住持带领僧人申请美国签证,仅四五位弟子过关,四十多人被拒

网传某知名寺庙的住持带领僧人申请美国签证,仅四五位弟子过关,四十多人被拒

六子吃凉粉
2024-11-26 21:50:07
【极品女优25】AV生涯的句点!枫カレン(枫花恋)最后的引退作是⋯

【极品女优25】AV生涯的句点!枫カレン(枫花恋)最后的引退作是⋯

生活大关注
2024-11-27 09:11:46
换吗?美媒交易畅想:勇士送出维金斯+库明加+卢尼+3首轮换恩比德

换吗?美媒交易畅想:勇士送出维金斯+库明加+卢尼+3首轮换恩比德

直播吧
2024-11-27 09:22:14
马云想让黄渤免费代言,黄渤:“可以,你送我一辆车吧!”马云问:“你想要什么车?”黄渤的回答情商太高了

马云想让黄渤免费代言,黄渤:“可以,你送我一辆车吧!”马云问:“你想要什么车?”黄渤的回答情商太高了

李东阳朋友圈
2024-11-25 15:47:56
折叠屏阈值的跨越者,为何又是华为

折叠屏阈值的跨越者,为何又是华为

钛媒体APP
2024-11-26 19:22:12
一位教授的惊人调查:农村当前最严重的问题,并不是农民收入太低

一位教授的惊人调查:农村当前最严重的问题,并不是农民收入太低

尚曦读史
2024-11-26 21:25:02
比亚迪品牌及公关处总经理:我们基于规模化大量采购对供应商提出降价目标 非强制要求

比亚迪品牌及公关处总经理:我们基于规模化大量采购对供应商提出降价目标 非强制要求

财联社
2024-11-27 11:53:06
继卫生巾之后,麻辣烫也塌房了!网友:吃的用的都塌房,天都塌了

继卫生巾之后,麻辣烫也塌房了!网友:吃的用的都塌房,天都塌了

柚子新媒
2024-11-25 18:00:42
重庆一大楼深夜起火从一楼烧到八楼,当地消防:面馆人员操作不当

重庆一大楼深夜起火从一楼烧到八楼,当地消防:面馆人员操作不当

娱官儿
2024-11-27 11:00:57
惩罚吴柳芳,只会鼓励伪善

惩罚吴柳芳,只会鼓励伪善

维舟
2024-11-26 17:04:44
又罚一笔NBA官方:老鹰因违反球员参赛政策被罚10万美元

又罚一笔NBA官方:老鹰因违反球员参赛政策被罚10万美元

直播吧
2024-11-27 03:10:24
足球报:归化热门奥斯卡着手办理国籍变更手续,基本确定加盟玉昆

足球报:归化热门奥斯卡着手办理国籍变更手续,基本确定加盟玉昆

直播吧
2024-11-27 10:58:21
深圳规模最大高铁站即将动工

深圳规模最大高铁站即将动工

界面新闻
2024-11-27 09:55:59
震动全美!沃尔玛宣布取消DEI并下架LGBT商品

震动全美!沃尔玛宣布取消DEI并下架LGBT商品

华人生活网
2024-11-27 05:20:11
非法高利放贷、组织卖淫!贵州瓮安公开征集严书洪、杨婷娟等人违法犯罪线索

非法高利放贷、组织卖淫!贵州瓮安公开征集严书洪、杨婷娟等人违法犯罪线索

红星新闻
2024-11-26 22:32:19
2024-11-27 12:27:00
TechSugar
TechSugar
做你身边值得信赖的科技新媒体
4520文章数 12679关注度
往期回顾 全部

科技要闻

余承东:Mate70对得起那四字 靠抄袭没未来

头条要闻

"内蒙古警察枪击案"重审 嫌犯称躲避冲撞时无意识开枪

头条要闻

"内蒙古警察枪击案"重审 嫌犯称躲避冲撞时无意识开枪

体育要闻

扣篮命中率28%,NBA首发前锋

娱乐要闻

无性婚姻,深度抑郁,葛夕怎么走不掉

财经要闻

洪灏刘煜辉对谈实录 涉及A股、债务等!

汽车要闻

中国的超豪华车尊界S800 预售百万起/ L3级智驾

态度原创

本地
亲子
房产
家居
公开课

本地新闻

城市24小时|领跑万亿城市,武汉“开挂”了?

亲子要闻

相差14岁双胞胎哥哥带大双胞胎妹妹,四年后妹妹开始“带”哥哥

房产要闻

大动作!新世界·天馥全线上新,锚定广州置业安全网第一标准!

家居要闻

简单空间 层次高级感并存

公开课

一块玻璃,如何改变人类世界?

无障碍浏览 进入关怀版