生成式AI的出现注定将颠覆越来越多的行业!这次是视频制作,一家仅成立半年左右、提供视频生成服务的初创公司,让人人都可以当自己故事的导演。这家公司就是由两个华裔女性创立的Pika Labs。
退学创业
在介绍Pika Labs之前,首先了解一下它的两位美女创始人。这两位创始人分别是Demi Guo和Chenlin Meng,她们都是斯坦福大学人工智能实验室的前博士生,为了创办Pika Labs,两人都选择从斯坦福大学退学(好像已经习以为常)。
图:左为Demi Guo,右为Chenlin Meng
(图片来自网络)
Demi Guo目前担任Pika Labs 创始人兼CEO,她高中时期进入IMO (International Math Olympiad)国家集训队,并于2015年IOI(International Olympiad in Informatics)中获得银牌。
在哈佛大学获得数学学士学位时,Demi同时攻读了计算机科学硕士学位,并转至斯坦福大学攻读博士学位,师从Ron Fedkiw和Chris Manning两位教授,进行图形学和NLP交叉领域的研究。除此之外,Demi在大二间隔学期时期就成为了Meta AI Research最年轻的全职员工,也在Microsoft、Google Brain、Epic Games等公司实习,拥有很强的工程和科研能力。
Chenlin Meng则是Pika Labs的联合创始人兼CTO,在斯坦福大学攻读数学学士学位期间即在Stefano Ermon教授指导下开始学习研究生课程,并在本科期间就发表了5篇Generative AI方向的论文,完成本科学业后,Chenlin继续在斯坦福大学攻读计算机博士学位,在3年时间中发表了30多篇论文,其中,她参与创作的DDIM论文是内容生成的重要论文之一,DDIM是一种重要的内容路线,OpenAI的DALLE-2、Google Imagen以及Stable Diffusion等模型都使用了这一方法。
Pika诞生
为何两个拥有如此出色履历的两位女性会选择退学创业,而且瞄准的是视频创作领域呢?
Demi Guo在接受媒体采访时表示,她对创意行业和用AI赋能内容创作一直很感兴趣,很有热情,也一直想往这个方向创业,攻读博士学位时也是选了AI和creation方向。她在博士期间的两位导师,分别是做AI的Christopher Manning,现在是斯坦福大学人工智能实验室的主任。另一位是Ron Fedkiw,是专攻创意和电影行业的,得过两次奥斯卡奖,也参与过《加勒比海盗》、《星球大战》等电影的特效制作。
去年冬天,Demi Guo和几名斯坦福大学计算机科学博士班的同学,想要尝试使用生成式AI技术制作一部电影,去参加首届‘AI电影节’。同时,他们还邀请了一位得过两次艾美奖的编辑来共同制作电影。值得一提的是,这次电影节的赞助商就是AI生产视频初创公司Runway。
Demi Guo起初以为,凭借他们过硬的技术团队以及有创意的编剧,制作电影应该不难。但当他们实际制作时,她和她的博士同学们在使用了Runway、Photoshop等专业工具,并耗费了大量精力后,制作的AI电影最后还是没有入围,最终获奖的是专业创意人士。
这让Demi Guo意识到,尽管目前的AI技术已经获得很大突破,但将其用于视频制作对于外行人来说仍然非常繁琐。她想为什么不能有一款为非创意专业人士量身定做的视频生成工具,外行人也可以轻松进行创作呢?
基于此,在2023年4月,Demi Guo和Chenlin Meng从斯坦福大学退学,创立了Pika Labs,致力于开发普通人也能很方便使用的AI视频生成器。
发展迅速
虽然只创立了半年左右的时间,今年7月,Pika Labs才在Discord推出服务器,Pika1.0也刚刚在11月发布,但目前Pika的用户数已经达50万名,每周在Pika上生成的视频数达上百万,公司也连续完成了三轮融资,总融资额达到了5500万美元。其中,前两轮由前GitHub首席执行官Nat Friedman领投,最近一轮则来自Lightspeed Venture Partners的3500万美元A轮融资。目前,Pika Labs的估值已经达到了2-3亿美元。
在短短的半年左右的时间内,获得如此发展已属不易,但Demi Guo觉得,虽然公司发展比较顺利,但他们团队对此并不意外,他们还觉得现在的发展和预期中比起来,做得还不够好(多少有点凡尔赛了)。
而他们能取得目前的成绩离不开他们团队的每个人以及他们的领先技术。Pika Labs目前的团队人数还较少,仅有4名全职人员。Demi Guo和Chenlin Meng之前介绍过,另一位Kalin Chen是团队第三位创始人及创始工程师,他拥有CMU的ML&CV硕士学位;还有一个是Matan Cohen-Grumi,他在创意领域拥有丰富的经验。
另外,Pika Labs有很多实习生和兼职人员,他们大多是 麻省理工学院和斯坦福大学的博士和本科生,大多都有竞赛经历或者发过很多论文,所以Pika Labs的团队技术背景很强。
另一方面,Pika Labs发布的Pika1.0的可操作性很强,用户可以通过文字就能够生成非常贴近且生动的视频。不仅如此,用户还可以对生成后的视频进行逐帧的修改和再加工。此外,Pika 1.0也允许用户上传自己的视频片段,并使用生成式AI来编辑和重新构想场景,这让其成为了目前最有用的AI视频工具之一。
优秀的团队+出色的产品让Pika Labs成为了视频生成领域的一匹黑马。
未来挑战
AI生成视频和AI生成图片的模型有共同之处,但也有很大的差异,如视频需要确保流畅性、动作,以及视频比图像更大,需要更大的GPU内存。此外,视频生成还需要考虑逻辑问题和如何生成,是一帧一帧生成,还是一起生成,目前大多数的模型都是一起生成,缺点就是视频的时长比较短。
Chenlin认为:“视频的每一帧都是一张图片,但处理起来比图片困难很多。视频的每一帧的生成质量都要高,相邻帧之前还要有关联性。此外,控制视频生成更难,因为模型需要生成每一帧发生的事情,但用户则不会希望为每一帧都提供详细的描述。”
所以,对于目前视频生成面临的技术挑战,Demi Guo认为主要有两方面,一是时长,跟时长相关的是动作的意义。所有模型都很容易做一个扩展的功能,把视频时长延长很多,但这样的延长没有意义,因为它生成的动作没有意义。所以我们不仅要延长视频制作的时长,还要关注动作的意义,看它到底能做多复杂的动作。
另一个是视频的清晰度也需要进一步提高。现在的生成视频的分辨率一般为720p,虽然已经有所突破,但还没有达到电影级的水平。还有就是视频的流畅性也需要进一步加强。
AI技术的不断发展,是否会催生出一个AI时代的‘好莱坞’,我们目前还不得而知。但Demi Guo表示,也许明年AI视频生成就会迎来GPT时刻。目前的视频生成还处于类似于GPT-2时期,很可能在未来一年内有一个显著提升。
不可否认的是,AI技术必将会给影视行业带来不小的变化。但Demi Guo同时也认为,AI还是无法完全替代艺术创作者。就如上述他们的那个电影制作团队有这么多AI方面的博士生,还找了很好的编剧,但还是很难做出一个很好的电影作品。所以,AI能做的是高效生成内容,给创作带来无限可能,但要选择哪种可能,还是要有艺术家来导演。
其实,不仅仅是对于影视行业,其它行业也一样,AI技术只能是一个辅助性的手段,最终还是需要人类创作者进行掌舵。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.