网易首页 > 网易号 > 正文 申请入驻

可灵AI全系发布2.0更新,视频及图像可控生成与编辑能力再升级,全球用户数突破2200万

0
分享至

4月15日,快手可灵AI在北京中关村国际创新中心举行“灵感成真”2.0模型发布会,宣布基座模型再次升级,面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。

数据显示,自去年6月发布以来,可灵AI已累计完成超20次迭代,截至目前,全球用户规模突破2200万。来自世界各地的超1.5万开发者和企业客户,将可灵的API应用于不同的行业场景中。

文章转载自可灵AI 官方稿件。

Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核后工作人员会拉你入群~

进群之后,你有机会得到:

  • 高浓度的主流模型(如 DeepSeek 等)开发交流;

  • 资源对接,与 API、云厂商、模型厂商直接交流反馈的机会;

  • 好用、有趣的产品/案例,Founder Park 会主动做宣传。

01

全系模型进入2.0时代,定义人和AI交互的全新方式

4月15日,可灵大模型2.0版本及可图大模型2.0版本正式面向全球发布。可灵2.0模型在动态质量、语义响应、画面美学等维度,保持全球领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。

盖坤介绍,两款模型在团队内部的多项胜负率评测中,均稳居业内第一。例如在文生视频领域,可灵2.0对比谷歌Veo2的胜负比为205%,对比Sora的胜负比达367%,在文字相关性、画面质量、动态质量等维度上显著超越对手。

自去年6月发布以来,可灵AI已累计完成超20次迭代。3月27日,全球知名AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模式)以1000分的Arena ELO基准测试评分登陆图生视频(Image to Video)赛道榜首。

作为全球首个用户可用的DiT视频生成模型,截至目前,可灵AI全球用户规模已突破2200万,累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里,可灵AI的月活用户数量增长25倍。

(快手高级副总裁、社区科学线负责人盖坤)

盖坤认为,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性、以及用户复杂创意的精确传达上仍有“很多挑战”。也因此,要真正实现“用AI讲好每一个故事”的愿景,必须对基模型能力进行全方位提升,定义人和AI交互的“全新语言”。

一直以来,可灵AI致力于提升模型基础质量和模型效果,并引入更多创新功能,以满足用户的多样化需求。在本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,直接高效地传达给AI。

“大家应该很自然地会感受到文字在表达影像信息时,是不完备的。我们需要有新的方式,能让人真正精准地表达出心中所想。”盖坤指出,MVL由TXT(Pure Text,语义骨架)和MMW(Multi-modal-document as a Word,多模态描述词)组成,能从视频生成设定的基础方向以及精细控制这两个层面,精准实现AI创作者们的创意表达。

基于MVL理念,可灵AI正式推出多模态编辑功能。“从今天起,大家可以在可灵AI的平台上体验我们的多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入,生成符合自己想法的创意视频。”盖坤介绍,MMW(多模态描述词)将不只局限于图片和视频,也可以引入其它模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。

02

全新上线多模态视频编辑功能

基于MVL这一全新交互方式,发布会现场,快手副总裁、可灵AI负责人张迪发布了全新的可灵2.0大师版,在语义响应、动态质量、画面美学等方面显著提升生成效果。

“可灵2.0大师版不仅仅是一次简单的技术升级,更是一次全方位的体验跃升。”张迪介绍,可灵2.0大师版实现了技术、体验、美学的三重突破。

(快手副总裁、可灵AI负责人张迪)

值得一提的是,可灵2.0大师版全面升级视频及图像创作可控生成与编辑能力,上线全新的多模态视频编辑功能,能灵活理解用户意图。支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。

(可灵2.0大师版操作界面)

张迪披露,当前,图生视频约占到可灵AI视频创作量的85%,图片质量也对视频的生成效果产生重要作用。

在图像生成大模型领域,快手的可图2.0处于行业领先水平,拥有多项核心优势,诸如强大的复杂语义理解能力、电影级的画面质感、多条件的可控风格化生成等。在团队内部的多项胜负率评测中,相较于Midjourney V7、FLUX1.1 [pro]以及Reve等行业领先的图像模型,均保持明显优势。

张迪介绍,可图2.0文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现大幅跃升。

同时,可图2.0也上线了实用的图像可控编辑功能——局部重绘和扩图,支持图片的增加、修改和修复。在图像的多模态可控生成中,可图2.0还上线了全新的风格转绘功能,只需要上传一张图片加上风格描述,就能一键切换图片的艺术风格,同时精准保留原图的语义内容。

03

超 1.5 万开发者,生成视频超 4000 万

除了C端订阅用户,可灵AI也面向B端商家提供API接入等服务。目前,可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。

盖坤披露,来自世界各地的超1.5万开发者,已将可灵的API应用于不同的行业场景中,累计生成的图像数量约1200万个,生成的视频素材超过4000万个。

如今,可灵正在成为AI时代视频创作的新基础设施。AIGC技术的迅猛发展,也正在重构包括广告营销、专业创作、影视、娱乐创意等在内的多个行业。

以二次元AI创作社区产品狸谱为例,其产品负责人一休介绍,可灵AI为狸谱带来了创新突破。其1.6版本在人物运动流畅度、镜头移动等方面展现出卓越性能,助力狸谱成功接入“动态LIVE”和“新春萌偶摇”两大功能。前者实现“图 - 影 - 音”快速创作,后者在春节期间引发60万用户转播。未来,双方将基于狸谱的优质内容数据与可灵的算法能力,打造动画模型,推动AI成为内容引擎,并共同孵化优质创作者,构建更活跃的创作生态,携手开启二次元内容产业的新篇章。

“可灵AI可全面融入剧集级创作流程”。可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇在分享中介绍,AIGC相较于实拍和动画,不仅是效率的提升,更是试错空间的革命性释放。

从剧本创作到内容发行,异类Outliers团队完成了一次完整的影像工业化创作流程,覆盖从美学表达到镜头结构,再到复杂动作场景与细节的全面呈现。“我们实践之后发现,可灵AI是一个能够稳定、大规模嵌入剧集创作流程的生成式协作大模型。”陈翔宇认为,在AI的辅助下,导演及编剧团队的大量内容创意也实现了更富有想象力的表达,“AIGC也许是下一代内容结构的雏形”。

(可灵AI超级创作者,《新世界加载中》总导演,异类Outliers创始人陈翔宇)

为了进一步激发AI爱好者们的创作热情,快手副总裁、可灵AI负责人张迪还在发布会现场正式发起“可灵AI NextGen 新影像创投计划”。该计划将加大对于AIGC创作者的扶持力度,通过千万资金投入、全球宣发、IP打造和保障,以全资出品、联合出品和技术支持等灵活多样的合作方式,让AI好故事走向世界。同时,可灵AI面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创AI创意短片,让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。

面向未来,盖坤表示,可灵AI将持续大力推动技术创新,用人与AI交互的全新语言,帮助用户实现复杂创意的精确表达,“我们的初心,是让每个人都能用AI讲出好的故事,我们也真切地希望这一天更快到来”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海德云社上座率跌到谷底,得罪观众是问题,作品不行是根本

上海德云社上座率跌到谷底,得罪观众是问题,作品不行是根本

我就是个码字的
2026-05-27 07:35:03
割四赔五上热搜,当地书记都无可奈何,只能自掏腰包进行补偿

割四赔五上热搜,当地书记都无可奈何,只能自掏腰包进行补偿

映射生活的身影
2026-05-26 15:56:12
灾情如火,岂容“审批”挡道?——评三支蓝天救援队被通报事件

灾情如火,岂容“审批”挡道?——评三支蓝天救援队被通报事件

细雨中的呼喊
2026-05-26 13:37:48
武契奇试驾小米汽车,幽默回应“想不想买一辆”:买不起,但车很漂亮

武契奇试驾小米汽车,幽默回应“想不想买一辆”:买不起,但车很漂亮

大风新闻
2026-05-26 17:48:04
李小孩的“小绿瓶”,看起来很平凡,为啥禁止出境展览?

李小孩的“小绿瓶”,看起来很平凡,为啥禁止出境展览?

收藏大视界
2026-05-24 17:41:29
“睡粉”球员被处理,苏超第二季失去纯粹性!本土化才是省超根基

“睡粉”球员被处理,苏超第二季失去纯粹性!本土化才是省超根基

中国足球的那些事儿
2026-05-26 20:44:57
涉嫌严重违纪违法,崔汝山被查

涉嫌严重违纪违法,崔汝山被查

都市快报橙柿互动
2026-05-27 00:31:05
割四赔五后续,夫妻俩宣布回家:不能让河南的小麦再发芽了

割四赔五后续,夫妻俩宣布回家:不能让河南的小麦再发芽了

映射生活的身影
2026-05-26 20:37:31
小学生大巴车在高速上出问题,老师让男生留在车上,让女生搭车离开

小学生大巴车在高速上出问题,老师让男生留在车上,让女生搭车离开

可达鸭面面观
2026-05-26 18:25:56
吃降压药去世的人增多?医生告诫:天热吃降压药,务必注意4点

吃降压药去世的人增多?医生告诫:天热吃降压药,务必注意4点

路医生健康科普
2026-05-26 17:15:24
武汉28岁孕妇失联后续:时隔10天,首位目击人发声,丈夫行为反常

武汉28岁孕妇失联后续:时隔10天,首位目击人发声,丈夫行为反常

李晚书
2026-05-26 12:04:16
普京签署项法律,允许以“保护俄罗斯公民”为借口向他国部署军队

普京签署项法律,允许以“保护俄罗斯公民”为借口向他国部署军队

山河路口
2026-05-26 14:52:00
朱时茂陈佩斯现状曝光差距大,一人家财万贯,一人真被倪萍说中了

朱时茂陈佩斯现状曝光差距大,一人家财万贯,一人真被倪萍说中了

孤城落日
2026-05-26 19:45:03
尴尬!广东一业主因邻居大姐房事声音过大不堪其扰,声称要去录音

尴尬!广东一业主因邻居大姐房事声音过大不堪其扰,声称要去录音

火山詩话
2026-05-26 06:21:30
今天,中国改写全球规则,这场延续8年的战争胜负已分!

今天,中国改写全球规则,这场延续8年的战争胜负已分!

一个坏土豆
2026-05-26 20:06:14
Shams:阿特金森继续担任骑士主帅 球队休赛期会尝试补强阵容

Shams:阿特金森继续担任骑士主帅 球队休赛期会尝试补强阵容

罗说NBA
2026-05-27 06:04:59
白宫那把小椅子仍历历在目!中国接待规格,足以替武契奇一雪前耻

白宫那把小椅子仍历历在目!中国接待规格,足以替武契奇一雪前耻

漫步独行侠
2026-05-26 08:22:20
苏超丑闻!曝20岁球员与5拉拉队员淫乱+有未成年 疑是双胞胎之一

苏超丑闻!曝20岁球员与5拉拉队员淫乱+有未成年 疑是双胞胎之一

念洲
2026-05-26 16:59:20
全票赞成解散议会!内塔尼亚胡遭遇政治惨败,伊朗或成最大赢家

全票赞成解散议会!内塔尼亚胡遭遇政治惨败,伊朗或成最大赢家

漫步独行侠
2026-05-26 08:21:50
从世界第4到117位,郑钦文只用了10个月,詹俊:根源在这两点

从世界第4到117位,郑钦文只用了10个月,詹俊:根源在这两点

酷侃体坛
2026-05-26 18:11:48
2026-05-27 10:36:49
FounderPark incentive-icons
FounderPark
关注AI创业,专注和创业者聊真问题
1221文章数 163关注度
往期回顾 全部

科技要闻

美光股价大涨超19%,市值破万亿美元

头条要闻

两儿子均非亲生 "人生很失败"男子起诉前妻要讨回房子

头条要闻

两儿子均非亲生 "人生很失败"男子起诉前妻要讨回房子

体育要闻

摩洛哥队世界杯26人名单:总身价4.7亿 中超旧将入选

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

ST岩石退市背后:A股“炒壳”时代终结

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

旅游
时尚
健康
家居
本地

旅游要闻

绿城相伴 和美宜居

这款来自千年前的“扎染盲盒”你拆过吗?

外泌体抗衰,什么时候能用上?

家居要闻

生与命相依 旧公寓改造

本地新闻

用云锦的方式,打开江苏南京

无障碍浏览 进入关怀版