网易首页 > 网易号 > 正文 申请入驻

Kimi发布视觉思考模型k1,基于强化学习技术打造

0
分享至

日前,AI初创公司月之暗面宣布推出视觉思考模型k1,并将以“Kimi视觉思考版”的形式陆续在Kimi网页版和Kimi智能助手App上线。据悉该模型会完整呈现推理思维链CoT,让用户不只看到答题结果,还能完整看到模型思索答案的全过程。用户在最新版手机App或网页版Kimi+页面找到“Kimi视觉思考版”,即可拍照或传图进行体验。


据官方介绍,k1模型是基于强化学习技术打造,原生支持端到端图像理解和思维链技术,可直接处理用户输入的图像信息、并进行思考得出答案,无需借助外部OCR或额外视觉模型进行信息处理。

同时k1模型还借助端到端的图像理解能力,解锁了包括几何图形题在内更加全面的数学能力。在不同阶段的几何和图形题专项基准能力测试中,k1-preview的成绩追平或超过了OpenAI o1模型。除数学能力之外,其还将能力扩展到了物理、化学等领域,在基础科学学科教育阶段能力测试中超过OpenAI的o1和GPT-4o、Anthropic的Claude 3.5 Sonnet等全球标杆模型。


据悉在模型训练方面,k1模型的训练分为两个阶段,即先通过预训练得到基础模型,再在基础模型上进行强化学习后训练。具体而言,k1的基础模型重点优化了字符识别能力,在OCRBench上得到了903分的当前最好结果,并且在其他基准测试集上也处于全球第一梯队的水平;k1的强化学习后训练则在数据质量和学习效率维度做了进一步优化,并在强化学习的规模化(scaling)上取得了新的突破。

不过需要注意的是,k1模型仍然存在一些局限性需要突破,例如在分布外(out-of-distribution)的泛化、在更复杂问题上的成功率、在更多噪声场景的准确率、多轮问答效果等方面有很大提升空间。其中在一些场景和泛化能力上,k1与OpenAI的o1系列模型相比仍有差距。


对此月之暗面方面指出,基础科学领域的大量信息蕴藏在图像和图形信息里,如何将思考能力与图像理解能力更紧密得融合,同时为用户带来更流畅的交互体验,是一项重要的技术挑战,“我们相信,图像理解和思考能力,将会解锁Kimi更广泛的使用场景”。此外其还表示,未来会持续提升Kimi视觉思考版的各方面能力,让它变得更加“可靠”、更加“万能”。

【本文图片来自网络】

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
17岁天才亚马尔一年时间肌肉变化照片引热议,球迷:有C罗的影子

17岁天才亚马尔一年时间肌肉变化照片引热议,球迷:有C罗的影子

侧身凌空斩
2024-12-18 09:04:56
日本人破防了:DNA检测日本祖先被证实,日本人不是徐福后代

日本人破防了:DNA检测日本祖先被证实,日本人不是徐福后代

清风游史
2024-12-18 14:00:19
前国足主帅佩兰,回顾了执教国足时期的遗憾,句句透露不甘心

前国足主帅佩兰,回顾了执教国足时期的遗憾,句句透露不甘心

百里无心
2024-12-18 07:11:24
《陈情令》主演漆培鑫被爆多次与女制片人发生关系,女方私照曝出

《陈情令》主演漆培鑫被爆多次与女制片人发生关系,女方私照曝出

古今历史记
2024-12-17 16:58:06
多地叫停购车补贴,消费者血亏20,000元!明年还有以旧换新政策吗?

多地叫停购车补贴,消费者血亏20,000元!明年还有以旧换新政策吗?

51qc我要汽车网
2024-12-18 20:21:29
李铁被抓导火索曝光:拿捏152亿富豪,彻底激怒对方,玉石俱焚

李铁被抓导火索曝光:拿捏152亿富豪,彻底激怒对方,玉石俱焚

大秦壁虎白话体育
2024-12-18 09:41:30
12月18日俄乌:泽连斯基再次表明态度,俄军进攻遭乌军伏击

12月18日俄乌:泽连斯基再次表明态度,俄军进攻遭乌军伏击

山河路口
2024-12-18 18:49:04
全新宝马X5曝光,设计太超前不忍直视,公路之王这次玩脱了?

全新宝马X5曝光,设计太超前不忍直视,公路之王这次玩脱了?

谈车工坊
2024-12-16 10:44:16
吴奇隆、刘诗诗被曝已离婚,双方暂未回应

吴奇隆、刘诗诗被曝已离婚,双方暂未回应

极目新闻
2024-12-18 14:44:34
谢鹏飞离队?申花下赛季最大对手浮出水面!

谢鹏飞离队?申花下赛季最大对手浮出水面!

美人茶话会
2024-12-19 00:38:43
年纪越大越要管住嘴,少吃萝卜白菜,多吃8样,身体好!

年纪越大越要管住嘴,少吃萝卜白菜,多吃8样,身体好!

美食店主
2024-12-02 07:33:20
分开三年后,佟丽娅陈思诚高调官宣喜讯,联手给娱乐圈上了一课

分开三年后,佟丽娅陈思诚高调官宣喜讯,联手给娱乐圈上了一课

夏聊史
2024-12-18 09:30:15
突发!勇士新首发五虎出炉,小黑加盟24小时后,拉科布退出交易JB

突发!勇士新首发五虎出炉,小黑加盟24小时后,拉科布退出交易JB

美人茶话会
2024-12-19 00:42:15
伊朗:入绝境,方知兄弟们的好

伊朗:入绝境,方知兄弟们的好

百味朱砂
2024-12-14 12:59:42
2024年,广州宝马撞人案温庆运被注射死刑,行刑前含泪抽完2根烟

2024年,广州宝马撞人案温庆运被注射死刑,行刑前含泪抽完2根烟

阿器谈史
2024-12-16 15:37:00
娄艺潇晒北京4000平民宿,年收入552万元,感叹:我不是为了赚钱

娄艺潇晒北京4000平民宿,年收入552万元,感叹:我不是为了赚钱

小迩侃事
2024-12-18 14:57:09
美联储声明全文:降息25基点,后续降息幅度和时间需重估

美联储声明全文:降息25基点,后续降息幅度和时间需重估

小宇宙双色球
2024-12-19 03:59:44
华为开启“降价模式”,麒麟9000s+昆仑玻璃,512GB直降1469元

华为开启“降价模式”,麒麟9000s+昆仑玻璃,512GB直降1469元

小柱解说游戏
2024-12-19 02:25:58
美论坛:为什么美国贫困率约为18%,而中国的贫困率还不到1%?

美论坛:为什么美国贫困率约为18%,而中国的贫困率还不到1%?

蜉蝣说
2024-12-17 11:02:12
挑战14小时100人,结束后她却泪流满面:我不推荐这样做!

挑战14小时100人,结束后她却泪流满面:我不推荐这样做!

新欧洲
2024-12-16 21:28:31
2024-12-19 06:43:00
三易生活 incentive-icons
三易生活
专注IT,最快最专业资讯!
58206文章数 12689关注度
往期回顾 全部

科技要闻

特斯拉上海工厂厂长宋钢今日离职

头条要闻

美联储宣布降息25个基点

头条要闻

美联储宣布降息25个基点

体育要闻

雷霆最大隐患曝光 输掉杯赛只因他太固执

娱乐要闻

曝吴奇隆刘诗诗已离婚?蛛丝马迹被扒

财经要闻

重磅!中央农村工作会议在京召开

汽车要闻

搭载鲲鹏超能混动C-DM 奇瑞风云T11PT车下线

态度原创

游戏
艺术
本地
公开课
军事航空

钢岚:梅丽莎抽取价值分析!这都一周年庆了她还算钢岚妈王么?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

本地新闻

好吃潮州|“丸”美出道,你pick了吗

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄将军在家门口被暗杀 细节披露

无障碍浏览 进入关怀版