网易首页 > 网易号 > 正文 申请入驻

一个悄然崛起的国产项目

0
分享至

公众号关注 “GitHubDaily”

设为 “星标”,每天带你逛 GitHub!


数学,可谓是解开宇宙万物本源最为重要的钥匙之一。

从早期人类通过结绳、刻字来计数,到后面算盘诞生,推动计算机的演化与发展,人类的数学能力一直在以指数级提升。

当计算机首次将人类花费数千年才能推算出的结果,打印在纸张上时,无数科学家脸上的震惊之色难以言表。

时至今日,这一棒交到了 AI 手上,虽说它进入公众视野只有短短几年,但这几步却走得颇为坎坷。

去年刚发布没多久的 ChatGPT,在基础数学逻辑上的推理,犯下了不少低级错误,以致于大家都开始怀疑,AI 是否真的能够凭借优秀的计算速度与推理能力,引领人类将数学能力到一个新的高度上。

所幸在这股 AI 时代浪潮之下,能人善士辈出,大家纷纷躬身入局,不断探索与挖掘 AI 的真正能力,这才让 AI 大模型的数学能力有了质的突破。

独角兽崛起

2023 年 3 月,一家专注于 AI 大模型研发的公司悄然成立,从初期的寥寥几万用户,到今天的几千万,他们只用了四百多天。

这家公司叫月之暗面,而这个大模型,便是众人所熟知的 Kimi。

AI 大模型的各种能力,诸如情感表达、知识检索、文案创作,都已是老生常谈的话题,在此便不再赘述。

今天,我想跟大家聊聊曾被视为 AI 最为薄弱的一项数学能力,在 Kimi 手上,被发挥到何种程度。

不久前,Kimi 推出了新一代k0-math数学模型,其综合能力与一众世界主流 AI 模型不遑多让。


在中考、高考、考研以及入门竞赛题 MATH 等 4 个数学基准测试中,更是超越了这些主流模型。

其中令我感到最有意思的一点,便是它引入了 “COT 思维链” 技术。

简单来说,就是让 AI 能像人脑一样,去思考每道题的解答步骤,并基于上下文一步步推导出最准确的结果。

下面就带大家感受一下,这个来自新时代 AI 模型的数学能力吧。

k0-math 的魔力

今天下班较早,刚打开电脑,打算把玩一下 Kimi 这个新上手的功能。

恰巧赶上侄女一家来做客,便想着带着这个对数学颇感兴趣的侄女(小颖),来测试一下 Kimi 的数学能力。

场景一:来个数学老师吧

小颖前两天的数学考试得了 95 分,只错了一道题,老师说是因为答题思路不明确,方向错误,才没得分。

那么,如果换成 Kimi,它会怎么做?

首先我们把题目传给 AI,并加入适当提示词,看它是怎么推理整个解题过程。


注意:这里我们需要先对题目截图,再用 Kimi 常规版将题目转为 LaTeX 格式,让模型更好理解公式。


瞬间 k0-math 给出了详细的解题步骤,一步步进行求解与验证。


(可以上下滚动查看完整回答过程)

发给小颖看了后,她瞬间焕然大悟。Kimi 过关。

场景二:整一个大蛋糕

为了庆祝小颖此次考试名次上升,大家提议整个蛋糕。

不过今天来的人比较多,用于蛋糕制作的面粉不够,这时候需要重新确定配比。

换做以往,得掏出计算器折腾半天,但今天这个计算工作,我想交给 Kimi。

于是,便有了如下跟 Kimi 的对话。


k0-math 的回答让我眼前一亮。它不仅能准确给出答案,还会根据实际生活情况来给出合理用量。

比如按照常识,我们使用的鸡蛋数必须为整数,这里 Kimi 并不会直接按结果建议用 7.5 个鸡蛋,而是会再次深入思考,意识到半个鸡蛋的不合理之处。

这里就需要 Kimi 来抉择少半个,还是多半个鸡蛋两种情况。

由于我们一开始的目的是做更大的蛋糕,因此在 Kimi 看来,蛋糕稍微大点,对于我们的需求来说,不会有太大影响,最终它很明智的推荐我们使用 8 个鸡蛋的份量。


(可以上下滚动查看完整回答过程)

场景三:摇骰子小游戏

在吃完蛋糕的茶余饭后之际,我看有点无聊,便提议来玩大话骰。

玩过的朋友应该知道,大话骰的决胜关键,在于推理出各个玩家手上的骰子出现概率,再报出最接近概率的骰子数,或用骗术来迷惑对手。

那么,这时如果让 Kimi 参加到这场游戏博弈,能否提高我的胜算呢?

想到这里,我便考虑亲自实践一番:


在充分理解游戏规则之后,Kimi 开始帮助我进行概率分析。

首先我的上家叫了「4 个 5」,论到我,这时我有以下几种选择:


因此为了抉择是质疑还是加注,我便可以先了解游戏场上,「4 个 5」会出现的概率。如果该概率较大,我便可以选择加注,概率较小,则质疑。

在我没有明确跟 Kimi 沟通决胜技巧的前提下,它竟然可以知道优先分析场上 5 和 6 出现的概率,再结合我手上现有的骰子,进行完整的逻辑分析,并得出令我胜算概率最大的选择。

整个推理过程没有人类情感,只有来自数学的理性。Kimi 每一个推理结果的产出,都化作我叫骰加注的勇气。


(可以上下滚动查看完整回答过程)

经过几轮游戏下来,我发现借助 Kimi 的推理之后,胜算确实大幅提升了。 不过在他们发现我用 Kimi 作弊之后,我就被禁止参赛了

短短几轮博弈,便让我体验到《决胜 21 点》主人公那种凭借出色数学天赋,宛如开挂般在赌场赢钱的爽劲。

通过以上几轮真实场景演示,相信大家除了直观感受到 k0-math 模型强大的数学推理能力之外,还能看到将其能力融入生活后,可带来的不同体验。

AI 成为私人教学导师,帮忙分析错题,一步步引导学生理解解题思路,让思维更加清晰。担任生活助手,解决生活中遇到的各种数学问题。还能在需要数学计算的游戏博弈中,帮助我们赢下游戏。

经过这短短几天的体验之后,我对 AI 大模型的数学能力有了新的认知。我也相信,在各位数学精英的把玩下,Kimi 的 k0-math 远不止于此。

人类对数学的探索历史,在每个时代都会涌现出那么几颗璀璨巨星,他们的出现,大幅推动了整个人类文明与科技的进步。

从古人开始用编绳计数,置换柴米油盐,交易日常所需。到今天用计算机推算火箭数据,帮助人类实现星辰大海的探索梦想。

这一切的一切,都源自于数学。这把从始至终都静默存在,等待人类去拾取的钥匙。

Kimi 近期发布的 k0-math 模型,让我又不禁思考,在未来的一百年内,AI 又会如何借助数学能力,把人类带到哪一个新的阶段呢?

大家一起拭目以待吧。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
造成1死1伤,大连锐士船舶工程有限公司7·15物体打击事故查明

造成1死1伤,大连锐士船舶工程有限公司7·15物体打击事故查明

中国基建报
2024-11-29 22:56:00
蒂格:为施罗德感到开心 但他很可能会被交易到一支争冠球队

蒂格:为施罗德感到开心 但他很可能会被交易到一支争冠球队

直播吧
2024-11-29 20:51:34
无锡市公认的六个特色餐馆,排队也要去吃一次,赶紧收藏!

无锡市公认的六个特色餐馆,排队也要去吃一次,赶紧收藏!

王大健美食日常
2024-11-29 18:33:44
阿斯:阿尔瓦雷斯现在已经渐入佳境,15脚射门就取得了9个进球

阿斯:阿尔瓦雷斯现在已经渐入佳境,15脚射门就取得了9个进球

直播吧
2024-11-29 14:38:10
住了5年终于明白,地暖和暖气片哪个更好!原来很多人都搞错了

住了5年终于明白,地暖和暖气片哪个更好!原来很多人都搞错了

蜉蝣说
2024-11-20 19:09:16
王宝强和恩波的这场闹剧终于真相大白了

王宝强和恩波的这场闹剧终于真相大白了

西楼知趣杂谈
2024-11-29 15:34:33
03年湖南一女教师莫名离世,6次尸检后得出结论:特殊性方式导致

03年湖南一女教师莫名离世,6次尸检后得出结论:特殊性方式导致

历来都很现实
2024-11-23 16:03:32
特斯拉陶琳发声引发热议,网友:我的天! 90天回款都要宣扬了…

特斯拉陶琳发声引发热议,网友:我的天! 90天回款都要宣扬了…

火山诗话
2024-11-29 06:33:40
宋美龄106岁寿终,临终前她歉意最深的三位男士是谁?

宋美龄106岁寿终,临终前她歉意最深的三位男士是谁?

那年的春夏
2024-11-25 23:22:45
心理学:如果你经常说这3句话,说明你潜意识里很自卑,很软弱

心理学:如果你经常说这3句话,说明你潜意识里很自卑,很软弱

心理相先生
2023-04-21 18:27:39
2米28张子宇为何不能扣篮?女篮主帅下死命令:正赛不跳不扣

2米28张子宇为何不能扣篮?女篮主帅下死命令:正赛不跳不扣

篮球快餐车
2024-10-04 01:29:04
"降压利器:揭开苯磺酸氨氯地平的神秘面纱及如何避免副作用风险"

"降压利器:揭开苯磺酸氨氯地平的神秘面纱及如何避免副作用风险"

药师说健康
2023-05-13 11:29:44
1840万,加盟湖人!紫金军捡到宝了,雷迪克意外之喜解放了浓眉

1840万,加盟湖人!紫金军捡到宝了,雷迪克意外之喜解放了浓眉

呆哥聊球
2024-11-29 21:24:56
小米su7被外借拍色情片,视频被曝光,3人被拘留!车主躺枪

小米su7被外借拍色情片,视频被曝光,3人被拘留!车主躺枪

说真话的小陈
2024-11-28 16:14:57
中央定调,退休新规实施,提前退休和延迟退休的福利选择有了答案

中央定调,退休新规实施,提前退休和延迟退休的福利选择有了答案

讯崽侃天下
2024-11-28 17:12:09
惨不忍睹!广东队新外援单场7中1,球迷喊话朱芳雨:立刻马上裁掉

惨不忍睹!广东队新外援单场7中1,球迷喊话朱芳雨:立刻马上裁掉

林小湜体育频道
2024-11-30 03:20:38
博主让糖尿病母亲停西药,改中药后腿部结痂流脓,称:毒逼出来了

博主让糖尿病母亲停西药,改中药后腿部结痂流脓,称:毒逼出来了

天行舰
2024-11-26 20:05:28
西方开始后悔招惹印度:白人基底的国家,等白人死绝就是三哥天下

西方开始后悔招惹印度:白人基底的国家,等白人死绝就是三哥天下

欲知
2024-11-28 19:32:38
台湾最新民调出炉,政党支持度大跌眼镜,蓝绿两大阵营均传来警讯

台湾最新民调出炉,政党支持度大跌眼镜,蓝绿两大阵营均传来警讯

纵横观天下ZK
2024-11-29 11:35:09
赢下比赛的关键!大卫-詹姆斯45分钟砍31分20板4助 正负值+27

赢下比赛的关键!大卫-詹姆斯45分钟砍31分20板4助 正负值+27

直播吧
2024-11-29 21:56:10
2024-11-30 05:27:00
GitHubDaily
GitHubDaily
专注于分享 GitHub 上知名的优质学习资源、开源项目及开发者工具。
10文章数 42关注度
往期回顾 全部

科技要闻

"AGI不是大杀器,是普通人每天在用的产品"

头条要闻

男子疑因吃"驴打滚"窒息身亡 目击者:他无法吐出食物

头条要闻

男子疑因吃"驴打滚"窒息身亡 目击者:他无法吐出食物

体育要闻

穆雷与德约科维奇能凑成王炸组合吗?

娱乐要闻

叶珂被曝独自去产检,他俩真分了吗

财经要闻

专家建议将农民养老金提升至每月500元

汽车要闻

问界M7今年累计交付量已突破18万辆

态度原创

健康
房产
本地
教育
时尚

花18万治疗阿尔茨海默病,值不值?

房产要闻

大量甩地!114亿,4790亩!海南土地市场全面爆发!

本地新闻

云游中国|来伦布夏果感受充满Passion的人生

教育要闻

9年后中小学生数或跌至6成,中小学教师超过需求量!

Lanvin将重返时装周,Paul Smith受邀设计圣诞树

无障碍浏览 进入关怀版