网易首页 > 网易号 > 正文 申请入驻

ChatGPT 数学能力差的根源究竟何在?

0
分享至

如果您曾经尝试将 ChatGPT 用作计算器,您几乎肯定留意到了它的计算障碍:这个聊天机器人数学很差。在这方面,它在人工智能中并非独一无二。

Anthropic 的 克劳德解决不了 基本的文字问题。双子座搞不懂 二次方程。而 Meta 的 羊驼做简单的 加法都很费劲。

那么,这些机器人怎么能写出独白,却被小学水平的算术绊倒呢?

标记化与之有关。把单词“fantastic”拆分为音节“fan”、“tas”和“tic”,标记化有助于人工智能对信息进行密集编码。但由于标记器——执行标记化的人工智能模型——并不真正知道数字是什么,它们常常最终破坏了 数字之间的关系。例如,标记器可能把数字“380”视作一个标记,却将“381”表示成一对数字(“38”和“1”)。

但标记化并非人工智能数学薄弱的唯一原因。

人工智能系统属于统计机器。通过大量示例的训练,它们学习这些示例中的模式来进行预测(例如,在电子邮件中,短语“to whom”通常位于短语“it may concern”之前)。例如,给定乘法问题 57897×12832,ChatGPT——由于见过大量乘法问题——可能会推断,以“7”结尾的数字和以“2”结尾的数字相乘,其乘积末尾数字将是“4”。但它会在中间部分遇到困难。ChatGPT 给我的答案是 742,021,104;正确答案是 742,934,304。

云田·邓(Yuntian Deng)是滑铁卢大学专门研究人工智能的助理教授,在今年早些时候的一项研究中对 ChatGPT 的乘法能力进行了彻底测试。他和共同作者发现,默认模型GPT-4o在处理每个都包含超过四位数的两个数字相乘时(例如 3,459 x 5,284)会遇到困难。

“GPT-4o 在多位数乘法上表现欠佳,在四位数乘四位数及以上的问题中准确率低于 30%,”邓告诉 TechCrunch。“对于语言模型来说,多位数乘法具有挑战性,因为任何中间步骤中的错误都可能累积,导致最终结果不正确。”

那么,ChatGPT 会永远都缺乏数学技能吗?或者是否有理由相信这个机器人有朝一日或许会像人类(或者就这方面来说,像 TI-84 计算器)一样精通数字?

邓满怀希望。在这项研究中,他和他的同事还测试了o1,OpenAI 的“推理”模型,该模型最近被应用于 ChatGPT。o1 在回答问题之前会逐步思考问题,其表现比 GPT-4o 好得多,在解决九位数乘以九位数的乘法问题时,正确率大约为一半。

“该模型解决问题的方式可能与我们手动解决的方式不同,”邓说。“这使我们对模型的内部方法以及它与人类推理的差异产生好奇。”

邓认为,这一进展表明,至少某些类型的数学问题——乘法问题便是其中之一——最终将被类似 ChatGPT 的系统“完全解决”。“这是一项有着明确算法且定义清晰的任务,”邓说。“我们已经看到从 GPT-4 到 GPT-1 有了显著的改进,所以很明显推理能力正在提高。”

只是别太快扔掉你的计算器。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
又增6国!我国已同25国全面免签!

又增6国!我国已同25国全面免签!

鲁中晨报
2024-11-22 12:23:07
莱加内斯0-3皇马,赛后评分:不是姆巴佩第一,是皇马7号第一

莱加内斯0-3皇马,赛后评分:不是姆巴佩第一,是皇马7号第一

侧身凌空斩
2024-11-25 03:22:55
中铁建49岁副总坠楼身亡!4年前董事长也是因跳楼离世

中铁建49岁副总坠楼身亡!4年前董事长也是因跳楼离世

金哥说新能源车
2024-11-25 07:19:01
恶人相斗,无论谁赢,都是你输!

恶人相斗,无论谁赢,都是你输!

一代文嚎
2024-11-24 21:31:23
幼师称现在的孩子越来越笨引热议,网友:可能是保胎技术变好了

幼师称现在的孩子越来越笨引热议,网友:可能是保胎技术变好了

阿康四岁啦
2024-11-24 14:24:09
钓鱼人要小心!成都一钓场老板被偷家,美女老板娘出轨钓友被堵被窝

钓鱼人要小心!成都一钓场老板被偷家,美女老板娘出轨钓友被堵被窝

趣笔谈
2024-11-23 09:46:16
央行出手了!人民币贬值背后的真相你绝对想不到!

央行出手了!人民币贬值背后的真相你绝对想不到!

魏家东
2024-11-24 07:54:37
骂出大粪!捷豹搞“政治站队”拉全品牌陪葬?“性少数”才配开捷豹?

骂出大粪!捷豹搞“政治站队”拉全品牌陪葬?“性少数”才配开捷豹?

51qc我要汽车网
2024-11-24 20:16:24
西方意识到可怕后果,只要中国愿意,美军可能连仗都打不下去?

西方意识到可怕后果,只要中国愿意,美军可能连仗都打不下去?

惠然观史
2024-11-24 08:00:13
真相大白!王楚钦4-0横扫张本智和原因曝光,刘国正点评一针见血

真相大白!王楚钦4-0横扫张本智和原因曝光,刘国正点评一针见血

曹说体育
2024-11-24 16:37:16
两个动作,一个习惯,气血噌噌地往上涨

两个动作,一个习惯,气血噌噌地往上涨

唐山微科普
2024-11-22 23:50:11
逼近美国!拿下比钱凯港更牛的港口,中国把航线开到美国门口

逼近美国!拿下比钱凯港更牛的港口,中国把航线开到美国门口

童童聊娱乐啊
2024-11-24 18:29:03
小皮蓬谈在联合中心拿生涯新高:父亲名字在球馆上空 梦想成真

小皮蓬谈在联合中心拿生涯新高:父亲名字在球馆上空 梦想成真

直播吧
2024-11-24 12:34:12
三星连接马斯克的卫星,5G基建和传统通信咋办?别人弯道超车了!

三星连接马斯克的卫星,5G基建和传统通信咋办?别人弯道超车了!

你食不食油饼
2024-11-23 20:38:00
忻口战役有多激烈,阎锡山掏空家底,晋绥军9个炮兵团全部参战

忻口战役有多激烈,阎锡山掏空家底,晋绥军9个炮兵团全部参战

无所也不能
2024-11-24 09:42:50
避重就轻?袭击新华社记者的,连带领导全抓了,但关键问题没解决

避重就轻?袭击新华社记者的,连带领导全抓了,但关键问题没解决

红色鉴史官
2024-11-24 08:00:02
已经严重影响到了全队的发挥!火箭愿意让顶薪控卫在场上胡打吗?

已经严重影响到了全队的发挥!火箭愿意让顶薪控卫在场上胡打吗?

稻谷与小麦
2024-11-24 23:25:52
3000万!崔康熙解约金曝光:超额完成任务,触发留队,泰山队没钱

3000万!崔康熙解约金曝光:超额完成任务,触发留队,泰山队没钱

小金体坛大视野
2024-11-24 13:29:57
上海桥洞大神:为妻坐牢十年后,睡桥洞, 一天赚30根本花不完

上海桥洞大神:为妻坐牢十年后,睡桥洞, 一天赚30根本花不完

书雁飞史oh
2024-11-24 21:55:06
普京郑重警告:俄乌战争正升级为全球冲突!

普京郑重警告:俄乌战争正升级为全球冲突!

财联社
2024-11-22 08:38:05
2024-11-25 08:56:49
科技的视界
科技的视界
最新国内外科技资讯
6461文章数 115关注度
往期回顾 全部

科技要闻

中欧即将达成电动汽车关税协议

头条要闻

前体操冠军陷"擦边"风波 背后签约MCN公司公开

头条要闻

前体操冠军陷"擦边"风波 背后签约MCN公司公开

体育要闻

卡文迪什:公路自行车传奇谢幕

娱乐要闻

窦靖童演唱会:王菲助阵,谢霆锋助唱

财经要闻

未来3-6个月创新高?哪些赛道有潜力?

汽车要闻

尊界S800首张官图发布 双色车身"尊的"很亮

态度原创

手机
旅游
本地
数码
公开课

手机要闻

三星 Galaxy S25 Ultra 手机机模上手:方一些、大一些的 S24+

旅游要闻

北武当山:日出、云海、雾凇齐现!宛若仙境

本地新闻

云游中国 | 拒绝特种兵!北方也有“真江南”

数码要闻

苹果尚未计划推出具有"重大"变化的AirPods Max 2

公开课

一块玻璃,如何改变人类世界?

无障碍浏览 进入关怀版