作者|袁博
来源|AI先锋官
9.11和9.8哪个大?最近这个小学问题可是把大模型们难住了。
该梗来源于最新一期的《歌手》公布的排名,孙楠得票13.8%,外国歌手香缇莫得票13.11%。这引发了一些网友对排名的质疑“13.8比13.11高?”甚至该话题一度冲上了热搜,实属抽象
。
还有网友向AI大模型问了这个问题,更更更抽象的就来了,大模型居然答错了!
小编也是非常好奇都有哪些大模型会回答错误呢,所以对当前主流的大模型都测试了一遍,看看都有谁露怯了吧。
ChatGPT
回答错误❌
文心一言
回答正确✓
Kimi
回答错误❌
豆包
回答正确√
360智脑
回答正确√
百川智能
回答错误❌
通义千问
回答正确√
讯飞星火
回答正确√
腾讯元宝
回答正确√
商汤商量
回答错误❌
智谱清言
回答正确√
天工AI
回答正确√
其中,ChatGPT、Kimi、百川智能、商汤商量回答错误,它们认为对于9.11,小数点后第一位是1,第二位是1;而对于9.8,小数点后第一位是8,没有第二位数字。根据小数的比较规则,从小数点后第一位开始比较,直到可以判断出大小为止。
在小数点后第一位,9.11的1小于9.8的8,但是由于9.8没有第二位数字,而9.11的第二位数字是1,其值更大。因此,它们得出结论:9.11大于9.8。
看似合理的解释,但实际上却犯了常识性错误。
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。
往期文章回顾
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.