网易首页 > 网易号 > 正文 申请入驻

国产AI大模型高考成绩单出来了:讯飞星火获得综合第一

0
分享至

随着高考的落幕,全国各地的高三学子们终于可以卸下沉重的负担,轻松迎接假期。与往年不同的是,今年的高考战场上还有一支与众不同的队伍引人注目——国产人工智能大模型。

在这场特殊的高考中,包括搜狐科技、潇湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下:

首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为权威专家为各大模型的作文打分。腾讯元宝和百度文心一言以超过50分的成绩位居前列,智谱清言、字节豆包与讯飞星火则并列第三。Kimi、阿里通义、百川、海螺排名相对靠后。

而在潇湘晨报的"AI写作"评测中,讯飞星火不仅平均分位居首位,且获得了全场最高分56分。潇湘晨报邀请湖南知名作家、编辑作为阅卷老师,对国内五大AI大模型产品——百度文心一言、讯飞星火、阿里通义千问、字节豆包、腾讯元宝的高考作文进行评分,经过四位阅卷老师的综合打分,讯飞星火以49分的平均分高居首位。

给讯飞星火打出"全场最高分"56分的阅卷老师表示:"本文观点清晰,论述集中且层层推进,很多句子都简洁有力,颇有思想性。如果是某个学生写的,无疑是难得的佳作。"另外,从网友的热门评论中也能看出讯飞星火摘得高分的原因。

网友@2024:感觉星火好点,更像作文,有些更像回答问题。

网友@烟花绽放的节日:讯飞星火更有高考味。

接下来是数学科目的较量。在搜狐科技的数学评测中,讯飞星火、文心一言、豆包均以63%的正确率位列第一梯队,智谱清言、阿里通义则以50%的正确率位居第二梯队,其他大模型相对落后。

在量子位的高考数学评测中,虽然没有给出详细成绩单,但展示了各家大模型详细的解题思路,交由网友打分,通过网友的投票打分可以看出,讯飞星火的"识图+解数学题"能力收到了最高认可,位居其后的分别是Kimi、通义千问、文心一言、豆包等。

最后是高考物理的测试。在量子位的评测中,阿里通义千问与讯飞星火以71.4%的准确率高居第一梯队,而Kimi、海螺和腾讯元宝则以42.9%的准确率位于第二梯队。百川百小应和万知答对一题位于第三梯队。

文心一言、豆包、天工、智谱清言、商量因为出现了不同程度读图失败的问题,在成功识别的题目中,商量和文心一言的正确率为2/4,即正确率为28.6%;豆包、天工、智谱清言正确率为1/2,即正确率为14.3%。

综合以上媒体在作文、数学、物理三门科目的成绩,我们得出了2024年人工智能大模型高考"成绩单"。来自科大讯飞的讯飞星火以52.49分高居第一名,通义千问、文心一言分别位列第二、第三名,而Kimi、字节豆包、海螺AI等其他大模型也有不错的表现。

第一名:52.49 讯飞星火

第二名:46.08 通义千问

第三名:37.67 文心一言

第四名:34.68 Kimi

第五名:33.57 字节豆包

第六名:31.92 海螺AI

第七名:30.61 腾讯元宝

第八名:30.28 智谱清言

第九名:21.56 百川百小应

尽管评测方式可能不够严谨科学,但这次大模型高考无疑展示了国产人工智能在多个学科的优秀表现和长足进步,尤其是讯飞星火的表现堪称"文理兼修"!期待国产大模型再接再厉,在明年的高考中取得更加出色的成绩!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
央国企降薪第一刀:取消证书补贴

央国企降薪第一刀:取消证书补贴

新浪财经
2026-03-30 04:41:15
失联数月,中国博士疑已遇难!警方在雪山发现遗体:或被雪崩冲下山谷

失联数月,中国博士疑已遇难!警方在雪山发现遗体:或被雪崩冲下山谷

华人生活网
2026-03-31 03:58:38
李嘉诚和巴菲特同步清仓,背后的信号不简单

李嘉诚和巴菲特同步清仓,背后的信号不简单

深度报
2026-03-30 22:23:58
真的来了!5099 的 iPhone Air 正式上架

真的来了!5099 的 iPhone Air 正式上架

XCiOS俱乐部
2026-03-30 08:58:50
美媒文章:中国正日益成为“工厂的工厂”

美媒文章:中国正日益成为“工厂的工厂”

参考消息
2026-03-30 18:37:03
电力设施遭袭,伊朗红线被美以突破,两大盟友明确表态出兵驰援

电力设施遭袭,伊朗红线被美以突破,两大盟友明确表态出兵驰援

健身狂人
2026-03-31 07:02:03
孽缘出现,上天都给过你哪些提示?网友:男友来,家里的鱼全死了

孽缘出现,上天都给过你哪些提示?网友:男友来,家里的鱼全死了

另子维爱读史
2026-01-24 21:25:10
连央视都报道了!PS5彻底打破“越放越贬值”定律

连央视都报道了!PS5彻底打破“越放越贬值”定律

游民星空
2026-03-30 17:15:44
国民党有两个党主席:一个地上,一个地下

国民党有两个党主席:一个地上,一个地下

雪中风车
2026-02-26 08:36:13
张雪夺冠的产业“流量” 重庆已做好“接住”准备

张雪夺冠的产业“流量” 重庆已做好“接住”准备

时尚的弄潮
2026-03-31 03:03:09
李鹏晚年亲口澄清身世:说我是周总理养子?这话其实不准确

李鹏晚年亲口澄清身世:说我是周总理养子?这话其实不准确

老杉说历史
2026-03-21 16:56:05
浙江一公路自行车赛发生大面积摔车事件,组委会医疗联系人:擦伤撞伤人数确实多,但仅极个别送医

浙江一公路自行车赛发生大面积摔车事件,组委会医疗联系人:擦伤撞伤人数确实多,但仅极个别送医

极目新闻
2026-03-30 17:14:00
霍尔木兹一封,最难熬的是越南!15天储备可能耗光,工厂可能停工

霍尔木兹一封,最难熬的是越南!15天储备可能耗光,工厂可能停工

鉴史录
2026-03-31 00:31:01
美说中国有1300枚中程导弹,伊朗一月就打出1800枚,笑而不语了

美说中国有1300枚中程导弹,伊朗一月就打出1800枚,笑而不语了

世家宝
2026-03-30 17:35:12
一夜暴跌25%!小马哥最怕的事还是发生了:年轻人正在从腾讯溜走

一夜暴跌25%!小马哥最怕的事还是发生了:年轻人正在从腾讯溜走

潮鹿逐梦
2026-03-21 11:54:42
吉林男子吃霸王餐后续!对着警察放狠话,正脸曝光,被拘只是开始

吉林男子吃霸王餐后续!对着警察放狠话,正脸曝光,被拘只是开始

奇思妙想草叶君
2026-03-30 17:09:56
只有医生才敢说的,糖尿病4大谣言,很多人被坑了,快看你...

只有医生才敢说的,糖尿病4大谣言,很多人被坑了,快看你...

袁医生课堂
2026-03-30 20:04:14
多多:总喊内马尔回巴西队的人,根本没看他现在踢成什么样

多多:总喊内马尔回巴西队的人,根本没看他现在踢成什么样

懂球帝
2026-03-30 14:17:08
许家印最后防线崩塌!高院下死命令:20日不交钱就彻底禁言!

许家印最后防线崩塌!高院下死命令:20日不交钱就彻底禁言!

历史伟人录
2026-03-30 18:00:12
伊朗战争背后有个终极之问:谁在掏空西方文明?

伊朗战争背后有个终极之问:谁在掏空西方文明?

观察者网
2026-03-30 13:10:11
2026-03-31 08:47:00
驱动中国 incentive-icons
驱动中国
国内知名的IT专业站点
93957文章数 138613关注度
往期回顾 全部

科技要闻

尚未正式宣发,国行苹果AI半夜"意外闪现"

头条要闻

牛弹琴:中东新的大麻烦来了 特朗普又盯上了新目标

头条要闻

牛弹琴:中东新的大麻烦来了 特朗普又盯上了新目标

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

全红婵聊到体重哭了,每天只吃一顿饭

财经要闻

助贷被约谈背后:谁在「吞噬」你的借款?

汽车要闻

限时12.58万起 银河星耀8远航家系列上市

态度原创

家居
本地
时尚
教育
公开课

家居要闻

东方法式美学 现代简约

本地新闻

用Color Walk的方式解锁城市春日

妈妈们的人生,不该只有一个选项

教育要闻

“伪热门”专业,90%家长都踩坑了!(二)法学专业#新学期超给力

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版