网易首页 > 网易号 > 正文 申请入驻

通义千问Qwen3系列最新大模型发布,记者实测:数学能力更出色

0
分享至

4月29日凌晨,阿里巴巴正式发布通义千问Qwen3系列模型,这一包含2个混合专家(MoE)模型与6个稠密模型的开源大模型家族,以突破性的架构设计、36万亿 token 的训练数据规模及多模态能力,吸引了一大拨开发者的关注。记者实测发现,Qwen3不仅在数学推理、代码生成等硬核领域表现惊艳,其 “思考模式” 与 “非思考模式” 的灵活切换,更能提升复杂任务的处理效率。

据官方技术文档显示,Qwen3系列模型采用混合专家架构与统一多模态编码体系。旗舰模型Qwen3-235B-A22B具备2350亿总参数量,通过MoE动态路由机制,实际激活参数仅220亿,显存占用仅为同性能模型的三分之一。

同时,Qwen3在多模态能力上,首次实现文本、图像、音频、视频的统一处理。例如,记者测试发现,当输入一张包含数学公式的图表时,模型不仅能精准解析公式含义,还能结合上下文推导出解题步骤。这种能力在教育、科研等领域具有广阔应用前景,可辅助论文写作、实验数据分析等场景。

目前,Qwen3已在Hugging Face、ModelScope等平台上线,GitHub星标数突破18.5k。

4月29日,记者实际体验了一下Qwen3模型,整体测试效果令人满意。

首先,在逆文本生成基准测试中,记者要求模型将“YZWB is testing Qwen3-235B-A22B” 这句话逐词反转。Qwen3-235B-A22B在非思考模式下仅用0.3秒输出“B22A-B532-n3newQ gnitset si BWZY”。

其次,记者实测发现Qwen3在数学能力表现相比之前更出色了,模型现在可以同时提供多种解题思路,输出结果也比较准确,展现了其强大的推理能力。而对此前网友向AI提出的“7米长的甘蔗如何通过2米高、1米宽的门”这一经典难题,Qwen3通过三维空间建模推导出“倾斜甘蔗使其对角线长度小于门的对角线(√(2²+1²)≈2.24米)”的方案。

最后,根据最新LiveCodeBench v5评测,Qwen3-235B-A22B以70.7分超越OpenAI Grok-3,记者实测其代码生成能力同样惊人。当要求模型“用 Python 编写一个实时监控服务器日志并发送异常报警的脚本” 时,模型在思考模式下输出了包含日志解析、阈值检测、邮件报警等模块的完整代码,并自动添加了错误处理和配置文件读取功能。

尽管Qwen3在众多基准测试中表现优异,然而记者实测发现Qwen3在处理复杂推理任务及稀疏知识域时仍存在显著局限——即"幻觉生成"现象。例如,记者在测试Qwen3的中文写作能力时,虽然能直观的感到模型对于文字的处理更加细腻、流畅,但生成的文本存在严重的逻辑断层与场景跳跃失控现象,呈现出拼贴画式的叙事结构。这种现象暴露出模型在处理低频知识域或进行多阶推理时,容易将训练数据中的碎片化知识进行错误关联重组,生成看似合理却违背现实的回答,这也是众多大语言模型在认知边界突破过程中面临的共性挑战。

校对 盛媛媛

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
三星堆竟不属于任何朝代?考古学家颤抖:中华文明源头要改写!

三星堆竟不属于任何朝代?考古学家颤抖:中华文明源头要改写!

抽象派大师
2026-05-19 00:44:23
解秀梅大胆拥抱毛主席,多年后吕厚民回忆称:主席可能被吓到了

解秀梅大胆拥抱毛主席,多年后吕厚民回忆称:主席可能被吓到了

春秋砚
2026-04-22 11:40:08
微软彻底犯众怒!Excel强制植入Copilot:无法关闭、遮挡数据、挡住滚动条

微软彻底犯众怒!Excel强制植入Copilot:无法关闭、遮挡数据、挡住滚动条

快科技
2026-05-18 12:17:11
嫁法国老头后瘫痪?42岁李宇春近况曝光,真相背后隐情惹人流泪

嫁法国老头后瘫痪?42岁李宇春近况曝光,真相背后隐情惹人流泪

借你一生
2026-05-15 19:25:13
柳州21小时两次5.2级震动华南,接下来还会有同样地震么?

柳州21小时两次5.2级震动华南,接下来还会有同样地震么?

王二哥老搞笑
2026-05-19 18:29:29
10亿欧豪阵!41岁C罗6战世界杯志在冲冠 詹俊:能进4强就很不错了

10亿欧豪阵!41岁C罗6战世界杯志在冲冠 詹俊:能进4强就很不错了

风过乡
2026-05-19 22:54:28
加速高血脂恶化的行为:米饭排第5,第1名很多人都没意识到

加速高血脂恶化的行为:米饭排第5,第1名很多人都没意识到

岐黄传人孙大夫
2026-05-19 22:30:03
流传绯闻22年,杨紫张一山终于正面回应,双方家长都见过了,真相让人意外

流传绯闻22年,杨紫张一山终于正面回应,双方家长都见过了,真相让人意外

情感大头说说
2026-05-18 06:36:51
俄最大炼油厂梁赞被炸成火海,乌军开始直接掐俄军“油管”

俄最大炼油厂梁赞被炸成火海,乌军开始直接掐俄军“油管”

桂系007
2026-05-15 21:59:39
采访了100个娶了小三的男人,他们几乎都说了同一句话,让人恍然

采访了100个娶了小三的男人,他们几乎都说了同一句话,让人恍然

千秋文化
2026-04-15 20:18:32
郭富城夫妇现身机场,没一起回港,郭富城看着方媛背影满是不舍

郭富城夫妇现身机场,没一起回港,郭富城看着方媛背影满是不舍

螃蟹吃瓜摊
2026-05-18 23:38:13
广东队三消息:徐昕被买断,麦考尔降薪,徐杰格局高

广东队三消息:徐昕被买断,麦考尔降薪,徐杰格局高

徐骧老表哥
2026-05-19 06:33:06
中超最新积分榜:成都蓉城爆冷落败,北京国安丢分,河南惊险绝杀

中超最新积分榜:成都蓉城爆冷落败,北京国安丢分,河南惊险绝杀

足球狗说
2026-05-19 22:13:02
刘建业:希望我们用高昂的斗志,为球迷奉献出一场精彩的比赛

刘建业:希望我们用高昂的斗志,为球迷奉献出一场精彩的比赛

懂球帝
2026-05-19 22:19:10
巨变!连伤4人超级黑马2连败,孙铭徽受伤被背下场,争冠悬了

巨变!连伤4人超级黑马2连败,孙铭徽受伤被背下场,争冠悬了

君笙的拂兮
2026-05-19 18:46:22
瓜迪奥拉确认季末告别曼城,十年“蓝月王朝”终迎谢幕

瓜迪奥拉确认季末告别曼城,十年“蓝月王朝”终迎谢幕

星耀国际足坛
2026-05-20 00:24:45
1600亿存储巨头开启IPO辅导,这些A股公司或受益(附股)

1600亿存储巨头开启IPO辅导,这些A股公司或受益(附股)

21世纪经济报道
2026-05-19 19:49:09
落槌!全部划归国资!追随许家印6年,江苏第一包工头赔得精光

落槌!全部划归国资!追随许家印6年,江苏第一包工头赔得精光

凡知
2026-02-24 12:16:24
为什么国家最高规格的宴会只选可口可乐?

为什么国家最高规格的宴会只选可口可乐?

流苏晚晴
2026-05-19 19:23:40
女子家里常年有臭味,找不到来源只好搬家,离开当天房东急了

女子家里常年有臭味,找不到来源只好搬家,离开当天房东急了

潮河讲堂
2025-07-10 17:53:45
2026-05-20 02:23:00
扬子晚报 incentive-icons
扬子晚报
《扬子晚报》为江苏省级报刊
41929文章数 58291关注度
往期回顾 全部

科技要闻

马斯克败诉,法院判他起诉OpenAI太晚了

头条要闻

媒体:特朗普为何抛涉台"四不"说法 鲁比奥解释清楚了

头条要闻

媒体:特朗普为何抛涉台"四不"说法 鲁比奥解释清楚了

体育要闻

文班亚马:没拿到MVP,就证明自己是MVP

娱乐要闻

姚晨删博难平众怒,为什么她还能蹦哒

财经要闻

洁丽雅硬刚豪门内斗传言

汽车要闻

焕新极氪009上市41.38万起 齐家版让MPV回归家庭

态度原创

时尚
手机
旅游
本地
公开课

57岁恶女出手整治浪姐,全网拍手叫好

手机要闻

澎湃OS 26谣言破灭,小米MIX Fold 5也已现身,下半年稳了!

旅游要闻

中国旅游日主会场广州启动!广东全力建设旅游友好型城市

本地新闻

别搜晋江小说了,去看真的晋江

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版