网易首页 > 网易科技 > 网易科技 > 正文

讯飞星火X1升级突破:推理性能比肩全球一流水平

0
分享至

4月20日,科大讯飞深度推理大模型——讯飞星火X1迎来全新升级;讯飞方面表示,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1。

讯飞方面表示,星火X1除了在常见通用任务取得显著进步之外,由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,在教育、医疗、司法等领域表现明显。

面向企业和广大开发者,讯飞星火X1首发“快思考、慢思考统一模型”,全新升级模型定制优化工具链,进一步降低大模型私有化部署和定制门槛;同时,讯飞星火X1 API已上线讯飞开放平台开放服务,作为首个支持全国产算力微调的推理大模型,讯飞星辰MaaS平台同步上线了星火X1微调服务。

据讯飞方面表示,升级后的星火X1在多个任务上效果继续突破,展现出优异的性能,根据最新测试集评测结果,星火X1在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1,在数学、知识问答等方面表现突出。

数学答题和复杂的数理逻辑推理方面,星火X1能够准确识别出复杂的数学公式,不仅给出完整的解题思路,输出结果也严谨清晰;在逻辑推理时全方位思考,思考可能出现的每一种假设,表现出更强的严谨性和准确性。代码能力上,星火X1不仅提高了代码生成的准确率,对生成代码逻辑理解也进一步提升,能够应对更复杂的编程需求,思考问题的多种可能性,帮助开发者快速实现功能。在语言理解方面,模型输出内容、格式更加符合用户指令要求,能够给到更加准确且深度思考的结果,生成内容更加连贯、准确。

此外,星火X1的长思维链能力支持图像输入,可以对输入的图像进行关联思考,对于图像中的多种复杂元素,探究可能的含义和目的,进行更深层次的信息整合和推理。

本次星火X1升级不仅提升了通用能力,也同步增强了面向行业的解决方案能力;以司法行业为例,对于行业专业需求,例如根据材料总结案件事实以及判决理由,升级后的星火X1能够精准把握用户指令,详细分析争议点,快速定位关键信息,并输出准确内容,为行业用户提供专业、可靠的智能支持。

在技术创新和模型部署方面,星火X1首发“快思考、慢思考统一模型”,由一个模型同时支持两种思考模式,提升了模型处理不同复杂度任务的能力,满血版星火X1仅需4张卡(华为910B)即可部署,简化了私有化部署流程。

同时,星火X1还全新升级了模型定制优化工具链,支持SFT(监督微调)、强化学习两种模型定制优化方案,只需16张卡(华为910B)即可完成行业定制优化,有效降低了企业AI的定制门槛。

讯飞星火X1的全新升级背后,是一系列独特的技术创新与理念突破。

首先,提出基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性;同时提出强化学习动态更新算法,基于样本采样长度动态调整强化学习更新速度,进一步提升深度思考强化学习效率及效果。

其次,统一模型下的快慢思考混合训练方法,充分发挥快慢思考数据相互促进作用,实现基于系统指令控制模型是否深度思考,支撑下游更高效便捷地部署使用;

第三,实现多项工程技术创新,显存动态卸载技术大幅提升长文本推理并发、训推共卡协同实现高效训推资源转换、推理引擎冬眠机制实现快速拉起和恢复,实现国产算力平台上高效和稳定的强化学习训练全流程。

讯飞表示,在中美科技竞争日趋激烈的背景下,星火X1选择的全国产化技术路径更具深远意义。最近,科大讯飞与华为昇腾联合团队在前期工作基础上再获突破,升级MoE模型的PD分离+大规模专家并行系统方案,实现了集群推理性能翻番,包括PD分离部署提升20%+性能、MTP多token预测技术提升30%+整体性能、专家负载均衡算法优化使集群吞吐提升30%+,以及异步双发射技术降低服务请求调度耗时提升10%系统性能。(平章)

延伸阅读
相关推荐
热点推荐
刘晓庆意外摔倒、分不清人、目光呆滞,75岁不服老不行啊

刘晓庆意外摔倒、分不清人、目光呆滞,75岁不服老不行啊

娱乐小丸子
2025-12-03 10:11:41
王励勤受夹板气!国际乒联主席成功甩锅,可能有计谋大师幕后支招

王励勤受夹板气!国际乒联主席成功甩锅,可能有计谋大师幕后支招

三十年莱斯特城球迷
2025-12-18 16:44:53
再等5天上市!全球销量冠军,尺寸加长,内饰全面焕新,续航达1000km

再等5天上市!全球销量冠军,尺寸加长,内饰全面焕新,续航达1000km

隔壁说车老王
2025-12-16 21:05:06
“4斤黄金凤冠被毁”大反转,千万级网红天塌了!

“4斤黄金凤冠被毁”大反转,千万级网红天塌了!

广告案例精选
2025-12-16 11:07:45
单亲妈妈深夜家中惨遭勒死,失语儿子却抱住警察:爸爸,你别装了

单亲妈妈深夜家中惨遭勒死,失语儿子却抱住警察:爸爸,你别装了

罪案洞察者
2025-12-18 13:53:20
日本美女主播闪婚小泉进次郎,身材火辣颜值高,不雅视频引爆全网

日本美女主播闪婚小泉进次郎,身材火辣颜值高,不雅视频引爆全网

来科点谱
2025-12-18 09:00:07
华山航拍惊现“断柱”:拜了千年的山,可能是上古神话案发现场?

华山航拍惊现“断柱”:拜了千年的山,可能是上古神话案发现场?

诗意世界
2025-12-17 08:00:03
高市早苗连续2天喊话中国,承认自己该反思,希望与中方高层对话

高市早苗连续2天喊话中国,承认自己该反思,希望与中方高层对话

南宫一二
2025-12-18 13:20:50
卷走53亿!又一大佬带全家跑路,欠中国银行20亿,投资者血本无归

卷走53亿!又一大佬带全家跑路,欠中国银行20亿,投资者血本无归

以茶带书
2025-12-09 23:33:58
一夜两场大败!夺冠热门惨遭3连败,沈梓捷伤情出炉,北控遭重创

一夜两场大败!夺冠热门惨遭3连败,沈梓捷伤情出炉,北控遭重创

老吴说体育
2025-12-19 00:23:19
家道中落是啥感受?网友:吃了时代的红利守不住而已

家道中落是啥感受?网友:吃了时代的红利守不住而已

带你感受人间冷暖
2025-12-09 00:20:05
飘飘然后两连败一一说的是CBA浙江稠州队

飘飘然后两连败一一说的是CBA浙江稠州队

大眼瞄世界
2025-12-17 23:55:11
二手房全线下跌!贝壳挂牌量高达650万套房子,房子太多太多了

二手房全线下跌!贝壳挂牌量高达650万套房子,房子太多太多了

小星球探索
2025-12-16 12:53:59
黎智英刚被定罪,不到48小时,G7外长发布声明,要求中方立即放人

黎智英刚被定罪,不到48小时,G7外长发布声明,要求中方立即放人

临云史策
2025-12-18 21:10:28
曝双顶流疑似恋情!歌手演员跨圈结缘,同款代言、探班被扒太好嗑

曝双顶流疑似恋情!歌手演员跨圈结缘,同款代言、探班被扒太好嗑

观察者小海风
2025-12-16 15:12:52
憋屈!中国唯一沦为三线的万亿城市,又被降级了

憋屈!中国唯一沦为三线的万亿城市,又被降级了

前瞻网
2025-11-26 09:26:44
确认!美女网红半藏森林去某互联网公司做产品经理了

确认!美女网红半藏森林去某互联网公司做产品经理了

超角度
2025-12-18 14:13:27
中国已经提前准备好,开战后的第一件事,就是废掉美国的“星链”

中国已经提前准备好,开战后的第一件事,就是废掉美国的“星链”

桑启红原
2025-12-18 11:53:14
2019年,被“港独”暴徒围攻,被迫举枪的光头警长,后来怎样了?

2019年,被“港独”暴徒围攻,被迫举枪的光头警长,后来怎样了?

知鉴明史
2025-12-18 18:21:51
当听泉鉴宝直播的“博物馆一件,我一件”玩笑话成为现实

当听泉鉴宝直播的“博物馆一件,我一件”玩笑话成为现实

总在茶余后
2025-12-18 06:00:09
2025-12-19 02:43:00

科技要闻

2025新一代人工智能创业大赛总决赛收官

头条要闻

在野党参议员问了句日本"存亡危机" 高市早苗瞬间冷脸

头条要闻

在野党参议员问了句日本"存亡危机" 高市早苗瞬间冷脸

体育要闻

纽约尼克斯,板正的球队

娱乐要闻

丝芭放大招了!实名举报鞠婧祎经济犯罪

财经要闻

尹艳林:呼吁加快2.5亿新市民落户进程

汽车要闻

在零下30℃的考场里 凡尔赛C5 X和508L拿到了"稳"的证明

态度原创

本地
家居
数码
旅游
公开课

本地新闻

云游安徽|决战烽火照古今,千秋一脉看宿州

家居要闻

高端私宅 理想隐居圣地

数码要闻

LG新一代车用屏下摄像头将亮相CES 2026,画质达非屏下产品99%

旅游要闻

治愈冬日 emo!沈阳北陵红灯笼长廊 + 树挂奇观,随手拍都是大片

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×