网易首页 > 网易号 > 正文 申请入驻

在富岳超算上训练大模型

0
分享至

点击这里关注我,记得标星哦~

尽管富士通的富岳超级计算机不再是超级计算机 500强名单中世界上最快的机器,但它仍然是一个非常强大的系统, 采用 ARM 指令集的 A64FX处理器的多功能性允许将其用于各种工作负载,例如AI。

本周,富士通发布了Fugaku-LLM,这是一个具有高级日语处理能力的大型语言模型,专为研究和商业应用而设计。

富士通的Fugaku-LLM在Fugaku超级计算机的13,824个节点上使用3800亿个Token进行训练,该超级计算机基于A64FX处理器,支持FP64、FP32、FP16和INT8模式,适用于各种AI和传统超级计算机应用。Fugaku-LLM的训练自然而然地利用了针对超级计算机架构和 Tofu 互连D 进行优化的分布式并行学习技术。

Fugaku-LLM具有130亿个参数,与GPT-4的1750亿个参数相比显得微不足道。富士通表示,130 亿参数的 LLM 不需要庞大的计算资源来进行推理,这对日本的企业和研究人员来说是最佳选择。约 60% 的训练数据是日语数据,40% 的数据是英语、数学和代码数据。

这种广泛的以日语为中心的训练使其有别于其他主要在英语数据集上训练的日语模型。因此,Fugaku-LLM拥有卓越的日语水平,在日语MT-Bench上获得了5.5的平均分,这是使用日本原始数据训练的公开可用模型中的最高分。根据富士通的数据,它在人文和社会科学方面尤其出色,取得了令人印象深刻的 9.18 分的基准分数。

Fugaku-LLM计划是由东京工业大学、东北大学、富士通株式会社、RIKEN、名古屋大学、CyberAgent和Kotoba Technologies等日本领先机构之间的合作推动的。他们合作的原因之一是通常用于训练和推理 AI 模型的 GPU 短缺。另一个原因是,该模型可以与富士通的下一代 150 核 Monaka 数据中心 CPU 一起使用,该 CPU 针对 AI 和 HPC 工作负载进行了优化。

Fugaku-LLM现在可以在GitHub和Hugging Face的指定许可条款下用于学术和商业目的。此外,它还将从2024年5月10日起通过富士通研究门户网站提供。

报名倒计时:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
惨烈的晋粤大战!激战85分钟,多人吃T,半场33犯45罚,人仰马翻

惨烈的晋粤大战!激战85分钟,多人吃T,半场33犯45罚,人仰马翻

后仰大风车
2024-12-03 21:02:53
纽约时报分析:中国是如何成为世界最大汽车出口国的

纽约时报分析:中国是如何成为世界最大汽车出口国的

小星球探索
2024-12-03 17:42:26
19岁机车网红“DJ万小橘”车祸去世,现场画面曝光,去年刚拿驾照

19岁机车网红“DJ万小橘”车祸去世,现场画面曝光,去年刚拿驾照

180°视角
2024-12-03 18:07:05
曝黄晓明分手内情,叶珂甩的黄晓明,闺蜜透露两人不止一个孩子

曝黄晓明分手内情,叶珂甩的黄晓明,闺蜜透露两人不止一个孩子

180°视角
2024-12-03 15:10:42
网传四川一高校硕士就业率仅为26.98%,博士就业率0,老师急了

网传四川一高校硕士就业率仅为26.98%,博士就业率0,老师急了

火山诗话
2024-12-03 05:54:22
台大学生抗议陆生访问团,叫嚣这里不是中国台北,马英九出手反击

台大学生抗议陆生访问团,叫嚣这里不是中国台北,马英九出手反击

北咊极生活
2024-12-03 14:57:05
辣眼睛!网传上海一女子发朋友圈曝光丈夫出轨细节,内容不堪入目

辣眼睛!网传上海一女子发朋友圈曝光丈夫出轨细节,内容不堪入目

火山诗话
2024-12-02 21:23:40
香港某书店印“女子牵着龙”图案,被质疑辱华,网友:那倚天屠龙记怎么解释?

香港某书店印“女子牵着龙”图案,被质疑辱华,网友:那倚天屠龙记怎么解释?

小萝卜丝
2024-12-03 18:04:50
女子炫耀买手机政府补贴1500,网友泼冷水:不补贴也比这价便宜

女子炫耀买手机政府补贴1500,网友泼冷水:不补贴也比这价便宜

映射生活的身影
2024-12-03 14:42:24
高善文:2025年可能成为经济下滑转向更弱增长的转折点

高善文:2025年可能成为经济下滑转向更弱增长的转折点

投资作业本Pro
2024-12-03 13:51:29
2025春晚官宣:混子演员贾冰之流被抵制,赵本山、宋丹丹呼声最高

2025春晚官宣:混子演员贾冰之流被抵制,赵本山、宋丹丹呼声最高

橘子大娱社
2024-12-02 21:45:03
19岁美女网红突然死亡,目击者:尿失禁,黑历史一箩筐

19岁美女网红突然死亡,目击者:尿失禁,黑历史一箩筐

温柔看世界
2024-12-03 21:18:28
最新 | 天津“小升初”不摇号了?市教委回应!

最新 | 天津“小升初”不摇号了?市教委回应!

天津广播
2024-12-02 12:11:08
三大消息:朝鲜下最后通牒,不许大陆收台?普京的警告不留情面!

三大消息:朝鲜下最后通牒,不许大陆收台?普京的警告不留情面!

猫眼观史
2024-12-01 14:05:19
中国再破世界第一!化学合成粮食即将量产,不用种地粮食自由了!

中国再破世界第一!化学合成粮食即将量产,不用种地粮食自由了!

清风游史
2024-12-02 10:58:42
拜登特赦的大儿子,犯罪调查报告多达644页,光性犯罪就191起

拜登特赦的大儿子,犯罪调查报告多达644页,光性犯罪就191起

小星球探索
2024-12-02 22:04:56
中东速递:美军下场,叙利亚政府军蜂拥投降

中东速递:美军下场,叙利亚政府军蜂拥投降

西楼饮月
2024-12-03 22:30:29
韩国出大事了,总统和国会闹起来了,总统宣布紧急戒严

韩国出大事了,总统和国会闹起来了,总统宣布紧急戒严

金召点评
2024-12-03 22:41:35
泪目跟队:谢场最后大家喊奥斯卡与巴尔加斯留下,奥斯卡哭了

泪目跟队:谢场最后大家喊奥斯卡与巴尔加斯留下,奥斯卡哭了

直播吧
2024-12-03 22:25:35
原来“0添加”是这个意思,中国文字博大精深啊,字里行间都是戏

原来“0添加”是这个意思,中国文字博大精深啊,字里行间都是戏

知鉴明史
2024-12-03 16:58:21
2024-12-03 23:56:49
EETOP半导体社区
EETOP半导体社区
国内著名的电子工程师社区
5411文章数 15317关注度
往期回顾 全部

科技要闻

美国芯片慎用!中国四大行业协会发声

头条要闻

美方称新冠病毒很可能是从中国实验室泄漏的 中方回应

头条要闻

美方称新冠病毒很可能是从中国实验室泄漏的 中方回应

体育要闻

特鲁姆普:我还是从前那个少年

娱乐要闻

50岁林志玲生日晒娃引热议

财经要闻

梁建章:建议对生孩子家庭发10万元

汽车要闻

标配Lion5.0科技座舱 风云A8L将于12月17日上市

态度原创

亲子
数码
时尚
艺术
军事航空

亲子要闻

网友晒出萌娃一到十一月的视频,希望萌娃十二月有更好的故事

数码要闻

传小米明年发布新款OLED安卓平板 OLED笔电正在调研

星N代赶超贵族后裔,巴黎名媛舞会降级了?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

军事要闻

古特雷斯就叙利亚局势发表声明

无障碍浏览 进入关怀版