网易首页 > 网易号 > 正文 申请入驻

微软发布最轻量级大语言模型!可在CPU上高效运行

0
分享至

微软研究人员刚刚创建了 BitNet b1.58 2B4T,这是一个开源的 1 比特大语言模型(LLM),拥有 20 亿个参数,在 4 万亿个词元上进行了训练。但这个人工智能模型的独特之处在于它足够轻量,可以在中央处理器(CPU)上高效运行,《科技创业》杂志称苹果 M2 芯片就能运行它。该模型在 Hugging Face 平台上也可轻易获取,任何人都能对其进行测试。

Bitnet 使用 1 比特权重,只有三种可能的值:-1、0 和 + 1 —— 从技术上讲,由于支持三种值,它是一个 “1.58 比特模型” 。与采用 32 比特或 16 比特浮点格式的主流人工智能模型相比,这节省了大量内存,使其运行效率更高,对内存和计算能力的需求也更低。不过,Bitnet 的简单性也有一个缺点 —— 与更大的人工智能模型相比,它的准确性较差。然而,BitNet b1.58 2B4T 凭借其庞大的训练数据弥补了这一点,据估计这些数据相当于 3300 多万本书。

这个轻量级模型背后的团队将其与领先的主流模型进行了对比,包括 Meta 的 LLaMa 3.2 1B、谷歌的 Gemma 3 1B 和阿里巴巴的 Qwen 2.5 1.5B。在大多数测试中,BitNet b1.58 2B4T 与这些模型相比得分相对较高,甚至在一些基准测试中名列前茅。更重要的是,它在非嵌入式内存中仅占用 400MB,不到第二小的模型(Gemma 3 1B,占用 1.4GB)的 30% 。

然而,这个大语言模型必须使用 bitnet.cpp 推理框架才能如此高效地运行。该团队特别指出,“在使用标准的 Transformer 库时,即使是经过必要修改的版本,这个模型也无法获得性能效率提升” 。

如果你想在轻量级硬件上利用它的优势,就需要获取 GitHub 上提供的该框架。该代码库称 bitnet.cpp 提供了 “一套经过优化的内核,支持在 CPU 上对 1.58 比特模型进行快速无损推理(接下来还将支持神经网络处理器和图形处理器)” 。虽然目前它还不支持人工智能专用硬件,但它仍能让任何拥有电脑的人在无需昂贵组件的情况下进行人工智能实验。

人工智能模型常常因训练和运行时能耗过高而受到批评。但像 BitNet b1.58 2B4T 这样的轻量级大语言模型可以帮助我们在性能较弱的硬件上本地运行人工智能模型。这可以减少我们对大型数据中心的依赖,甚至能让那些没有配备内置神经网络处理器的最新处理器以及最强大图形处理器的人也能使用人工智能。

不记名!有奖问卷调查

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
56岁男子因苯磺酸氨氯地平入院走了,医生劝告:6用药细节别忽视

56岁男子因苯磺酸氨氯地平入院走了,医生劝告:6用药细节别忽视

荆医生科普
2026-05-18 17:37:39
恩德里克:感谢上帝,让我们一起为巴西全力以赴

恩德里克:感谢上帝,让我们一起为巴西全力以赴

懂球帝
2026-05-19 06:32:13
蒋介石盯毛泽东照片半天,突然问:他衣服故意做旧?身边人不敢答

蒋介石盯毛泽东照片半天,突然问:他衣服故意做旧?身边人不敢答

鉴史录
2026-05-18 11:03:17
内维尔:这个时候传出瓜迪奥拉离任我很震惊,曼城全队会很失望

内维尔:这个时候传出瓜迪奥拉离任我很震惊,曼城全队会很失望

懂球帝
2026-05-19 10:14:26
“你的5000美元,已长成浩瀚绿洲!”

“你的5000美元,已长成浩瀚绿洲!”

新浪财经
2026-05-19 06:51:47
两架美国电子战飞机碰撞坠落,损失有多大?为何在空中互相卡住?

两架美国电子战飞机碰撞坠落,损失有多大?为何在空中互相卡住?

上观新闻
2026-05-19 10:02:14
越来越多的县城,只剩下体制内经济了!

越来越多的县城,只剩下体制内经济了!

黯泉
2026-05-13 11:15:55
美军正式确认:至少200架B-21轰炸机,才能对付中国

美军正式确认:至少200架B-21轰炸机,才能对付中国

混沌录
2026-05-18 23:16:50
为什么欧美人不炒菜,只有中国有?美国教授:中国活在原始时代

为什么欧美人不炒菜,只有中国有?美国教授:中国活在原始时代

抽象派大师
2026-05-17 02:08:19
消失的“幽灵鱼”回归长江!禁渔五年见真章,母亲河上演鱼跃龙门

消失的“幽灵鱼”回归长江!禁渔五年见真章,母亲河上演鱼跃龙门

向航说
2026-05-19 00:50:03
“杀他全家也不解恨”,讨薪1560元20次遭拒,农民工怒杀老板全家

“杀他全家也不解恨”,讨薪1560元20次遭拒,农民工怒杀老板全家

易玄
2026-05-12 18:58:46
“不漏一户、不落一人”!广西自治区主席视频连线调度地震现场情况,督导抗震救灾工作

“不漏一户、不落一人”!广西自治区主席视频连线调度地震现场情况,督导抗震救灾工作

极目新闻
2026-05-19 12:41:42
国乒集体退赛,WTT新赛今晚开战,劲敌齐聚

国乒集体退赛,WTT新赛今晚开战,劲敌齐聚

小驿拍客在北漂
2026-05-19 11:02:07
摧毁MVP领奖夜,文班轰41+24创历史之最!一战包揽8大纪录完胜SGA

摧毁MVP领奖夜,文班轰41+24创历史之最!一战包揽8大纪录完胜SGA

锅子篮球
2026-05-19 13:06:47
乘客要求网约车进车库接人,女司机当场取消订单,不给他投诉的机会

乘客要求网约车进车库接人,女司机当场取消订单,不给他投诉的机会

网约车观察室
2026-05-18 09:59:44
北京VS上海G3前瞻!后场延续火力,麦基减少持球,末节阵容强悍!

北京VS上海G3前瞻!后场延续火力,麦基减少持球,末节阵容强悍!

篮球资讯达人
2026-05-19 15:13:23
惊爆!蔡卓妍含泪控诉丈夫,新婚20天官宣分手,直言好聚好散

惊爆!蔡卓妍含泪控诉丈夫,新婚20天官宣分手,直言好聚好散

人间烟火记事本
2026-05-19 08:14:15
他接受纪律审查和监察调查

他接受纪律审查和监察调查

锡望
2026-05-18 11:57:24
缅北七年亲历者讲述:男女都会遭性侵,坐水牢放毒蛇,伤口撒辣椒

缅北七年亲历者讲述:男女都会遭性侵,坐水牢放毒蛇,伤口撒辣椒

今朝牛马
2026-02-06 17:57:17
手机集体大降价!记者实探郑州线下门店:苹果降价2000元销量暴增七倍,华为折叠屏手机最高降3000元,首次跌破万元,小米15系列线下已无货

手机集体大降价!记者实探郑州线下门店:苹果降价2000元销量暴增七倍,华为折叠屏手机最高降3000元,首次跌破万元,小米15系列线下已无货

极目新闻
2026-05-18 22:23:35
2026-05-19 17:27:00
EETOP半导体社区 incentive-icons
EETOP半导体社区
国内著名的电子工程师社区
7610文章数 15669关注度
往期回顾 全部

科技要闻

马斯克败诉,法院判他起诉OpenAI太晚了

头条要闻

4名男子赴泰国考察项目已失联半月 家属:人或在缅甸

头条要闻

4名男子赴泰国考察项目已失联半月 家属:人或在缅甸

体育要闻

文班亚马1比0雷霆:凌驾MVP的史诗价值

娱乐要闻

姚晨删博难平众怒,为什么她还能蹦哒

财经要闻

从卖流量到卖Token,运营商算力生意破局

汽车要闻

德味操控+聪明大脑,与众07不输新势力

态度原创

艺术
本地
游戏
时尚
公开课

艺术要闻

三影堂摄影艺术中心举办艺术家孙瑞祥个展

本地新闻

别搜晋江小说了,去看真的晋江

脱衣动作游戏《秋叶原之旅》15周年 销量破百万

休闲阔腿裤怎么穿才美?看看这些穿搭公式,解锁不重样的造型

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版