网易首页 > 网易号 > 正文 申请入驻

通过AMD锐龙AI 300系列处理器解锁消费级大语言模型巅峰性能

0
分享至

自GPT-2以来,语言模型已经取得了长足的进步,用户现在可以通过LM Studio等用户友好的应用程序快速轻松地部署高度复杂的大语言模型(LLM)。通过和AMD协作,这些工具致力于使每个人都可以使用AI,而不需要编码或技术知识。

llama.cpp和LM Studio概述

LM Studio基于llama.cpp项目,是当前非常流行的快速部署语言模型的框架。它没有依赖性,可以仅使用CPU进行加速——尽管它也有GPU加速功能。LM Studio使用AVX2指令来加速基于x86的CPU的现代大语言模型。

性能对比:吞吐量和延迟

AMD锐龙AI为这些最先进的工作负载进行加速,并在基于llama.cpp的应用程序(如用于x86笔记本电脑的LM Studio)中提供了领先的性能。值得注意的是,大语言模型通常对内存速度非常敏感。

在我们的对比测试中,英特尔笔记本电脑的RAM实际上更快,达到8533MT/s,AMD笔记本电脑的RAM为7500MT/s。尽管如此,AMD锐龙AI 9 HX 375处理器每秒token生成速度却比竞争对手快出27%。

参考信息:每秒token生成量或tk/s表示一个大语言模型(LLM)能够以多快的速度输出token(大致对应于每秒在电脑屏幕上显示的单词数)。】

AMD锐龙AI 9 HX 375处理器可以在Meta Llama 3.2 1b Instruct(4-bit量化)中实现每秒高达50.7个token的性能。

对大型语言模型进行基准测试的另一个指标是“输出首个token的时间”,它测量了从您提交提示到模型开始生成token所需时间之间的延迟。在这里,我们看到,在较大的模型中,基于AMD“Zen 5” 架构的锐龙AI HX 375处理器比竞争对手的同类处理器快3.5倍。

在Windows中使用可变显存(VGM)来加快模型吞吐量

AMD锐龙AI CPU中的三个加速器都有自己的工作负载专业化和它们擅长的场景。AMD基于XDNA 2架构的NPU在运行Copilot+工作负载时为持续的AI功能提供了令人难以置信的能效,CPU为工具和框架提供了广泛的覆盖范围和兼容性,而iGPU通常按需处理AI任务。

LM Studio提供了一个llama.cpp端口,可以使用与供应商无关的Vulkan API来加速框架。这里的加速通常取决于硬件功能和Vulkan API的驱动程序优化。与仅使用CPU模式相比,在LM Studio中打开GPU offload 后Meta Llama 3.2 1b Instruct的性能平均提升可达31%。Mistral Nemo 2407 12b Instruct这样的大型模型在token生成阶段由于受到带宽限制,平均提升可达5.1%。

我们观察到,当在LM Studio中使用基于Vulkan的llama.cpp版本并打开GPU offload时,与仅使用CPU的模式相比,竞争对手的处理器在除一个模型外的所有测试模型中的平均性能都明显较低。因此,为了保持对比测试的公平性,我们没有将英特尔酷睿Ultra7 258v在LM Studio中使用基于Vulkan的Llama.cpp的GPU offload性能纳入对比过程。

AMD锐龙AI 300系列处理器还包括一个名为可变显存(VGM)的功能。通常,程序将利用iGPU的512MB专用分配内存块以及位于系统RAM“共享”部分的第二个内存块。VGM允许用户将512MB专用分配块扩展到高达75%的可用系统RAM容量。这种连续内存分配显著提高了内存敏感型应用程序的吞吐量。

开启VGM(16GB)后,我们看到Meta Llama 3.2 1b Instruct的性能平均提升了22%与使用iGPU加速和VGM相结合时的CPU模式相比,平均速度总共提高了60%。即使是更大的模型,如Mistral Nemo 2407 12b Instruct,与仅使用CPU的模式相比,性能也提升了17%。

对比:Mistral 7b Instruct 0.3

虽然竞争对手的笔记本电脑在LM Studio中使用基于Vulkan的Llama.cpp版本没有提供加速,但我们使用英特尔AI Playground应用程序(基于IPEX-LLM和Lang Chain)比较了iGPU性能,力求在最佳的用户友好型LLM体验之间进行公平的比较。

我们使用了英特尔AI Playground提供的模型,即Mistral 7b Instruct v0.3和Microsoft Phi 3.1 Mini Instruct。在LM Studio中使用可比的量化后,我们发现AMD锐龙AI 9 HX 375在Phi 3.1中的速度相比竞争对手快了8.7%,在Mistral 7b Instruct 0.3中的速度相比对手快了13%。

AMD致力于推进AI前沿技术的发展,让每个人都能使用AI,但如果最新的AI成果被技术或编码技能等高门槛所限制,那这一切就不可能发生——这就是LM Studio这样的应用程序的重要性所在。除了作为在本地部署LLM的一种快速而轻松的方式之外,这些应用程序允许用户在第一时间体验最先进的模型(前提是llama.cpp项目支持该架构)。

AMD锐龙AI加速器提供了令人难以置信的性能,启用可变显存(VGM)等功能可以为AI用例提供更好的性能。所有这些结合在一起,为x86笔记本电脑上的语言模型提供了令人难以置信的用户体验。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广东被江苏绝杀!首发全崩,4替补死顶,崔永熙无地位!

广东被江苏绝杀!首发全崩,4替补死顶,崔永熙无地位!

篮球资讯达人
2026-03-20 21:33:01
英格兰大名单:凯恩领衔,萨卡、福登在列,马奎尔、梅努入选

英格兰大名单:凯恩领衔,萨卡、福登在列,马奎尔、梅努入选

懂球帝
2026-03-20 18:19:50
吃完香椿炒鸡蛋后,男子多器官衰竭!这起悲剧,给所有人敲响警钟

吃完香椿炒鸡蛋后,男子多器官衰竭!这起悲剧,给所有人敲响警钟

DrX说
2026-03-20 14:00:07
邯郸三姐妹上坟被炸死后续!家属发声,怀疑有共犯,被死亡威胁

邯郸三姐妹上坟被炸死后续!家属发声,怀疑有共犯,被死亡威胁

180视角
2026-03-20 14:24:32
五年一次的代表直选,越南下定决心把立法权还给人民

五年一次的代表直选,越南下定决心把立法权还给人民

作家加野
2026-03-20 13:21:46
AI不会拯救平庸,只会放大差距!这代人该学什么?

AI不会拯救平庸,只会放大差距!这代人该学什么?

智谷趋势
2026-03-20 19:18:45
游资大佬集体发文投降!

游资大佬集体发文投降!

新浪财经
2026-03-20 16:06:40
霍尔木兹危机加剧:美军酝酿夺岛 六国紧急出手

霍尔木兹危机加剧:美军酝酿夺岛 六国紧急出手

上游新闻
2026-03-20 12:18:04
蒋介石未必是位合格的领导,但追随他到底的将领,大多能安享晚年

蒋介石未必是位合格的领导,但追随他到底的将领,大多能安享晚年

小院之观
2026-03-20 08:00:12
绝望!伊朗地下基地被炸塌,大批官兵活活闷死,最后时刻只剩哀歌

绝望!伊朗地下基地被炸塌,大批官兵活活闷死,最后时刻只剩哀歌

老马拉车莫少装
2026-03-20 21:06:13
52岁中国女游客在泰国射击场中弹,系工作人员因个人操作导致枪支走火!总领馆:受伤情况严重正在治疗

52岁中国女游客在泰国射击场中弹,系工作人员因个人操作导致枪支走火!总领馆:受伤情况严重正在治疗

大象新闻
2026-03-20 14:44:08
5分钟开通国家免费电视!不用机顶盒、不连网,永久免费

5分钟开通国家免费电视!不用机顶盒、不连网,永久免费

叮当当科技
2026-03-20 03:29:51
上交所受理宇树科技股份有限公司科创板IPO申请

上交所受理宇树科技股份有限公司科创板IPO申请

界面新闻
2026-03-20 17:30:47
胆子太大了!俄罗斯大V公开炮轰总统,乌军3月收复770平方公里

胆子太大了!俄罗斯大V公开炮轰总统,乌军3月收复770平方公里

史政先锋
2026-03-20 18:58:01
伊朗称击中美军F-35战机释放何信号,专家分析→

伊朗称击中美军F-35战机释放何信号,专家分析→

极目新闻
2026-03-20 17:09:34
含剧毒,无解药,这种东西不能吃,加热120也没用,已有人中招!

含剧毒,无解药,这种东西不能吃,加热120也没用,已有人中招!

离离言几许
2026-03-19 11:55:12
以军称伊朗“动员穷人组织”情报部门负责人已身亡

以军称伊朗“动员穷人组织”情报部门负责人已身亡

新华社
2026-03-20 21:10:07
4S店卖一辆亏一辆?杭州经销商:一辆官方指导价12.59万元的车,成交价已击穿8.4万元

4S店卖一辆亏一辆?杭州经销商:一辆官方指导价12.59万元的车,成交价已击穿8.4万元

都市快报橙柿互动
2026-03-20 19:36:04
女子举报重庆市民政局一干部母亲名下有巨额财产,法院判举报人全网道歉,纪检监察部门已介入

女子举报重庆市民政局一干部母亲名下有巨额财产,法院判举报人全网道歉,纪检监察部门已介入

极目新闻
2026-03-20 17:51:29
理想本轮战略与组织调整接近尾声,将迎战新产品周期

理想本轮战略与组织调整接近尾声,将迎战新产品周期

晚点LatePost
2026-03-20 11:07:40
2026-03-20 22:40:49
中关村在线 incentive-icons
中关村在线
中关村在线全球第一科技门户
382389文章数 875127关注度
往期回顾 全部

数码要闻

MacBook Neo成功吸引Windows用户转投 苹果迎来史上最佳上市首周

头条要闻

高市和特朗普会谈午饭都没吃 称就敏感话题进行"沟通"

头条要闻

高市和特朗普会谈午饭都没吃 称就敏感话题进行"沟通"

体育要闻

6年前的一场悲剧,造就了“法国瓦尔迪”

娱乐要闻

总台首届电影盛典,“沈马”CP再合体

财经要闻

金融法草案向社会公开征求意见

科技要闻

新SU7只涨4千!雷军:真怕交车慢挨骂

汽车要闻

何小鹏坦白局:每月3亿的“慌”与通向L4的坚定

态度原创

游戏
旅游
本地
时尚
公开课

韩媒反复验货《红沙》最终给8.3分 点评一针见血!

旅游要闻

视频|上海迪士尼十周年庆典今起开幕!跟记者一起感受奇妙欢庆

本地新闻

春色满城关不住|绍兴春日顶流,这片樱花海藏不住了

推广中奖名单-更新至2026年3月4日推广

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版