原视频:龙芯3A6000深度评测:国产CPU的希望之星? BV1Nu4m1K79M
省流:给BGA焊下来看针脚了,还是个ES版
南北桥结构,HT总线连接
开局讲龙芯历史,但是配图有BUG
当时量产型的龙芯2F长图上这个样子,现在鱼上随便几十块钱能买到的小盒子主机一体机拆开散热器大概率是右边的ST标
对龙芯过去使用意法半导体代工、使用MIPS指令集扩展LOONGISA这个历史的描述没有问题
然而对自主的描述这个参数有问题,3A5000 3A6000都是12nm的产品,如果看这张图就对不上了
图上居然还真标了国产12nm,也对,TSMC也算国产
还做了DIESHOT,不过这种打磨基本没啥分析价值,只能看个大概,因为腐蚀根本不分层是一次到底的,所以没法用于精确的对比
(所以中科海光和AMD ZEN1的DIESHOT对比姑且是咕了)
3A6000雀食有效降低了芯片的面积,主要依靠的是砍了很多过去服务器端的功能(多路CPU连接,ECC支持)
对于流水线宽度和同频性能(IPC)的关系并没有做过多的解释,同样的也没提到流水线长度对高频设计的关系。
简而言之,流水线越宽同频性能理论上就越强(但是同频功耗往往更高,同工艺也往往更难拉高频),流水线越长同样的工艺下就更容易拉高频但是同频性能会下降而且频率过高也容易大幅提高功耗而性能难以提升。
说12nm本质上是14nm这就有问题了,因为TSMC的12nm节点是16nm节点的shrink,并不是14nm节点的(麒麟710F TSMC 12nm换麒麟710A SMIC 14nm是要重做版图并降频的,并不是可互换的工艺)。
是的,龙芯使用AMD羿龙/推土机时代的HT3.0总线
华硕这款板子居然用了长鑫的颗粒,原来你也用DDR4
期待对这颗GPU的评测
这个显示在国产里面参数算是比较差的了,作为参考,兆芯的C960核显(2019)支持4K60输出
还真给这集显跑分了,看来大概是2013-15年的水平。
典中典的矿渣580,因为龙芯并没有N卡驱动,A卡也不能上新的,所以倒也表示理解,反正AMD也给GCN亮机卡应该送过审,甚至中科海光手里就有GCN的IP但是却没有出显卡而是做GPGPU。
这点也都交代了
这就有点扯了,N卡主要是不开源,因为N卡的偷U特性,很大程度上驱动因为涉及软件调度器所以开放源代码可以直接反推GPU的架构,所以根本没法开源。
(是的,这是能做到的,国产显卡里面就存在使用其他国产厂家源代码仿造显卡的先例)
龙芯内存兼容性差可能是IMC有问题也可能是BIOS有问题,之前垃圾佬的国产平台里面HP268就没啥问题基本上是内存就能点亮,很多兆芯寨板就不行。
紫光国芯这个玩意就不要看了,还不如整个华强北小作坊+福建晋华的条国产程度高。
之前隔壁UP@codeyuri 的视频《国产晋华DDR4颗粒全网首测》已经基本说明了紫光内存的情况
跑SPEC17了
不过这个描述又扯淡了,单核IPC代表架构设计水平是标准的龙芯圈的话术,因为龙芯相比鲲鹏兆芯飞腾的核心规模大流水线宽度更宽,因此同频性能更强,但是当时的鲲鹏920 兆芯KX6000 飞腾D2000都是小核心,很容易就能堆出来八核起步单SOCKET64核的规模,所以即使是图吧刚入门的小白都知道IPC只能代表同频性能水平和核心规模,代表不了什么架构设计水平。这句话我觉得绝对有充值的成分在里面。
至于绝对性能这句是没问题的,IPC再强双核打八核也打不了,G7400超冒烟了也不如N305。
短短两年时间这话听着也挺有意思的,因为龙芯也是TICK-TOCK,如果只看IPC的话TICK也就是换工艺基本是没有提升的,而TOCK是换架构可能会有提升也可能没有。(如果设计思路是用小核心堆核就用不上提高IPC,提升能效比和多核互连效率就行了,过去龙芯圈攻击其他国产芯片IPC没提升=设计水平没提升=没设计能力=买ban的话术就是基于这样的BUG)
所以最终用户手里产品用起来如何还是要看能效比的。
典中典同频2.5Ghz进行对比,因为龙芯只会造螺旋桨飞机所以要求喷气式飞机也要降速到亚音速进行性能对比是吧
那人家拉加力超音速的时候你怎么办呢
好歹这次还敢给咱看看跑分对比,算是比之前的视频好了不少,但是依然没说明很多问题。
只看低频IPC苹果都能吊打IA,甚至吊打龙芯,那么是不是意味着苹果的设计能力远超它们呢?
懂的都懂,不予评价
这个图咱没判断准确性,不知道评论区有大手子能帮看看没
这里又是典中典受限于工艺龙芯频率上不去只能2.5Ghz的套路,只能说他给的实在是太多了。龙芯的频率上不去和核心设计有关系,而且这个关系远大于工艺,毕竟英特尔和AMD在32nm工艺下都能超4G,龙芯的32nm就只有0.8-1G
这个倒是无所谓,因为4790K在图吧也是还能战十年的传家宝了(虽然图吧一般都上E5V3)
这次相当于官方跑了一次3A6000和麒麟9000S的大核对比,让之前扑朔迷离的不同来源的跑分能有个比较可信的结果了
这个跑分对比图非常直观了,麒麟9000S保密工艺,大概率是华为自家的二手ASML DUV光刻机,小概率SMIC N+1/N+2,反正都是去美化的可控工艺,美国制裁不到。
其中整数部分龙芯3A6000只高麒麟9000S 0.2分,浮点部分落后麒麟9000S 0.9分,算总分低0.7分。
不过关于这个跑分过去的不同来源有不同的结果。
过去龙芯吧小吧主彭东锋的跑分来看,3A6000的浮点只有5.87,但是整数有5.02
9月份麒麟9000S的视频中TSV大核的整数是4.01浮点是6.88,整数有变动。
这里UP给了解释
顺带说下,龙芯的发布会上SPEC17跑分是单核整数5.05浮点7.79,浮点分数相比过去龙芯吧小吧主彭东锋的跑分原地提高了30%,比UP高23%,只能说明要么SPEC跑分标准不清基准失准,要么就说明这些跑分里面有真有假。反正从UP这里能看到龙芯发布会的跑分有多离谱爷很满意。
送测跑分都达不到的话,看来发布会改分的可能性更大一些。
这里这个和10100有差距是UP表述,龙芯发布会不是这么说的,发布会说是“与10代酷睿四核相当,达到市场主流性能水平”
所以评论区根本用不上尬吹龙芯《实事求是》
这个《达到市场主流水平》还得细品,因为考虑到大量X58 X79 X99 AMD INTEL六核八核及以上产品的存在,龙芯的整体性能水平依然谈不上主流,甚至在图吧都谈不上主流,现在垃圾佬基本人手一张X79+2660V2甚至2670V2,跑分随便就能达到12100的性能水平。
终于谈龙芯的多核效率问题了,如果只看单核龙芯宣传的性能提升应该是没啥问题的。但是多核跑分明显就能看出来不对劲了
能想到缓存其实已经相当不错了,但是实际上个人认为龙芯的这个多核效率的问题得组合着看,比如龙芯发布会的超频跑分:
怎么频率提升了5.5%,跑分只提升了2.2%和3.3%呢?结合这个信息来看,龙芯用户已经给出结论了,大概率是卡IO性能了。
因为前面也说了,龙芯的南北桥设计结构其实在业界已经是相当古老的结构了,AMD在APU时代实现了取消北桥设计只留南桥,到了挖掘机时代实现了南北桥全集成。而AMD的南北桥结构时代CPU内部虽然集成IMC内存控制器,但是和CPU之间也是通过HT总线连接的(图吧群友信息来源),因此HT总线如果限制带宽的话CPU的多核性能和超频跑分自然就上不去了。说到底如果能超HT总线的话能缓解卡IO的问题但只能缓解一点点,真正解决问题的方法是改进内部互连结构,取消南北桥设计,这点其他国产芯片其实实现的很早(兆芯早在2017年就实现了SOC化,单芯片内部集成CPUGPU核心、IMC与IO,完全不需要南北桥,飞腾鲲鹏之类的也是差不多的时间)
不过这话其实也没毛病,羿龙II其实不考虑缺SSE4指令集开个office或者发个邮件啥的也不能说不够用,如果缺指令集无法运行最新版的软件那就换推土机就行了连主板都不用动
谈能效的话又在强调工艺了,这点咱其实也没法评价,因为16/12nm节点其实是有很多能效不错的设计的,麒麟955,兆芯KX6000飞腾D2000之类的能效都很不错。
不过龙芯3A6000这个功耗雀食不错,该说不说压的甜点频率还是很准的,相比兆芯从2.4G硬超到2.7G甚至3.0G的KX6000功耗从50W涨到70W跑分却只和频率对应提高其实是得不偿失的。
绝对能效打不过10100那是肯定的了,毕竟这东西它并不是什么特别高级的设计,也基本没怎么考虑过节能
记得龙芯吧小吧主的测评中3A5000在待机的时候甚至不会自动降频,换算到X86的话这种水平大概是图拉丁奔腾3的台式U,待机功耗感人(重点强调一下图拉丁奔腾3 130nm时代的笔记本U其实是有speedstep自动降频的,功耗反倒相当不错因为图拉丁架构本身的能效就很高),高于国产X86 ARM的16nm八核。
不过由于3A6000精简了这个不少无用设计加上CPU的流水线宽度提升所以其实能效相比上代提升还是有的,上代的能效更加感人甚至打不过其他16nm节点的国产芯片。
这里咱简单算一下超频的跑分提升和频率提升就能看出来龙芯的问题在哪了,简而言之频率提升了12%跑分提升了8.3%和11.7%,这相比龙芯发布会的成绩倒是好得多了,如果只看发布会的参数那就只能认为龙芯的超频没什么用得不偿失了(记得之前说是超2.8G的话功耗大概要翻倍来着)。
不过8.3%的整数提升幅度来看超出甜点频率的性能提升依然代价巨大。
和咱想的差不多,超过2.8G原装散热器就没法压了需要上水冷或者液氮
这个也不能这么说,毕竟龙芯吧自己承认的饭圈龙芯圈之前看玩龙芯液氮超频还拿这事说事来着说什么“龙芯零下193度可正常工作,英特尔AMD零下三十度开不了机”之类的典中典,已经让垃圾佬看不清到底是真对液氮超频一无所知还是帆船了。
然后超着超着发现机器超不上去了这也是正常的,毕竟龙芯的设计水平就在这,能保证出货前进行完整的测试不卡硬件BUG都有困难,很多时候发现BUG直接屏蔽模块解决问题(龙芯用户信息来源)。
所以说和咱想的一样,龙芯的设计应该是卡IO了,内存控制器不知道是不是直接用的公版IP,如果是的话只能说公版不太行,如果是自研的话只能说还不如公版。水平雀食有点低。
所以说之前很多人觉得开放BIOS龙芯就能超4G干12100那是根本不可能的,至少在龙芯3A6000是不可能的。快速提高性能的最有效手段永远是堆核而不是超频或者指望提高IPC,希望各位明白这个道理。
超冒烟了都干不过12100这就是现实
不过用液氮压住好像能有效的降低CPU的功耗,毕竟70W是低于这玩意官网手册上写的80W TDP。
意义明确の运镜,已经展示了超频超不上去的原因了,南北桥结构超CPU核心不超HT总线还卡IMC,这怎么玩,即使在超频圈里也是毫无可玩性的存在。
知道的还挺多,这些都说出来了基本上咱也没啥补充的了,反正龙芯用户吐槽是完美复刻了Windows Mobile到WP7再到WP8的进程,美好的明天在等待着我们。
这个API兼容问题不知道好不好,但是好歹在接近了,类似鸿蒙兼容AOSP一样,你可以推新生态但是不能立马抛弃旧生态,现在龙芯的MIPS产品基本已经失去了支持了,很多老用户就根本不会考虑进行迁移,尤其还有绑定过专用软件的用户都是用的MIPS,不知道龙芯打算怎么办。
这个也不是特别重视,原先MIPS时代总说要兼容X86,结果到老放弃的时候都没实现支持运行.EXE,到3A5000的时候好歹支持转译了,结果转译性能感人根本没法用,3A6000相比3A5000的转译性能有了成倍的提升和高度重视软件支持才终于能成功运行原神(国际服)。之前的时间里龙芯圈无论怎么攻击其他国产芯片只要问原神多少帧都能轻易破防的。
这个事看各位怎么想了,很多开发者看龙芯对MIPS的那种招之则来挥之则去弃如敝屣的态度之后其实都不太敢再支持龙芯的生态了,所以龙芯也是没办法最后被市场教做人了,没有软件支持的硬件和废铁无异,龙芯打造自主生态的脚步还是被迫转向了打造国产全美达的路线,不过这样也不错,毕竟国际象棋29倍原神国际服也能正常进那就可以用。
这里说明一下,目前LATX已经很实用了,LATA还没支持,可能龙芯以后在嵌入式或者机顶盒之类的场合能用上吧,手机够呛能指望转译的效率再高能效也干不过原生ARM。
这个转译效率只看7Zip的话其实是不如苹果罗塞塔和WOA的,但是看兼容性就更是远远不如了。
R15只有241分,不如I3 2100,这个水平其他国产芯片的话28nm产品就能轻松秒杀了。
过去龙芯一直觉得转译这种东西都是可有可无解一时之急的东西没有上心开发,结果就是龙芯销量暴跌根本没人买张,最后实际上是被迫投入了大量的人力物力进行转译的开发,相应的对原生软件的期望就没有原先那么高了,而且转译还有性能的损耗,不过这样也好至少符合市场规律,用户的态度从业绩上最终会体现出来的。
龙芯对转译性能的重视比之前龙芯圈的KPI攻击其他国产芯片的研发能力对其他国产芯片厂家的威胁更大,如果龙芯真的能实现全美达的精神续作甚至超越全美达那么其他的国产芯片其实需要授权技术这点还是有压力的,虽然已知华为的麒麟9000S有ARMV9,X86永久授权也大概率不会取消,但是未来是比较难说的,我能想到的最差的情况应该是生态的分裂,如果外国不再提供指令集授权,国内完全可以基于已有的指令集进行发展,就像过去龙芯的MIPS改LOONGISA一样。这种时候如果全美达还活着甚至精神续作还能通过指令集的优势实现对原生架构的反超那就难说会有什么结果了。
blend别说2.7,连2.93都打不开流浪地球的MOSS模型,垃圾佬因为WIN10 PTSD平时只用WIN7所以在WIN7下要想用国产CPU主机也好普通PC也好打开流浪地球的模型只能下魔改版的3.0以后的新版本再打开,2.7基本没啥用
至于能原生运行的应用有:
Jetbrain
Python3.7,这版本也不错咱学Python的时候还教的是2.7呢,虽然最后也没用上
新版本想用就自己编译
龙芯自己也存了不少编译好的版本,不过如图所示
不过选择自己编译的话日常就是卡BUG各种报错了
不不,真正劝退开发者的其实是龙芯圈的饭圈行为,去年的瓜是龙芯吧小吧主彭东锋为首的龙芯圈直接和开源社区开战,导致龙芯失去了开源社区的支持只能被迫强化转译水平,总之这瓜咱没怎么吃也只是听说,毕竟饭圈谁也喜欢不来也不太愿意去打听这事。说实在的如果龙芯圈不攻击华为的话咱甚至可以对它们攻击兆芯飞腾海光之类的睁一只眼闭一只眼,攻击华为那就只能问宁配钥匙吗配几把了。
目前可以知道的信息是龙芯使用DX转OGL的效率感人,玩DX9游戏基本都是PPT,DX11的DXVK效率好得多,原神不会这么卡
而且和摩尔线程一样,这玩意居然还因游戏而异,想也知道需要针对性优化。
这个咱不知道是怎么说的,反正知乎的龙芯用户是成功进原神4.3国际服了,时间大概是一个月前吧我忘了
反正纯国产PC打原神目前还困难,国产CPU+国产GPU之前玩着很好,结果一更新就报错原形毕露其实也是常态。可能和原神自己也有关系压根没考虑适配
这个咱可以作证,国产X86运行道德与法治5没问题,之前咱配一张1066甚至全程4K分辨率通关了
花2000来块钱买龙芯板U玩YUZUSOFT是吧,那雀食没问题,不过国产X86的话好像多少年前几十块钱的U就行吧
PPSSPP彳亍,这个真的有用,GTA至少LCS和VCS能玩了,罪恶都市理论上也有PSP版吧。
希望吧,只能说希望龙芯不要接着养寇为患纵容一些饭圈无底线的攻击其他国产芯片甚至开源社区了,不然像去年这种事恐怕还会出现。
龙芯的产品水平现在是没啥太大的问题的,但是龙芯的行为个人感觉问题很大,官号之前发的什么14秒开机的烂活评论区和弹幕的画风咱印象深刻,没活可以选择不活,这种逆练外宣还不如不宣。
龙芯的这种定位也导致了受众其实和饭圈高度重合,至少站在图吧的角度上讲花2000来块钱买个这咱是不会考虑的,有这钱要加国产buff可以选择买四台国产X86还有富余了(HP268兆芯主机449包邮还算是贵的,寨板更便宜)。
能说出这话也不知道是对龙芯的现状有充分的了解还是什么,只能说雀食。
PS:关于缓存的争议其实没啥可争的,AMD HT总线时代的L3缓存都是NB-SPEED北桥速度,没记错的话是在CPU内部也要靠HT总线和CORE连接,所以那年头的L3其实没啥用速度异常感人共不共享反倒是次要问题,有时间可以试试用3A6000跑AIDA64的CACHE看看不就知道什么水平了,如果真是NB-SPEED和HT总线一样那就没啥可争的了。
当然了,如果UP因为发布了不符合龙芯圈宣传话术的内容而被龙芯圈开团的话可以向咱这寻求帮助,咱可以提供一些有用的信息。
就这样,谢谢朋友们!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.