网易首页 > 网易号 > 正文 申请入驻

80亿参数,40 Tokens/秒,0.3秒延迟!商汤绝影行业首发原生多模态大模...

0
分享至

“基于原生多模态大模型,商汤绝影正在打造一系列全新的车载智能化产品,推动智能汽车向超级智能体进化。”商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚在WAIC 2024商汤科技“大爱无疆·向新力”人工智能论坛上说。一个超级智能体的进化离不开强大的端侧模型,大量原生多模态大模型正在从云走向智能汽车为代表的各种智能终端,车端模型部署能力将成为智能汽车进化过程中不可或缺的技术保障。在论坛上,王晓刚宣布商汤绝影在行业内率先实现了原生多模态大模型的车端部署。绝影行业领先的车载端侧8B模型首包延迟可低至300毫秒以内,推理速度40 Tokens/秒,并且能够覆盖主流算力平台。

商汤绝影在行业率先实现

原生多模态大模型的车端部署

此前GPT-4o的发布为消费者展示了多模态实时交互的方式,让更多人领略多模态感知和交互的魅力,也开始帮助释放多模态大模型的商业落地想象空间。相较于手机,智能汽车才是更适合承载多模态大模型的落地场景。因为智能汽车内外的各种摄像头是常开的,用户可以实时跟汽车通过多模态的方式进行交互。同时,智能汽车的保有量不断增加,能够产生丰富的终端用户反馈和数据信息,让模型不断迭代成长。和OpenAI等公司相比,商汤绝影是汽车智能化的核心供应商,在智能驾驶和智能座舱领域具备丰富的量产经验,将以多模态大模型为核心加速“以人为本”的智能汽车交互革新。但相比于其他的终端,智能汽车有其特殊性,对安全和实时响应有着非常高的要求,汽车是私密空间,终端用户非常在意隐私保护。这就注定了多模态大模型大部分的任务将在车载终端完成。商汤绝影能够以云侧、端云结合、端侧等全栈方式灵活部署多模态大模型,让商汤原生多模态能力能够快速落地智能汽车。在WAIC 2024商汤人工智能论坛上,商汤绝影宣布在行业率先实现原生多模态大模型的车端部署,并在现场演示了搭载在200 TOPS+平台上的8B模型(即80亿参数)车端部署方案,展示强多模态感知和交互能力。相较于动辄就有几秒钟延迟的云上部署方案,商汤绝影车载端侧8B多模态模型可以实现首包延迟可低至300毫秒以内,推理速度40 Tokens/秒,引领“以人为本”的智能汽车交互革新。在WAIC 2024面向公众的展台上,商汤绝影还对外展示了在多个不同算力平台上运行2.1B或8B端侧多模态大模型的适配能力。明年,上千TOPS算力的车载芯片就会问世。基于更高算力的计算平台,商汤绝影多模态大模型车端部署方案的首包延迟将大幅度降低,推理速度进一步提高,为用户带来更加流畅和自然的智能汽车交互体验。

引领多模态车端部署

商汤绝影有“杀器”

多模态大模型能够将语音、文字、图像、手势、视频等各种模态进行高效且深度地融合,提供更加丰富且自然的人机交互体验。过去许多模型处理不同模态信息是先把语音等输入转化为文字,文字和图像结合进行分析,输出反馈也是先生成文字,根据文字再生成语音输出,会有大量信息丢失和很高的延迟。由“日日新5.5”体系支持的全新商汤多模态大模型是一种端到端的模型,也就是文字、语音、视频等模态一同输入,模型统一处理后输出相应模态的信息,相较于过去的方案,多模态融合的技术难度是几何倍数的提升。技术上的高难度是商汤行业领先的原生多模态能力的直接体现。今年4月发布的“日日新5.0”是国内首个对标GPT-4 Turbo的国产大模型,“日日新5.5”体系更是全面升级,数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o。商汤持续迭代的“日日新”大模型体系是商汤绝影多模态的车端部署领先行业的底气所在,也是绝影的“大杀器”之一。要让多模态大模型从云上落地到车端,商汤绝影还有更多的秘密武器。由于车载硬件、系统种类繁多,各种加速芯片层出不穷,其他行业和开源的框架工具很难完全支持和适配,同时也为了解决自回归方式生成token效率较低的问题,商汤绝影专为多模态大模型打造了一个“大杀器”——高性能计算引擎“HyperPPL”。它综合了大语言模型、多模态模型、CNN模型、前后处理完整的优化能力,是智能汽车领域最广泛的高性能AI芯片异构计算平台,为商汤绝影多模态大模型落地车端提供强大的计算底座。HyperPPL目前扩展并支持主流车载计算硬件,兼容多种主流操作系统,适配多个车载芯片的部署平台,使得商汤绝影原生多模态大模型在主流芯片平台均可快速部署上线。同时,HyperPPL支持flash decode、segment prefill等400多个硬件算子,并对算子进行性能优化,同时量化支持int8、int4模式,并支持训练后量化,从而实现极致推理效率。相较于大多数开源的Python推理框架、C++推理框架以及训练推理框架,商汤绝影自研HyperPPL方案在Orin平台上的推理速度更快,超过40 Tokens/S。而对比英伟达的原生推理框架 TensorRT,绝影的HyperPPL在推理能力相当的情况下,在内存上有明显优势,即以更小的内存达到和前者相同的推理速度。不仅如此,商汤绝影HyperPPL还针对车载多人场景进行优化,使得车内多人并发情况下,车端多模态大模型的模型推理效率相比单人没有明显降低。这些“大杀器”为商汤绝影引领多模态大模型的车端部署保驾护航。基于车端原生多模态大模型,商汤绝影将与合作伙伴共同打造全新的车载智能化产品,引领“以人为本”的智能汽车交互革新,加速智能汽车驶入AGI时代。

(商汤-W)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有点尬!东风本田S7被曝“36小时大定破20” 25.99万起

有点尬!东风本田S7被曝“36小时大定破20” 25.99万起

手机中国
2025-03-12 16:47:05
撒尿男孩家境反转,海底捞对4109单顾客,全额退款并赔偿10倍现金

撒尿男孩家境反转,海底捞对4109单顾客,全额退款并赔偿10倍现金

明月聊史
2025-03-12 17:36:04
海底捞小便事件后续!涉事男子父母含泪求放过:砸锅卖铁都赔不起

海底捞小便事件后续!涉事男子父母含泪求放过:砸锅卖铁都赔不起

阿凫爱吐槽
2025-03-12 08:45:59
全程呲牙咧嘴,台词含糊不清,影帝胡军坐镇都带不动这个拖油瓶!

全程呲牙咧嘴,台词含糊不清,影帝胡军坐镇都带不动这个拖油瓶!

星辰生肖馆
2025-03-12 04:10:03
国家都嫌你胖

国家都嫌你胖

阿亮评论
2025-03-12 11:42:00
被判违例!西媒:阿尔瓦雷斯罚点二次触球,VAR介入后判无效

被判违例!西媒:阿尔瓦雷斯罚点二次触球,VAR介入后判无效

直播吧
2025-03-13 07:04:16
曝52岁中国驻外女大使因车祸去世:死前3天发朋友圈,最后照流出

曝52岁中国驻外女大使因车祸去世:死前3天发朋友圈,最后照流出

博士观察
2025-03-12 22:44:19
台退役将领爆“赖清德儿子躲在美国不当兵”,引岛内舆论强烈不满

台退役将领爆“赖清德儿子躲在美国不当兵”,引岛内舆论强烈不满

环球网资讯
2025-03-13 06:43:12
记者:不明白为什么取消阿尔瓦雷斯点球,图像显示没二次触球

记者:不明白为什么取消阿尔瓦雷斯点球,图像显示没二次触球

懂球帝
2025-03-13 07:15:19
感觉现在全世界最“后悔”的就是国际法庭了,配合逮捕抓杜特尔特

感觉现在全世界最“后悔”的就是国际法庭了,配合逮捕抓杜特尔特

玲子日记
2025-03-13 03:57:52
6-1,双杀晋级!埃梅里又神了:率队42年重返欧冠8强,将大战巴黎

6-1,双杀晋级!埃梅里又神了:率队42年重返欧冠8强,将大战巴黎

侃球熊弟
2025-03-13 07:49:00
妻子玩性大,出轨2个男人,2019年被丈夫捉奸后丈夫求她别离婚

妻子玩性大,出轨2个男人,2019年被丈夫捉奸后丈夫求她别离婚

汉史趣闻
2025-03-12 14:10:47
欢呼吧!郑钦文终于王者归来,2-0创造纪录,晋级8强大战卫冕冠军

欢呼吧!郑钦文终于王者归来,2-0创造纪录,晋级8强大战卫冕冠军

侃球熊弟
2025-03-12 13:45:49
解读美乌会谈成果,俄乌真能停火30天?

解读美乌会谈成果,俄乌真能停火30天?

直呼内行
2025-03-12 16:54:01
桂林上海路车祸:17岁高三女生骑电动车上学途中遇难!

桂林上海路车祸:17岁高三女生骑电动车上学途中遇难!

原广工业
2025-03-13 07:00:54
曝一线明星澳门赌博输掉10亿!更多细节曝光已经离婚,不是周杰伦

曝一线明星澳门赌博输掉10亿!更多细节曝光已经离婚,不是周杰伦

明月聊史
2025-03-11 10:32:44
办公室投放春药长达2年,领导个个胖成猪,你就说离谱不离谱吧

办公室投放春药长达2年,领导个个胖成猪,你就说离谱不离谱吧

情感艺术家
2025-03-10 22:56:37
郑爽已报警!晒祖孙三代游泳照自证清白,她抱着孩子笑得很开心!

郑爽已报警!晒祖孙三代游泳照自证清白,她抱着孩子笑得很开心!

古希腊掌管月桂的神
2025-03-12 08:03:15
马斯克接受采访称“非常困难” 肢体语言专家:他在流泪的边缘,对政府角色感到不安

马斯克接受采访称“非常困难” 肢体语言专家:他在流泪的边缘,对政府角色感到不安

红星新闻
2025-03-12 18:02:21
金赛纶生前最后露面:满头白发、黑眼圈眼袋巨严重,眼神毫无生机

金赛纶生前最后露面:满头白发、黑眼圈眼袋巨严重,眼神毫无生机

玫瑰讲娱
2025-03-12 17:14:57
2025-03-13 09:19:00
动态宝
动态宝
企业动态信息智能分发平台
41796文章数 61关注度
往期回顾 全部

汽车要闻

当动力唾手可得 纯电莲花跑车还能给你什么?

头条要闻

俄国防部:俄军继续在库尔斯克地区击败乌军

头条要闻

俄国防部:俄军继续在库尔斯克地区击败乌军

体育要闻

大巴黎脱胎换骨,利物浦菜是原罪

娱乐要闻

金赛纶邻居爆料 去年经常见她躲楼梯哭

财经要闻

从暴利到崩盘,大洗牌才刚刚开始

科技要闻

蔚来调整!李斌管供应链 手机业务投入减少

态度原创

教育
艺术
房产
手机
亲子

教育要闻

“我发了自己的查分视频,然后被网暴了。”

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

房产要闻

罗牛山·璞域三批次最后88套豪宅限时收藏,抓住入席海口的良机!

手机要闻

129元!小米对讲机3畅聊版发布:1-5公里对讲、120小时待机

亲子要闻

孩子和谁睡,就和谁亲吗?真相和你想的不一样

无障碍浏览 进入关怀版