网易首页 > 网易号 > 正文 申请入驻

英伟达最新研究成果!开辟机器人导航更多可能 无需地图可实时感知

0
分享至

《科创板日报》12月11日讯(编辑 宋子乔) 日前,加州大学研究人员和英伟达共同发布了新的视觉语言模型“NaVILA”。亮点在于,NaVILA模型为机器人导航提供了一种新方案。



NaVILA模型的相关论文

视觉语言模型(VLM)是一种多模态生成式AI模型,能够对文本、图像和视频提示进行推理。它通过将大语言模型(LLM)与视觉编码器相结合,使LLM具有“看”的能力。

传统的机器人行动往往依赖于预先绘制的地图和复杂的传感器系统。而NaVILA模型不需要预先的地图,机器人只需“听懂”人类的自然语言指令,结合实时的视觉图像和激光雷达信息,实时感知环境中的路径、障碍物和动态目标,就可以自主导航到指定位置。

不仅摆脱了对地图的依赖,NaVILA还进一步将导航技术从轮式扩展到了足式机器人,希望让机器人应付更多复杂场景,使其具备跨越障碍和自适应路径规划的能力。

在论文中,加州大学研究人员使用宇树Go2机器狗和G1人形机器人进行了实测。根据团队统计的实测结论,在家庭、户外和工作区等真实环境中,NaVILA的导航成功率高达88%,在复杂任务中的成功率也达到了75%。


Go2机器狗接受行动指令:向左转一点,朝着肖像海报走,你会看到一扇敞开的门


G1人形机器人接受行动指令:立即左转并直行,踩上垫子继续前进,直到接近垃圾桶时停下来

据介绍,NaVILA模型的特点在于:

优化准确性与效率:NVILA模型在训练成本上降低了4.5倍,微调所需内存减少了3.4倍。在预填充和解码的延迟上几乎降低了2倍(这些数据是与另一个大型视觉模型LLaVa OneVision进行比较得出的)。

高分辨率输入:NVILA模型并不通过降低照片和视频的大小来优化输入,而是使用高分辨率图像和视频中的多个帧,以确保不丢失任何细节。

压缩技术:英伟达指出,训练视觉语言模型的成本非常高,同时,微调这样的模型也非常耗费内存,7B参数的模型需要超过64GB的GPU内存。因此英伟达采用了一种名为“先扩展后压缩”的技术,通过将视觉信息压缩为更少的token,来减少输入数据的大小,并将像素进行分组,以保留重要信息,平衡模型的准确性与效率。

多模态推理能力:NVILA模型能够根据一张图片或一段视频回答多个查询,具有强大的多模态推理能力。

在视频基准测试中,NVILA的表现超过了GPT-4o Mini,并且在与GPT-4o、Sonnet 3.5和Gemini 1.5 Pro的比较中也表现出色。NVILA还在与Llama 3.2的对比中取得了微弱胜利。


英伟达表示,目前尚未将该模型发布到Hugging Face平台上,其承诺会很快发布代码和模型,以促进模型的可复现性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

金融稳外贸接连再出招,深圳专属贷款利率最低可至2.88%,多地银行再提“不抽贷、不断贷”

返回网易首页 下载网易新闻客户端
相关推荐
热点推荐
韦世豪:每次转会分成,鲁能足校一毛没少拿过

韦世豪:每次转会分成,鲁能足校一毛没少拿过

懂球帝
2025-05-28 16:38:38
明确规定来了!机关事业单位人员可从事这些副业,无需担心查核!

明确规定来了!机关事业单位人员可从事这些副业,无需担心查核!

诗词中国
2025-05-28 12:56:46
男子杀害母亲和女友后带嫂嫂潜逃32年落网:同居嫂嫂成破案突破口,案件尚未宣判

男子杀害母亲和女友后带嫂嫂潜逃32年落网:同居嫂嫂成破案突破口,案件尚未宣判

红星新闻
2025-05-28 15:08:12
突发意外!刘国梁、王励勤:选举国际乒联主席多出了5张投票!

突发意外!刘国梁、王励勤:选举国际乒联主席多出了5张投票!

姩姩有娱呀
2025-05-28 11:25:48
公安局干部被曝开车撞死2岁男童,男童家属:他驾驶证已过期!当地介入处理

公安局干部被曝开车撞死2岁男童,男童家属:他驾驶证已过期!当地介入处理

扬子晚报
2025-05-27 18:21:20
87岁凝聚态物理学家孙鑫逝世,复旦物理学系官网变为黑白色

87岁凝聚态物理学家孙鑫逝世,复旦物理学系官网变为黑白色

澎湃新闻
2025-05-28 17:02:28
印度要求中国道歉,三大死亡威胁喊话中方?中国回应令世界钦佩

印度要求中国道歉,三大死亡威胁喊话中方?中国回应令世界钦佩

说天说地说实事
2025-05-28 17:18:09
最好的防守是进攻!面对疯狂空袭,乌克兰唯有置死地而后生

最好的防守是进攻!面对疯狂空袭,乌克兰唯有置死地而后生

史政先锋
2025-05-28 13:45:42
视频丨白宫:美国需要的是电工、水管工 而不是哈佛研究生

视频丨白宫:美国需要的是电工、水管工 而不是哈佛研究生

环球网资讯
2025-05-28 14:02:20
徐芝文任四川省副省长

徐芝文任四川省副省长

澎湃新闻
2025-05-28 16:12:02
安徽石狮子现身江苏博物馆!文旅局要证明材料,村民晒出铁证。

安徽石狮子现身江苏博物馆!文旅局要证明材料,村民晒出铁证。

趣文说娱
2025-05-28 10:15:18
李嘉诚的反击

李嘉诚的反击

求实处
2025-05-28 00:41:22
中国男子在法国,以2.7亿拍得兔首和鼠首,却拒绝付款:我为什么要付钱?这本来就是我们的!

中国男子在法国,以2.7亿拍得兔首和鼠首,却拒绝付款:我为什么要付钱?这本来就是我们的!

明智家庭教育
2025-05-26 22:24:57
3名“熊孩子”闯入正装修别墅搞破坏 业主:家长带孩子道歉,我回赠了试卷

3名“熊孩子”闯入正装修别墅搞破坏 业主:家长带孩子道歉,我回赠了试卷

红星新闻
2025-05-28 17:59:17
美称已有计划制止大陆对台“军事入侵”,国台办回应

美称已有计划制止大陆对台“军事入侵”,国台办回应

扬子晚报
2025-05-28 11:57:09
外交部答澎湃:中方已实现对海合会国家免签全覆盖

外交部答澎湃:中方已实现对海合会国家免签全覆盖

澎湃新闻
2025-05-28 15:24:32
动力电池自燃将成历史?新国标:明年电池必须“刀枪不入”

动力电池自燃将成历史?新国标:明年电池必须“刀枪不入”

北青网-北京青年报
2025-05-28 08:28:06
石家庄铁道大学一学生直播疑遭学院书记殴打,校方回应

石家庄铁道大学一学生直播疑遭学院书记殴打,校方回应

大象新闻
2025-05-28 15:11:08
涉嫌严重违纪违法,盐城智通祥被查!

涉嫌严重违纪违法,盐城智通祥被查!

鲁中晨报
2025-05-28 15:46:15
泽连斯基:俄军在乌北部集结5万兵力准备发动进攻!德国取消供乌武器射程限制,俄方回应

泽连斯基:俄军在乌北部集结5万兵力准备发动进攻!德国取消供乌武器射程限制,俄方回应

每日经济新闻
2025-05-28 17:37:12
2025-05-28 19:52:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
585915文章数 1010445关注度
往期回顾 全部

科技要闻

DeepSeek R1完成小版本升级,已可体验

头条要闻

估价超1亿"英之园"被拆 当地曾想没收但当事人不配合

体育要闻

郑钦文势不可挡!近4年3进法网32强

娱乐要闻

19岁荣梓杉和混血美女疑似恋情曝光

财经要闻

74岁王石罕见发声,能为万科做些什么?

汽车要闻

25万级纯电SUV飞坡 特斯拉Model Y来回跳?

态度原创

旅游
艺术
房产
亲子
公开课

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

房产要闻

看完这份数据,你应该对海南楼市有信心!

亲子要闻

母女一起画爱心

公开课

李玫瑾:为什么性格比能力更重要?