网易首页 > 网易号 > 正文 申请入驻

非 Transformer 架构 AI 模型 Liquid 问世

0
分享至

IT之家 10 月 2 日消息,去年刚成立的 Liquid AI 公司于 9 月 30 日发布了三款 Liquid 基础模型(Liquid Foundation Models,LFM),分别为 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。这些模型均采用非 Transformer 架构,号称在基准测试中凌驾同规模的 Transformer 模型

IT之家注意到,目前业界在深度学习和自然语言处理方面主要使用 Transformer架构,该架构主要利用自注意力机制捕捉序列中单词之间的关系,包括 OpenAI 的 GPT、Meta 的 BART 和谷歌的 T5 等模型,都是基于 Transformer 架构。

而Liquid AI 则反其道而行之,其 Liquid 基础模型号称对模型架构进行了“重新设想”,据称受到了“交通信号处理系统、数值线性代数”理念的深刻影响,主打“通用性”,能够针对特定类型的数据进行建模,同时支持对视频、音频、文本、时间序列和交通信号等内容进行处理

Liquid AI 表示,与 Transformer 架构模型相比 LFM 模型的RAM用量更少,特别是在处理大量输入内容场景时,由于 Transformer 架构模型处理长输入时需要保存键值(KV)缓存,且缓存会随着序列长度的增加而增大,导致输入越长,占用的RAM越多。

而 LFM 模型则能够避免上述问题,系列模型能够有效对外界输入的数据进行压缩,降低对硬件资源的需求,在相同硬件条件下,这三款模型相对业界竞品能够处理更长的序列。

参考 Liquid AI 首批发布的三款模型,其中 LFM-1.3B 专为资源受限的环境设计,而 LFM-3.1B 针对边缘计算进行了优化,LFM-40.3B 则是一款“专家混合模型(MoE)”,该版本主要适用于数学计算、交通信号处理等场景。

这些模型在通用知识和专业知识的处理上表现较为突出,能够高效处理长文本任务,还能够处理数学和逻辑推理任务,目前该模型主要支持英语,不过也对中文、法语、德语、西班牙语、日语、韩语和阿拉伯语提供有限支持

根据 Liquid AI 的说法,LFM-1.3B 在许多基准测试中击败了其他 1B 参数规模的领先模型,包括苹果的 OpenELM、Meta 的 Llama 3.2、微软的 Phi 1.5 以及 Stability 的 Stable LM 2,这标志着首次有非 GPT 架构的模型明显超越了 Transformer 模型。

而在 LFM-3.1B 方面,这款模型不仅能够超越了 3B 规模的各种 Transformer 模型、混合模型和 RNN 模型,甚至还在特定场景超越上一代的 7B 和 13B 规模模型,目前已战胜谷歌的 Gemma 2、苹果的 AFM Edge、Meta 的 Llama 3.2 和微软的 Phi-3.5 等。

LFM-40.3B 则强调在模型规模和输出质量之间的平衡,不过这款模型有所限制,虽然其拥有 400 亿个参数,但在推理时仅启用 120 亿个参数,Liquid AI 声称进行相关限制是因为模型出品质量已经足够,在这种情况下对相应参数进行限制“反而还能够提升模型效率、降低模型运行所需的硬件配置”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
朱丹自曝周末约瞿颖一起去踏青被拒绝,原因也是引全场大笑

朱丹自曝周末约瞿颖一起去踏青被拒绝,原因也是引全场大笑

娱最资讯
2026-03-18 12:43:17
瞿颖翻红,朱丹圈粉!一个幽默随性敢怼敢说,一个高情商回应获赞

瞿颖翻红,朱丹圈粉!一个幽默随性敢怼敢说,一个高情商回应获赞

露珠聊影视
2026-03-17 17:29:01
“听泉鉴宝”直播间,炸出了中国初代顶豪家族,荣家的少奶奶?

“听泉鉴宝”直播间,炸出了中国初代顶豪家族,荣家的少奶奶?

BenSir本色说
2026-03-17 22:08:34
双重计谋!以色列刺杀拉里贾尼,彻底斩断美国退路

双重计谋!以色列刺杀拉里贾尼,彻底斩断美国退路

新民晚报
2026-03-18 11:44:10
第18日中东战况:伊朗投入丐版弹道导弹,又有实权人物被斩首

第18日中东战况:伊朗投入丐版弹道导弹,又有实权人物被斩首

装甲铲史官
2026-03-18 11:52:15
沙特这次真的把桌子给掀了

沙特这次真的把桌子给掀了

匹夫来搞笑
2026-03-17 08:46:28
演员胡军,喝酒喝不过就娶了人家,结婚26年零绯闻成圈里清流

演员胡军,喝酒喝不过就娶了人家,结婚26年零绯闻成圈里清流

草莓解说体育
2026-03-17 17:16:10
“晚打不如早打,小打不如大打,打一个,不如拉日本一起打”。

“晚打不如早打,小打不如大打,打一个,不如拉日本一起打”。

安安说
2026-03-14 18:50:59
是巧合,还是冥冥中自有天意?3位航天员连“名字”都这么巧

是巧合,还是冥冥中自有天意?3位航天员连“名字”都这么巧

快看张同学
2026-03-13 10:37:40
“我被生活压得喘不过气,再见吧”,20多岁小伙坐在杭州16楼栏杆外,无人机、特警、消防、派出所全出动

“我被生活压得喘不过气,再见吧”,20多岁小伙坐在杭州16楼栏杆外,无人机、特警、消防、派出所全出动

都市快报橙柿互动
2026-03-18 14:21:27
乌克兰“绿巨人”击落110架俄无人机,美媒曝穆杰塔巴疑似同性恋

乌克兰“绿巨人”击落110架俄无人机,美媒曝穆杰塔巴疑似同性恋

史政先锋
2026-03-17 22:07:39
湖南省人民政府办公厅原一级巡视员郑建新被公诉,曾因居民自建房倒塌事故被免职

湖南省人民政府办公厅原一级巡视员郑建新被公诉,曾因居民自建房倒塌事故被免职

上观新闻
2026-03-18 16:49:07
古巴当局宣布主动变革

古巴当局宣布主动变革

名人苟或
2026-03-17 12:35:57
白宫国家经济委员会主任:期货显示油价将在今年晚些时候回到50多美元/桶

白宫国家经济委员会主任:期货显示油价将在今年晚些时候回到50多美元/桶

中国能源网
2026-03-17 22:38:18
00后潮汕女孩逆袭成顶流,这“黑裙杀性感身材”真实?

00后潮汕女孩逆袭成顶流,这“黑裙杀性感身材”真实?

娱乐领航家
2026-03-12 19:00:07
美专家预判:一旦台湾宣布“独立”,中国大陆将会动手解放了?

美专家预判:一旦台湾宣布“独立”,中国大陆将会动手解放了?

花漾夜雨飘雪
2026-03-18 02:02:18
张维伊邀请朋友来北京家里吃饭,董璇不在,自己弄俩预制菜招待

张维伊邀请朋友来北京家里吃饭,董璇不在,自己弄俩预制菜招待

八怪娱
2026-03-17 21:07:18
美国商务部:在美国制裁下,中国休想制造出数量庞大的AI芯片

美国商务部:在美国制裁下,中国休想制造出数量庞大的AI芯片

涵豆说娱
2026-03-18 12:50:43
中美磋商结束,成果通告全世界,美财长一开口,果然想占中国便宜

中美磋商结束,成果通告全世界,美财长一开口,果然想占中国便宜

沧海旅行家
2026-03-18 18:26:42
你听过相声里最棒的现挂是什么?网友:郭德纲 于谦 马三立 都现挂高手

你听过相声里最棒的现挂是什么?网友:郭德纲 于谦 马三立 都现挂高手

情感大头说说
2026-03-18 12:47:50
2026-03-18 19:08:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
334721文章数 607070关注度
往期回顾 全部

科技要闻

直连微信!腾讯QClaw宣布大规模放量

头条要闻

拉里贾尼遇害细节:死在女儿家中 行为高调暴露自身

头条要闻

拉里贾尼遇害细节:死在女儿家中 行为高调暴露自身

体育要闻

晋级2026世界杯,这届中国女篮啥水平?

娱乐要闻

郑恺苗苗晒全家福 首次公开三胎小女儿

财经要闻

“永不爆雷的宇宙大所”掌门人,自首了

汽车要闻

价格10万级 四驱中级电混轿车银河星耀7来了

态度原创

艺术
游戏
房产
公开课
军事航空

艺术要闻

风景如画,太美了!

历史神游即将问世?开放世界游戏预售狂卖一个亿!

房产要闻

13万㎡的楼盘,违建7.5万㎡!海南这个开发商胆真大啊!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

拉里贾尼生死罗生门:以军称其身亡 他本人社媒账号发信

无障碍浏览 进入关怀版