网易首页 > 网易号 > 正文 申请入驻

生成式AI可能迎来下一个风口:TTT模型

0
分享至

下一代生成式人工智能(AI)的焦点可能是简称TTT的测试时间训练模型。

Transformers 架构是 OpenAI 视频模型 Sora 的基础,也是 Anthropic 的 Claude、谷歌的 Gemini 和 OpenAI旗舰模型GPT-4o 等文本生成模型的核心。但现在,这些模型的演进开始遇到技术障碍,尤其是与计算相关的障碍。因为Transformers 在处理和分析大量数据方面并不是特别高效,至少在现成的硬件上运行是这样。企业为了满足Transformers 的需求建设和扩展基础设施,这导致电力需求急剧增加,甚至可能无法持续满足需求。

本月斯坦福大学、加州大学圣地亚哥分校、加州大学伯克利分校和 Meta 的研究人员联合发布,他们耗时一年半开发了TTT架构。研究团队称,TTT 模型不仅可以处理比 Transformers 多得多的数据,而且不会消耗像Transformers那么多的计算电力。

为什么外界认为TTT模型相比Transformers更有前途?首先需要了解,Transformers 的一个基本组成部分是“隐藏状态”,它本质上是一个很长的数据列表。当 Transformer 处理某些内容时,它会将条目添加到隐藏状态,以便“记住”刚刚处理的内容。例如,如果模型正在处理一本书,隐藏状态值将是单词(或单词的一部分)的呈现形式。

参与前述TTT 研究的斯坦福大学博士后Yu Sun最近对媒体解释说,如果将Transformer 视为一个智能实体,那么查找表、它的隐藏状态就是 Transformer 的大脑。这个大脑实现了 Transformer 众所周知的一些功能,例如情境学习。

隐藏状态帮助 Transformers变得强大,但它也阻碍了Transformers的发展。比如Transformers 刚刚阅读了一本书,为了“说”出关于这本书中的哪怕一个字,Transformers 模型都必须扫描整个查找表,这种计算要求相当于重读整本书。

因此,Sun和TTT的其他研究人员想到,用机器学习模型取代隐藏状态——就像 AI 的嵌套娃娃,也可以说是一个模型中的模型。与 Transformers 的查找表不同,TTT 模型的内部机器学习模型不会随着处理更多数据而不断增长。相反,它将处理的数据编码,处理为被称为权重的代表性变量,这就是 TTT 模型高性能的原因。无论 TTT 模型处理多少数据,其内部模型的大小都不会改变。

Sun认为,未来的 TTT 模型可以高效处理数十亿条数据,从单词到图像、从录音到视频。这远远超出了现有模型的能力。TTT的系统可以对一本书说 X 个字,却不需要做重读这本书 X 遍的复杂计算。“基于 Transformers 的大型视频模型、例如 Sora,只能处理 10 秒的视频,因为它们只有一个查找表‘大脑’。我们的最终目标是开发一个系统,可以处理类似于人类生活中视觉体验的长视频。”

TTT 模型最终会取代 transformers吗?媒体认为,有这个可能,但现在下结论为时过早。TTT 模型现在并不是Transformers的直接替代品。研究人员只开发了两个小模型进行研究,因此目前很难将 TTT 与一些大型 Transformers模型实现的结果进行比较。

并未参与前述TTT研究的伦敦国王学院信息学系高级讲师 Mike Cook评论称,TTT是一项非常有趣的创新,如果数据支持它能提高效率的观点,那是个好消息,但他无法告诉判断,TTT是否比现有的架构更好。Cook说,他读本科的时候,有一位老教授经常讲一个笑话:你如何解决计算机学中的任何问题?再添加一个抽象层。在神经网络中添加一个神经网络就让他想起了这个笑话的解答。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
越扒越有!福建“杨梅商会会长”是当地最大的老板,亲戚担任要职

越扒越有!福建“杨梅商会会长”是当地最大的老板,亲戚担任要职

童童聊娱乐啊
2026-05-27 11:28:46
现货金银,快速下跌

现货金银,快速下跌

第一财经资讯
2026-05-27 14:41:57
74岁朴槿惠罕见露面:背驼了也瘦了老态尽显,柳荣夏依旧在她身边

74岁朴槿惠罕见露面:背驼了也瘦了老态尽显,柳荣夏依旧在她身边

照见古今
2026-05-26 18:46:02
终于来了!苹果发布 iOS 26.6 系统大更新

终于来了!苹果发布 iOS 26.6 系统大更新

XCiOS俱乐部
2026-05-27 01:44:45
“睡粉”球员被处理,苏超第二季失去纯粹性!本土化才是省超根基

“睡粉”球员被处理,苏超第二季失去纯粹性!本土化才是省超根基

中国足球的那些事儿
2026-05-26 20:44:57
一场盛大的“自我认知”溃败:从法网吞蛋看郑钦文的迷失

一场盛大的“自我认知”溃败:从法网吞蛋看郑钦文的迷失

网球之家
2026-05-26 23:12:55
盒马“粉木耳”标签惹众怒!连夜道歉全部下架,网友:太恶心了!

盒马“粉木耳”标签惹众怒!连夜道歉全部下架,网友:太恶心了!

今朝牛马
2026-05-26 20:26:53
雷霆3-2拿赛点,联盟这么做,不是捧亚历山大,而是毁掉自家招牌

雷霆3-2拿赛点,联盟这么做,不是捧亚历山大,而是毁掉自家招牌

老梁体育漫谈
2026-05-27 12:38:57
长沙警方:某小区发生一起人员坠亡事件,死者系高坠而亡,已排除刑事案件可能,网友称系恶性刑事案件为不实谣言

长沙警方:某小区发生一起人员坠亡事件,死者系高坠而亡,已排除刑事案件可能,网友称系恶性刑事案件为不实谣言

扬子晚报
2026-05-27 09:47:42
我去医院探望植物人嫂子,护工偷偷塞来字条:去查上周的监控录像

我去医院探望植物人嫂子,护工偷偷塞来字条:去查上周的监控录像

纸鸢奇谭
2026-05-21 17:44:37
霍去病啊,这人,说白了就是老天爷临时下凡一趟

霍去病啊,这人,说白了就是老天爷临时下凡一趟

老达子
2026-05-25 06:25:03
2003河南女子被顶替上学,对方叫嚣:“你就告上联合国都没用!”

2003河南女子被顶替上学,对方叫嚣:“你就告上联合国都没用!”

莫地方
2026-05-27 00:40:03
布鲁斯·威利斯经典科幻片将下架,5月31日最后期限

布鲁斯·威利斯经典科幻片将下架,5月31日最后期限

时光慢旅人
2026-05-26 01:23:13
韩国超模自曝身材烦恼:太丰满也是一种负担,1个穿搭秘诀化解困扰

韩国超模自曝身材烦恼:太丰满也是一种负担,1个穿搭秘诀化解困扰

赴一场山海啊
2026-05-25 00:12:48
约谈顽劣学生家长,40岁班主任被气身亡,评论区都在骂她“太傻了

约谈顽劣学生家长,40岁班主任被气身亡,评论区都在骂她“太傻了

谭谈社会
2026-05-27 11:58:37
台风“蔷薇”已生成!10省区市有大到暴雨

台风“蔷薇”已生成!10省区市有大到暴雨

环球网资讯
2026-05-27 14:30:31
茂名最暖糖厂已完成榨蔗工作!董事长否认投入千万元改造设备

茂名最暖糖厂已完成榨蔗工作!董事长否认投入千万元改造设备

南方都市报
2026-05-26 17:38:21
演都不演了!郑钦文法网一轮游仅1天,恶心的事发生,还不止一件

演都不演了!郑钦文法网一轮游仅1天,恶心的事发生,还不止一件

以茶带书
2026-05-27 12:03:38
总决赛G1失守!王博吐露真实想法,卢伟一句话点破关键

总决赛G1失守!王博吐露真实想法,卢伟一句话点破关键

桃叶渡春
2026-05-27 13:17:27
逼自己看了孙杨X易立竞的采访,我一人血书孙杨出一本《说话之道》...

逼自己看了孙杨X易立竞的采访,我一人血书孙杨出一本《说话之道》...

毕导
2026-05-25 17:23:12
2026-05-27 15:12:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
146684文章数 2653707关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

专家:全国多地降雨量突破历史极值 这是一种异常现象

头条要闻

专家:全国多地降雨量突破历史极值 这是一种异常现象

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

小S晒归宁宴旧照,大S穿吊带裙扎丸子头

财经要闻

ST岩石退市背后:A股“炒壳”时代终结

汽车要闻

极狐问道V9今日将正式上市 搭载华为雪鸮增程系统

态度原创

教育
时尚
亲子
艺术
数码

教育要闻

4个有效的课堂激励手段,简单又好用!

多巴胺“粉”,赫本是这样穿的!

亲子要闻

4岁女儿真记仇,因为爸爸惹她生气了,去参加她运动会还有条件

艺术要闻

这个夏天去苏州过几天清闲安逸的日子

数码要闻

买显卡送真黄金!技嘉40周年RTX 5090促销:买就赠1克999纯金

无障碍浏览 进入关怀版