网易首页 > 网易号 > 正文 申请入驻

ICLR 2025 | 让大模型更懂时序的语境对齐来了!性能更优开销更低

0
分享至

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

大语言模型在迅速发展的同时,也展现了其在下游任务中的卓越性能,这主要得益于丰富多样的大型语料训练库,使大语言模型掌握了一定的跨领域、跨任务的知识。

近两年,越来越多的研究工作利用预训练的大语言模型来构建时间序列分析模型。通过微调大语言模型,使其能够理解陌生的时序数据,进而激活其在时序分析任务中的能力。

近期,来自东方理工大学、香港理工大学和上海交通大学的研究团队提出了一种新的模态对齐范式 —— 语境对齐(Context-Alignment)。该方法将时间序列数据对齐到大语言模型熟悉的语言环境中,帮助模型更好地理解时间序列,从而激活其在时序分析方面的能力。该论文已被 ICLR 2025 会议接收。

  • 论文标题:Context-Alignment: Activating and Enhancing LLMs Capabilities in Time Series
  • 论文链接:https://openreview.net/forum?id=syC2764fPc
  • 代码链接:https://github.com/tokaka22/ICLR25-FSCA

以往的微调方法往往依赖于一个词库,通过各种方式将时序数据的 token 嵌入与词库中的词汇(例如 rise、fall、periodic、short 等)的 token 嵌入进行对齐,也就是说将大语言模型陌生的时序数据嵌入转化为其熟悉的语言嵌入。此前研究希望通过这种「词对齐」的方式帮助大语言模型理解时序数据,进而激活其在时序分析上的能力。

然而,这种依赖词库的对齐方式通常需要较大的计算开销,且是否能有效地帮助大语言模型理解时序数据还有待商榷。

语境对齐(Context-Alignment)

本文指出,大语言模型在处理语言时的能力更多源于其对语言逻辑和结构的深刻理解,而不仅仅是对词汇模式的表面对齐。因此,作者认为,即使使用精准的词汇来表达冗长的时间序列数据,这种方式也只是大量词汇嵌入的堆叠,缺乏语言的逻辑和结构,使得大语言模型难以真正理解其中的含义。

本文中,作者基于语言学中关于逻辑结构的层次关系,提出了语境对齐范式(Context-Alignment)。他们希望将时间序列数据融入自然语言的语境中,使大语言模型能够将时序数据整体视为一个语言成分,并通过上下文自主地理解时间序列

双尺度语境对齐图结构

考虑到图结构往往可以很好地表达逻辑和结构的关系,作者在时序数据和自然语言 prompt 的多模态输入上构建了双尺度图结构,以实现语境对齐。

具体来说,作者利用双尺度的图节点来描述语言结构的层次划分,在保证信息不丢失的前提下,将冗长的时序数据表达为一个整体,这就好像英语中的宾语从句,从句整体充当了一个语言成分,冗长的时序数据也应该被视为输入中的一个整体成分。利用有向边表达时序和 prompt 输入之间的逻辑关系。从而将时序数据对齐到大语言模型熟悉的语境中。

双尺度图结构包括细粒度图结构粗粒度图结构,其中:

就其效果而言,该双尺度图结构可以嵌入至大语言模型的任意层,并可多次使用,以强化大语言模型对语境对齐的记忆能力。

图 1 双尺度语境对齐图结构

VCA 和 FSCA

由于不同的 prompt 内容对应不同的逻辑结构关系,因此双尺度语境对齐图结构依赖于具体的 prompt 内容。作者提出了两种使用双尺度语境对齐图结构的具体方法。

1. Vanilla Context-Alignment(VCA)

VCA 是最直接的实现方式,其输入模式为时序数据 + prompt。例如,在预测任务中,prompt 为「predict future sequences using previous data」,其图结构如图 1 中的 VCA 所示。在分类任务中,输入为「时序数据 + Predict category using previous data」,其图结构与预测任务相同。VCA 利用最简单直接的 prompt,通过双尺度图结构实现语境对齐。

2. Few-Shot Context-Alignment(FSCA)

FSCA 是 VCA 的进阶版本,结合了 Few-Shot prompting 技术以进一步提升性能。该方法的输入包括例子 + 时序数据 + prompt。在预测任务中,prompt 依然为「predict future sequences using previous data」,但需要将原始历史时序数据分成两部分构建一个例子:前半段数据作为后半段数据的历史输入,后半段数据作为利用前半段数据预测的 ground truth。这一示例有助于大语言模型更好地理解预测任务。其图结构如图 1 中的「FSCA in TS Forecasting」所示。

图 2 展示了 FSCA 作为一个即插即用的模块被引入到预训练的大语言模型中进行微调。在分类任务中,FSCA 需要抽取一组时序数据和其对应的标签构成一个固定的例子,再进行分类预测。其图结构如图 1 中的「FSCA in TS Classification」所示。

图 2 利用 FSCA 进行时序预测

主要实验结果

各种任务上的表现

该研究展示了长期预测、短期预测、Few-Shot 预测、Zero-Shot 预测以及分类任务的实验结果。

实验表明,FSCA 在多个任务中均取得了更优的性能。尤其在 Few-Shot 预测和 Zero-Shot 预测中,FSCA 分别超越次优方法 6.7% 和 13.3%。FSCA 在 Few-Shot 和 Zero-Shot 预测任务中的出色表现表明,双尺度图结构成功引入了基于逻辑结构的先验知识。这进一步验证了正确的结构划分和逻辑引导对于大语言模型(LLM)理解时序数据的重要性。

表 1 长期预测结果对比

表 2 短期预测结果对比

表 3 Few-shot 预测结果对比

表 4 Zero-shot 预测结果对比

图 3 分类结果对比

计算效率对比

所提出的 FSCA 在计算效率方面仅次于 GPT4TS(该方法仅在 LLM 的输入和输出阶段加入了线性层)。

相比之下,其他流行方法在实现词 token 对齐时往往需要付出较大的计算代价。此外,这些方法通常包含额外的操作。例如,Time-LLM 在每次迭代中都会重复生成提示并检索相应的嵌入,进一步增加了计算开销。

相较而言,FSCA 中的双尺度 GNN 仅引入了两个可学习矩阵,以及两个用于将细粒度节点嵌入转化为粗粒度节点嵌入的可学习线性层。这些操作本质上是简单的矩阵计算,极大地降低了计算复杂性。因此,FSCA 在计算效率上显著优于以往基于词 token 对齐的方法,在保证性能提升的同时有效减少了计算资源的消耗。

总结

综上所述,本文首次提出了语境对齐(Context-Alignment)的概念,并基于双尺度图网络结构和 Few-Shot prompting 技术设计了 FSCA 模型。与以往流行的基于词 token 对齐的方法相比,FSCA 在实现更优性能的同时显著降低了计算开销。此外,原文还提供了更为详尽的消融实验、分析实验和对比实验结果,全面验证了 FSCA 的有效性和优势。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄罗斯计划侵略西欧?普京:纯属胡扯!无耻的谎言!

俄罗斯计划侵略西欧?普京:纯属胡扯!无耻的谎言!

澎湃新闻
2026-05-30 16:35:24
为何不许大陆统台?特朗普说了实话:中国统一后,将颠覆全世界

为何不许大陆统台?特朗普说了实话:中国统一后,将颠覆全世界

多多爱探索
2026-05-31 04:22:37
刘建业:会让向余望回归熟悉位置,也考虑保级后让他打4号位

刘建业:会让向余望回归熟悉位置,也考虑保级后让他打4号位

懂球帝
2026-05-30 23:41:09
中国老年痴呆人数全球第一:喝茶越多,痴呆的就越多,真的吗?

中国老年痴呆人数全球第一:喝茶越多,痴呆的就越多,真的吗?

复转这些年
2026-05-28 16:41:25
科学家挖出2000年前种子,尝试种植后,竟长出灭绝1500多年的植物

科学家挖出2000年前种子,尝试种植后,竟长出灭绝1500多年的植物

春风秋雨
2026-05-27 19:25:06
从0-1,2-1到2-3,刘建业的错误换人,让重庆铜梁龙从3分变0分

从0-1,2-1到2-3,刘建业的错误换人,让重庆铜梁龙从3分变0分

硬腿子聊个球
2026-05-30 22:52:25
云南,一方丈不幸身亡,整理遗物银行卡有528万存款,方丈女儿提出继承遗产,寺庙:出家人,这笔钱属于寺庙!

云南,一方丈不幸身亡,整理遗物银行卡有528万存款,方丈女儿提出继承遗产,寺庙:出家人,这笔钱属于寺庙!

LULU生活家
2026-05-30 18:01:03
汪小菲马筱梅带汪宝现身麻六记被偶遇,一家三口同框,画面温馨!

汪小菲马筱梅带汪宝现身麻六记被偶遇,一家三口同框,画面温馨!

情感大头说说
2026-05-31 01:57:16
葛荟婕罕见走心夸章子怡:长相超清纯,年纪越大眼神越坚定

葛荟婕罕见走心夸章子怡:长相超清纯,年纪越大眼神越坚定

观鱼听雨
2026-05-30 23:31:54
陕西西咸新区执法车沦为“堵门工具”,纪工委书记反问“咋不合适”意味着什么

陕西西咸新区执法车沦为“堵门工具”,纪工委书记反问“咋不合适”意味着什么

大象新闻
2026-05-30 18:47:05
不陪你们玩了!新加坡香会开幕,中国防长的座位却一直空着

不陪你们玩了!新加坡香会开幕,中国防长的座位却一直空着

阿龙聊军事
2026-05-30 07:52:07
费尔顿:哈登开始造犯规的!为什么亚历山大争议更大?

费尔顿:哈登开始造犯规的!为什么亚历山大争议更大?

历史第一人梅西
2026-05-30 10:50:35
NBA运气之王!打了3年替补,却被7500万砸中,直接躺平到退休

NBA运气之王!打了3年替补,却被7500万砸中,直接躺平到退休

体坛热评
2026-05-28 15:47:45
正式官宣!国务院放大招:城里有房家庭都乐开花,不仅宜居还增值

正式官宣!国务院放大招:城里有房家庭都乐开花,不仅宜居还增值

阿离家居
2026-05-29 16:56:30
马竞官方HWG连发:5分钟速签亚马尔佩德里拉菲尼亚,转会费惊人!

马竞官方HWG连发:5分钟速签亚马尔佩德里拉菲尼亚,转会费惊人!

英超德甲才疯狂
2026-05-30 07:11:42
恐吓威胁?孙杨对老婆说出这句话时,马頔的表情让所有人沉默了

恐吓威胁?孙杨对老婆说出这句话时,马頔的表情让所有人沉默了

喵喵娱乐团
2026-05-29 15:02:15
马英九提告萧旭岑后,李德维发声,金溥聪对两岸统一态度曝光

马英九提告萧旭岑后,李德维发声,金溥聪对两岸统一态度曝光

潋滟晴方DAY
2026-05-31 00:24:03
杜兰特迎新搭档!三方重磅交易出炉,西部格局或将改写

杜兰特迎新搭档!三方重磅交易出炉,西部格局或将改写

体育见习官
2026-05-30 11:01:43
梦鸽李天一赴美不归?看到85岁李双江“现状”,原来杨洪基没说谎

梦鸽李天一赴美不归?看到85岁李双江“现状”,原来杨洪基没说谎

阿纂看事
2024-11-05 11:54:58
巴黎卫冕欧冠!姆巴佩沦为笑话!恩里克3冠封神,阿森纳心碎一夜

巴黎卫冕欧冠!姆巴佩沦为笑话!恩里克3冠封神,阿森纳心碎一夜

墨史轩
2026-05-31 06:10:56
2026-05-31 06:44:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13116文章数 142655关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

体育要闻

巴黎再度捧起欧冠奖杯 枪手众将黯然神伤

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

游戏
艺术
本地
亲子
公开课

巫师3新DLC跨十年:年轻玩家在初发售时还是小孩!

艺术要闻

我想有个小院,从此荒度余生

本地新闻

用剪纸的方式,打开江苏扬州

亲子要闻

来一次说走就走,开启宝宝人生首次远行,去见不一样的风景

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版