网易首页 > 网易号 > 正文 申请入驻

落地有声|“大模型应用尚在早期,兼具技术积累和商业眼光才能走向头部”

0
分享至

·大模型的商业应用还处于浪潮最早期,很难说哪家企业会率先占据某个赛道的主导权,一方面要看企业技术积累、快速迭代和应变能力,另一方面也要看企业的商业整合能力和商业布局眼光。

·目前大模型测评集并不能满足金融业务的真实需要。金融测评集主要以客观选择题结合主观问答的方式评估大模型的准确率、稳定性,但这并不能有效指导模型进一步优化。金融界数据缺乏共享,金融交易规则和金融工具内部逻辑复杂,高质量数据的可获得性是影响大模型效果的瓶颈之一。


中国大模型产业从卷性能、卷排名、卷价格,到如今越来越关注落地应用。尽管在技术和产品上存在同质化,但产业界已经开始向差异化探索迈进。

上海财经大学信息管理与工程学院院长黄海量日前在接受澎湃科技采访时表示,“大模型的商业应用还处于浪潮早期,很难说哪家企业会率先占据某个赛道的主导权。”迈向头部,考验的既是企业本身的技术积累、快速迭代和应变能力,又是企业的整合能力和商业布局眼光。

以金融行业为例,大模型落地金融,可解释性、安全性、公正性、严谨性仍是痛点,他表示,“大模型+金融”既要考虑实际业务需求和内在逻辑,更要关注应对金融风险、促进金融公平,这是我国金融发展更重要的关切,而不仅仅着眼于如何提升金融领域的工作效率和投资效率。

同质化是必经阶段,但无法产生竞争力

谈及当前学术界对大模型的研究热点,黄海量表示,大模型的基础理论和算法架构是当前学术研究的前沿课题。大模型为何能够通过神经网络,结合上下文生成合理的语言,甚至存在类人的思维,这些底层的科学原理仍未完全摸清,学术界需要进一步探索创新。同时,持续的算法创新和数据工程技术探索将是推动大模型持续进步的关键。经典Transformer模型在处理长文本时会出现理解能力有限、效率较低、算力消耗过大等问题,学术界探索基于改进位置编码和注意力机制的新型模型结构,大幅提升模型对长文本的理解能力。特定领域高质量训练数据标注成本高,先进的数据合成、数据筛选技术将通过大规模、高质量、多样化的训练数据进一步提升大模型在金融等特定领域任务中的能力。

当前大模型的另一个研究热点是如何让大模型与RAG(检索增强生成)等其他工具相互配合、有效协同,发挥更大威力。大模型在生成回答时,通过RAG检索外部知识库,动态获取最新的相关信息,以弥补大模型内部知识的不足。然而,如何提升检索质量、高效地将检索到的信息与大模型的生成能力结合,仍然是一个复杂的技术问题。特别是在需要快速检索和生成高质量内容时,如何平衡计算开销与响应速度,是大模型与IT系统协同的关键挑战。

从产业界来看,中国大模型产业历经打榜、降价,逐步步入应用,走向搜索、音乐、金融、社交等各行各业。尽管当前大模型技术和产品存在同质化,但黄海量认为,从科技发展历程来看,同质化是必经阶段,无论是大模型的原创性技术,还是垂直落地的应用技术,当前都还处于科技浪潮的早期,在这个阶段,业界对大模型的认知是有限的、趋同的,这约束了大模型应用开发的发散性。

“同质化无法产生竞争力。”黄海量也看到,产业界正在探索差异化道路,比如在模型架构上尝试非Transformer架构,在数据采集和训练方式上采用独特的方案等,“避免在同质化的路上越卷越深。” 他提到,在“大模型+证券投资研究”研究领域,A机构采用大量研究报告等公开数据和少量自有数据,B机构基于几十年来沉淀的私有数据和部分公有数据,数据来源和训练方式不同,最终模型的特点和应用场景也不同。

当前,大模型杀手级应用尚未出现,国内外大模型企业都在探索过程中。“大模型的商业应用还处于浪潮最早期,很难说哪家企业会率先占据某个赛道的主导权,一方面要看这些企业本身的技术积累、后续的快速迭代和应变能力,另一方面也要看这些企业的商业整合能力和商业布局眼光。”黄海量表示,所谓商业整合能力,即技术出身的企业能否真正与特定行业形成产业链的整合,而不仅仅是作为乙方为甲方提供解决方案。“以金融为例,你必须不仅仅是一个科技企业,而是一个既懂金融又懂科技的企业,能够理解金融背后的业务逻辑、合规风险等,同时又有很强的科技研发能力。”

大模型+金融,痛点待解决

大模型在金融领域的落地,风险是核心问题,黄海量表示,“大模型落地金融既要考虑实际业务需求和内在逻辑,更要关注应对金融风险、促进金融公平,这是我国金融发展更重要的关切,而不仅仅着眼于如何用大模型提升金融领域的业务能力和效率。”

当前,可解释性、安全性、公正性、严谨性仍是金融大模型的痛点,黄海量表示,目前产业界并没有形成公认的解决方案。“各家都在按照各自的理解尝试解决。大模型本身是一个黑箱模型,构建可信大模型的途径之一是采用子任务分解和检索增强的方式。一个整体任务分解成若干个相对独立的子任务给不同的大模型智能体,在完成各个子任务的同时,从知识库中检索到相关的支撑依据并以参考文献的形式表述出来。这样通过观察子任务的输入输出结果,观察大模型在各个环节做了什么工作,来降低大模型的黑箱化程度。另一种方式是通过思维链等方法,让大模型既给出答案,同时也给出一步一步的推理过程。”

与此同时,模型性能和稳定性还有待提高。黄海量表示,同一个模型针对某一类问题过拟合的现象仍然严重,大模型通过二次训练、精调、提示工程等,在回答某类问题时表现良好,但往往在回答其他问题时存在较大短板。

除了模型本身的问题,将金融专业知识转化成数据以训练模型时,数据的丰富程度也困扰着行业,影响模型落地。黄海量表示,金融领域并不缺乏专业知识,但金融界数据由于缺乏共享,以及金融交易规则和金融工具的内部逻辑复杂性,高质量数据的可获得性成为影响大模型效果的瓶颈之一。

评测是大模型不断进化的指挥棒和指南针。为了评价大模型的能力,学术界和产业界都在开发大模型的测评集。学术界推出的测评体系主要考察模型知识和某种特定能力,产业界则更贴近实际业务需求。但黄海量表示,以金融领域为例,目前大模型测评集并不能够满足金融业务的真实需要。当前的金融测评集主要以客观选择题结合主观问答的方式评估大模型的准确率、稳定性,但这些测评集并不能有效指导模型的进一步优化。

“金融领域的很多问题不是通过选择是或否来解决的,所以不能通过选择题来测试模型性能,而是必须要看模型本身的在场景中的业务能力,比如投资研究的逻辑性、产品设计的创新性等,需要模型像人类专家一样‘从0到1’解决一个开放问题,但测评集往往无法测评这些方面的能力。”黄海量表示,缺乏和金融行业需求贴合的测评集,与缺乏高质量数据一样,都是阻碍模型性能进一步提升的因素。目前学术界和产业界正在联合开发更贴近应用场景真实需求的测评集。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
出人意料,成都女老板套现5.5亿,把正在盈利的家业交给了国资

出人意料,成都女老板套现5.5亿,把正在盈利的家业交给了国资

历史阿务
2025-02-17 14:58:13
天生坏种?被判10年的李天一出狱后,最恶心的一幕还是出现了

天生坏种?被判10年的李天一出狱后,最恶心的一幕还是出现了

小啾咪侃侃史
2024-09-07 15:30:03
安徽亳州一特斯拉坠河致4人遇难,现场画面曝光,知情者发声

安徽亳州一特斯拉坠河致4人遇难,现场画面曝光,知情者发声

小人物看尽人间百态
2025-02-18 16:46:20
诺兰新片《奥德赛》首曝剧照 达蒙饰奥德修斯

诺兰新片《奥德赛》首曝剧照 达蒙饰奥德修斯

3DM游戏
2025-02-18 08:47:34
A股:大家要做好准备,周三(2月19日),大行情很可能要来了

A股:大家要做好准备,周三(2月19日),大行情很可能要来了

财经大拿
2025-02-18 15:59:50
今年清明不一般,老人说:“60年不遇,4人不上坟”,指哪4人

今年清明不一般,老人说:“60年不遇,4人不上坟”,指哪4人

古装影视解说阿凶
2025-02-18 00:50:39
一半钢琴厂倒闭,几万块的钢琴,5000块都卖不出!中产更惨了

一半钢琴厂倒闭,几万块的钢琴,5000块都卖不出!中产更惨了

老鹈爱历史
2025-02-18 09:16:48
中国一哥一轮游!张之臻0-2遭资格赛选手横扫 无缘战阿尔卡拉斯

中国一哥一轮游!张之臻0-2遭资格赛选手横扫 无缘战阿尔卡拉斯

醉卧浮生
2025-02-18 21:43:26
1950年蒋介石姐姐被判死刑,周恩来求情无果:原来她还有另一身份

1950年蒋介石姐姐被判死刑,周恩来求情无果:原来她还有另一身份

纪实文录
2025-02-18 13:37:53
6岁男孩被亲人杀害!遗体装在她家阳台的桶里,知情人曝其中原因

6岁男孩被亲人杀害!遗体装在她家阳台的桶里,知情人曝其中原因

妙知
2025-02-18 22:47:08
赖清德喊话要干3件事,岛民认为:不少官兵或叛逃至大陆

赖清德喊话要干3件事,岛民认为:不少官兵或叛逃至大陆

排头军史官方
2025-02-18 12:13:01
被网暴4年后,“大衣哥”朱之文决定起诉网暴者

被网暴4年后,“大衣哥”朱之文决定起诉网暴者

大风新闻
2025-02-18 10:12:16
女孩被骗到缅北有多惨?最不幸的不是“双开门”,而是拥有处子身

女孩被骗到缅北有多惨?最不幸的不是“双开门”,而是拥有处子身

民间精选故事汇
2025-02-12 08:10:03
好消息!退休人员养老金账户收到1200元,什么钱?谁能领?

好消息!退休人员养老金账户收到1200元,什么钱?谁能领?

阿纂看事
2025-02-18 11:18:32
“亏了100多万!”南京这个小区,卖出首套二手房

“亏了100多万!”南京这个小区,卖出首套二手房

地产锐评
2025-02-18 17:58:44
热辣滚烫! “鸟叔”PSY因过度减肥向粉丝道歉

热辣滚烫! “鸟叔”PSY因过度减肥向粉丝道歉

大象新闻
2025-02-18 13:58:02
中国是否考虑向乌克兰派遣维和部队?外交部回应

中国是否考虑向乌克兰派遣维和部队?外交部回应

澎湃新闻
2025-02-18 15:50:26
广东一53岁女子天天吃西红柿,坚持一年后,结果让医生都羡慕不已

广东一53岁女子天天吃西红柿,坚持一年后,结果让医生都羡慕不已

39健康网
2025-02-10 18:30:31
网传一男子因为没工作、没钱,就用先用后付买铜棒换钱,生活不易

网传一男子因为没工作、没钱,就用先用后付买铜棒换钱,生活不易

笔尖下的人生
2025-02-17 19:21:10
拉夫罗夫否认三点和平计划,警告不要在乌克兰派遣西方维和人员

拉夫罗夫否认三点和平计划,警告不要在乌克兰派遣西方维和人员

桂系007
2025-02-19 01:56:59
2025-02-19 03:40:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
765087文章数 5058822关注度
往期回顾 全部

财经要闻

存款准备金率5%隐形下限能否突破?

头条要闻

10元1个螺母被认定为枪支散件 父子被刑拘获分案调查

头条要闻

10元1个螺母被认定为枪支散件 父子被刑拘获分案调查

体育要闻

曾遭遇两年欠薪,国足最新归化球员是他?

娱乐要闻

陈晓与陈妍希宣布离婚:今后各自安好

科技要闻

马斯克发布"最聪明AI":号称碾压DeepSeekV3

汽车要闻

两种电池可选 小米YU7最大续航820km

态度原创

艺术
亲子
数码
本地
公开课

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

亲子要闻

娃睡不踏实、老哼唧?这个原因家长很容易忽略(不是冷

数码要闻

体验全升级,最低4200元! 联想小新Pro这波新品太炸了

本地新闻

非遗版春节|新春青岛行,是谁闯入了动漫世界?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版