网易首页 > 网易号 > 正文 申请入驻

专家访谈|王本友:分不清9.11和9.9谁大?大模型该做擅长的,而不是事事完美

0
分享至

作为生成式人工智能的代表,大模型已经进入全新的发展阶段。

红星新闻、红星资本局与OpenEval平台联合发起“巢燧杯”大模型创新发展大赛,已于本月正式启动。2024“巢燧杯”大模型创新发展大赛由通用大模型评测、行业大模型评测大赛、专项挑战赛、大模型应用场景挑战赛四个大赛组成。

近日香港中文大学(深圳)数据科学学院助理教授、深圳市大数据研究院研究科学家王本友在接受红星资本局专访时谈到,有了垂类模型不代表就能找到垂直应用,“最后一公里”涉及的问题非常复杂。他认为,垂类模型更像“先驱者”,有望比通用大模型更早实现“收大于支”。

对于近期很多大模型在“9.11和9.9谁大”的问题上答错,王本友认为,我们应该对大模型有“不一样”的期待:让它做自己擅长的,而不是事事都完美。


王本友

有垂类模型

不代表就能找到垂直应用

红星资本局:垂类大模型与通用大模型相比,能力有何不同?

王本友:垂类模型的能力会更有侧重。比如我们自己做的华佗GPT-2,去年11月做了一个评测,当月的国家药剂师考试,不论是中医还是西医领域,华佗GPT-2领先国内所有国内中文大模型也包括GPT-4。

但也有代价,华佗GPT-2在规划能力、推理能力、数学能力是比较高水平的,但是通用能力上相对缺陷,让它写代码肯定不如GPT-4,所以提升垂直领域的同时一定是牺牲一些通用能力的。

红星资本局:垂类模型是否意味着解决了场景落地难这些问题?

王本友:垂类模型诞生一定是为了解决垂直应用的问题,但有了垂类模型,不代表就能找到垂直应用。这个“最后一公里”涉及的问题要复杂得多。

我们做华佗GPT-2也尝试了很多场景,现在看可能会有两个场景落地会比较成功。

第一个是在分诊,患者不知道去哪个科室时可以跟华佗GPT-2聊一聊,它的能力是接近分诊台护士的,通过几轮对话就能判断适合的科室。这个场景的好处是比较简单,容错率高,即便出错可能就是会耽误一点时间,但不至于出性命之忧。今年深圳市龙岗区的12家医院会上线这个场景,我们认为会缓解当地医疗资源紧张的问题。

第二个场景我认为是用医疗大模型去做特定的医疗影像的诊断,比如说看x光写报告,判断有没有什么疾病,或者做体检报告的生成。这些场景不涉及直接给用户答案,会给医生提供辅助,医生最后“把关”结果,再提供给患者。

基于这个场景,大模型还可以先去做“医生助手”,帮医生提高就诊效率和学习效率,甚至可以做一些医生、医学生的医疗培训。当然这些场景也不意味一定能成功,还需要深入这个行业去了解和打磨尝试。

垂类大模型有望提早实现“收益大于支出”

红星资本局:你认为垂类大模型发展形势如何?

王本友:大模型技术快成熟的时候,它就会散播到各行各业。目前看大家都往“垂类应用”走,把大模型放在不同垂类应用去用。但对模型而言,我们并不是“一定要做一个垂直领域的模型”。

我认为垂类模型跟通用模型可能是“合久必分,分久必合”的关系。最近一年多可以看到大模型底座发展很快,市面上也有不少接近GPT-4的模型,基于这些模型也能调出很好的效果,这就导致通用大模型得到更多关注;但是技术总会饱和,之后大家就会把通用大模型放在不同的垂类应用去试。同时垂类大模型里取得的经验,也可以反馈到通用大模型里去提升它的能力。两者我认为是相辅相成的。

我们还是希望一个模型能解决所有问题,如果只有一个模型,更多的人就可以去分摊部署的成本。但这并不意味着垂类大模型就没有价值。垂类模型可以更快去探索垂类应用存在什么问题,先看水有多深,我相信最后这些经验还是会合到一起,放到通用大模型里。

红星资本局:垂类大模型的挑战在哪里?

王本友:什么场景最适合垂类模型来解决,这是一个非常难的问题。现在的情况是“懂大模型的人不懂领域、懂领域的人不懂大模型”,这是一个老生常谈的挑战。因为大模型技术派和各领域专家互相有着非常大的知识门槛,两者很难去对齐。

我们真的需要非常好的既懂模型又懂场景的人找到一个点去突破,目前看来这些点大家找的都不太好。所以未来需要多培养一些大模型跟各个领域的复合型人才。

另外一个挑战在于“直接把模型拿过来,但不见得就能用”。大部分人拿大模型往垂直一用,发现效果不好,就没耐心继续尝试,这也导致大模型在找应用场景方面,受到很多挫折,耐心越来越少,也导致整个行业都没有做好这件事情。

垂类模型的试错成本也很高。以医疗来说,涉及到的东西非常复杂,很多时候选错一个赛道,可能就会错过5-10年的时间。这对企业就是灾难性的。

比如说在传统医疗AI场景,大家都希望去给病人提供在线咨询,这件事的好处也是显而易见的。但实际上这个需求做了几十年,到现在几乎没有人在这个落地场景上做出一些成绩,做这类的公司现在都比较被动。原因就是大家小看了这个场景的复杂度,觉得AI能解决这个问题,但其实技术离真正做到这件事情还很远,而且这个场景容错性也非常低,一旦出错,伦理道德法律问题基本是不可能解决。

红星资本局:那为什么还要做垂类大模型?

王本友:垂类模型有它的优势。打个比方,通过大模型去解决医疗问题,需要1000亿,但是垂类模型,可以“阉割”很多不必要的能力,可能花费百亿左右就可以解决问题。相当于做的事情少,可以用更少的开销完成,这对做垂类模型的企业来说,也算成本优势。

我们做大模型应用,本质上解决两个问题:成本和收益。如果收益小于成本,那用户越多亏得越多。

垂类模型在于,成本可能会比通用大模型省10倍甚至更多。而且相较于通用大模型,它的收益也会更多,因为在通用大模型里写代码、聊天,本质上它带不了更多价值。

但垂类模型,比如金融场景帮你买一个好的股票,会让用户赚一大波钱;在法律场景里也许还能省去律师的咨询费。就是说成本更低的垂类大模型,垂直应用带来的收益更多,那么它就可以比通用大模型更早实现收支平衡。

这就是为什么垂类模型可以作为一个先驱者去探索的逻辑所在,它可以提早实现“收益大于支出”的点。

大模型不必“事事完美”

红星资本局:您认为现在大模型发展面临的问题,更紧迫的是技术突破,还是成本问题?

王本友:这两者是相辅相成的。只有你成本降低之后,技术才能发展更加迅猛。如果现在大家都可以很方便地去训练大模型,不用花太多成本,那大家肯定愿意各种尝试。只要尝试一个新的技术,大模型肯定就像雨后春笋一样铺开了。

如果成本部署得很便宜,那所有人都可以去部署自己的模型,让大家用起来,用起来就产生价值,随后就有资本投入,资本投入就有更多的芯片,然后技术去实现突破,所以我觉得成本降低对技术有很大促进作用,同时技术发展本身也会促进成本降低。可以看到现在就有很多技术去研究怎么降低大模型推断成本。

红星资本局:金融、医疗、法律行业对大模型的应用有哪些特别的挑战?您如何看待大模型在这几个行业数据隐私和安全性方面的应用?

王本友:对金融的挑战,主要是大模型对数值的敏感性可能比较难,给它一串数字,或者给股票每天涨幅跌幅这种数值,模型可能不一定能理解“是涨是跌”。就好像最近“9.11和9.9谁大”大模型做错了,对金融模型来说这就是比较大的问题。

对医疗模型来说,也涉及到数值问题,但更严重的还是知识储备不足,比如一个药的成分是什么,它如果不知道这个药就无法回答。法律的难点可能就在于引用条文的检索上,比如说在一个法律诉讼或者法律咨询上,我们要具体参考哪一条法律,哪个条文,如果没检索对那差错就很大。

这几个行业涉及到隐私和数据安全的问题比较复杂。比如用户在使用大模型的时候,提问过程有没有将隐私泄露给大模型的可能。

另外在给公众提供服务的时候,要尽量避免私有数据的使用。我们自己在训练医疗大模型时,严格意义上不会用医院的数据或者个人的私有数据,尽量用公开数据。现在面临的问题是公开数据比较饱和,如何在保证用户隐私和商业机密的前提下,去调用更多可用数据。

我认为一方面用户自己要加强隐私方面的意识,另外也可以采用“端测大模型”方案,比如大模型直接部署在云端手机上,这样数据不用上云,不会泄露自己隐私,当然这个技术上也有挑战,还要看端侧模型能否满足需求。

红星资本局:最近很多大模型在“9.11和9.9谁大”上答错,这是否意味着我们对大模型期待过高?

王本友:大模型跟我们理解的数字不是一个东西,对大模型而言,数字也是token(Token通常指的是语言处理过程中的一个基本单位),它的处理方式要看怎么去拆分词。本质问题在于我们把一个连续空间里边的数值映射成向量空间里面的点,这对大模型而言是比较难的。

但我认为这个问题并不需要去“解决”,大模型应该去处理它“擅长”的东西,不擅长的则通过工具来实现,比如调用计算器,这件事就很容易解决。

人也是需要工具去解决问题,所以对大模型要有“不一样”的期待:让它做自己擅长的,而不是事事都完美。

红星新闻记者 王田 实习生 刘川蒙

编辑 杨程

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女子香港花近400万买15平米,晚上睡衣柜顶,客厅宽敞还有大阳台

女子香港花近400万买15平米,晚上睡衣柜顶,客厅宽敞还有大阳台

哄动一时啊
2024-12-27 19:30:03
“上班后发现同事是太奶??”哈哈哈哈哈真是开了眼了!!

“上班后发现同事是太奶??”哈哈哈哈哈真是开了眼了!!

浪花妈妈
2025-01-07 22:37:15
重回杜锋门下,36岁周鹏做出选择,发声决定,娇妻支持

重回杜锋门下,36岁周鹏做出选择,发声决定,娇妻支持

东球弟
2025-01-08 15:23:02
陆一线男星爆「袭胸杨幂」猥琐喊:软软的! 受害女艺人名单曝光

陆一线男星爆「袭胸杨幂」猥琐喊:软软的! 受害女艺人名单曝光

ETtoday星光云
2025-01-08 15:28:06
张雪峰点赞辛巴怒怼钟睒晱,辛巴:我捐了5个亿,你把儿子送出国

张雪峰点赞辛巴怒怼钟睒晱,辛巴:我捐了5个亿,你把儿子送出国

汉史趣闻
2025-01-06 17:43:08
一个国家的精神,就印在他们的钞票上

一个国家的精神,就印在他们的钞票上

尚曦读史
2025-01-07 23:45:38
消息传来:王星已和女友见面!电诈园区收200万元赎金才放人?知情人透露→

消息传来:王星已和女友见面!电诈园区收200万元赎金才放人?知情人透露→

上观新闻
2025-01-08 18:39:12
太狠了!普京是真的没想到,朝鲜士兵一出手,就把西方打“急”了

太狠了!普京是真的没想到,朝鲜士兵一出手,就把西方打“急”了

君君文谈
2025-01-06 16:14:42
反转来了!工作人员曝光马天宇李明德片场照,这场闹剧也该结束了

反转来了!工作人员曝光马天宇李明德片场照,这场闹剧也该结束了

小淇言说
2025-01-08 00:51:49
台海动真格了:台军2舰拦截我军1舰,过程惊心动魄,说话都带颤音

台海动真格了:台军2舰拦截我军1舰,过程惊心动魄,说话都带颤音

猫眼观史
2025-01-05 17:55:22
布林肯离开后,韩代总统默许逮捕令,不到24小时,尹锡悦疑似出逃

布林肯离开后,韩代总统默许逮捕令,不到24小时,尹锡悦疑似出逃

猎火照狼山
2025-01-08 20:16:34
浙江商人把公司低价卖给外资,留0.01%股份分红,今公司市值430亿

浙江商人把公司低价卖给外资,留0.01%股份分红,今公司市值430亿

晓徙历史
2025-01-07 15:48:53
收割机!詹姆斯本赛季迄今已达成8项里程碑 生涯持有70项NBA纪录

收割机!詹姆斯本赛季迄今已达成8项里程碑 生涯持有70项NBA纪录

直播吧
2025-01-08 07:55:06
连宣3人!官方:31岁归化国脚李可加盟上海申花

连宣3人!官方:31岁归化国脚李可加盟上海申花

直播吧
2025-01-08 10:35:57
还要再打2场!首秀砍49分的谢泼德:火箭结束三连客后与球队回合

还要再打2场!首秀砍49分的谢泼德:火箭结束三连客后与球队回合

直播吧
2025-01-08 12:11:38
真有天性凉薄的孩子吗?网友:长大了,就断绝往来了

真有天性凉薄的孩子吗?网友:长大了,就断绝往来了

美好客栈大掌柜
2024-12-11 00:05:14
村民当年为什么愿意出钱资助一穷二白的刘强东,体现在五个细节上

村民当年为什么愿意出钱资助一穷二白的刘强东,体现在五个细节上

看晓天下事
2025-01-08 14:47:24
格陵兰岛,丹麦大概率是保不住了这块270万平方公里的肥肉

格陵兰岛,丹麦大概率是保不住了这块270万平方公里的肥肉

玲子日记
2025-01-07 12:56:04
今年的“甲流”十分厉害,比往年都要严重?得甲流了,怎样好得快

今年的“甲流”十分厉害,比往年都要严重?得甲流了,怎样好得快

爆炸营养彭鑫蕊
2025-01-07 16:24:46
一位样貌出色的女性黑奴被农场主选中,被迫光着身子去招待客人

一位样貌出色的女性黑奴被农场主选中,被迫光着身子去招待客人

梦里大唐
2025-01-02 16:30:23
2025-01-09 01:00:49
红星新闻 incentive-icons
红星新闻
成都传媒集团旗下的新媒体平台
171102文章数 1324587关注度
往期回顾 全部

科技要闻

李开复第一个讲了出来,不再追求 AGI

头条要闻

38岁群演曾被骗至缅甸家属花百万救回:诈骗手段已升级

头条要闻

38岁群演曾被骗至缅甸家属花百万救回:诈骗手段已升级

体育要闻

消失3年后,国乒冠军成为一名大学老师

娱乐要闻

星星女友传来好消息:已和星星见面

财经要闻

2025年,年轻人的抠门远远不止反向消费

汽车要闻

10万元级无图智驾 悦也PLUS全路况实测

态度原创

本地
旅游
艺术
家居
公开课

本地新闻

韩国人来中国旅游,已经吃不了兜着走了

旅游要闻

张家口一滑雪场游客坐缆车坠落,人已送医

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

家居要闻

诠释未来 置身星际之间

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版