本文9.1发在北大国发院校友上面,改了个题目转发下:
2024年8月25日在北大国发院承泽园的429教室AI碰撞局举行了第四场活动,本次分享嘉宾是北京大学人工智能研究院的徐骅老师,总计70多名校友和嘉宾通过线下线上的方式参与了本次活动。
AI碰撞局主理人王新在启动活动
徐骅老师在做分享
徐老师是医疗、ChatLaw等大模型的操盘人,分享却并不局限于的技术,而是通俗易懂的从模型讲到了业务和案例。
在技术路线上,徐骅老师提到了一个更为快速和低成本的提升大模型性能的方式:
当开源模型和闭源大模型性能逐步接近,那一种提升模型性能的策略则是站在巨人的肩膀上,让自己站位更高。
这种站到巨人肩膀上的技术是RLHF:
站到巨人肩膀上的具体实现方式则是Aligner。
这可能不太好理解现场徐骅老师和侯宏老师都用这样一个例子来类比这个方法:
假如一个人要考北大,那从0开始培养的方式无疑是最难的,但假如在650分的基础上进行培养,那难度就会降低很多。这就是上图左下那两个机器人的含义。这种两段叠加方法一方面固然可能产生比已经发布模型更好的效果,但更关键的点在于它缩短了向具体行业进行落地的周期。
在落地环节徐老师则以标准化病人系统为切入,分享了上述思路下大模型落地的方法。结合分诊、多模态模型识别病症、合理用药、病例整理、一体机的部署方式等各方面落地案例,我们可以比较清楚的看到,究竟需要怎么在现实中总评估AI大模型的临床能力,在那些方面仍然面对挑战等AI大模型的具体问题。
徐老师分享之后则进入碰撞环节,本次碰撞环节参与的嘉宾是徐骅老师,侯宏老师,未名企鹅邹晓亮博士,E21的李智勇继续担任主持人。
右-左:徐骅老师、侯宏老师、邹晓亮博士
碰撞环节谈了很多问题,但最有意思的一个是:假如AI确实能够比人干的更好,那当它不可完全证明的时候,究竟能不能用?
比如对于分诊,大模型其实是更便宜的,随机选择某些疾病种类后精度也可以更高,至少可以比人高,但你没办法百分百证明的是所有疾病都可以确定在某个精度上。那基于AI大模型的产品怎么去通过三级医疗器械证呢?这是合规上的问题。
假设通过了之后,那还马上遭遇成本问题。
通过医疗器械的验证后,比如各方面费用花1000万或者2000万,那你进行销售的时候在一个B端模式下,你可能又要比较长的时间才能赚回这1000~2000万,甚至如果业务能力不够就很长时间也赚不回这1000万,面对比较大的投入产出问题。
类似的情况可以推广到专科疾病、辅助诊疗等,在这些情景下AI的落地不直接卡在技术,而是卡在可解释性、权责体系和某种投入产出的结构上。
碰撞进行时
这个话题一打开,因为非常本质,随后碰撞就收不住了。因为大家发现在现有体系里实际上是在找各种缝隙,比如如果诊疗方面三类医疗器械证不好推进,那是不是在审方环节可以更容易切入?过去基于规则审方因为规则写的死,到了8种10种药的时候就处理不好了,那是不是可以用AI大模型来更低成本的解决这个问题?
进一步就进入更深层次的问题,即使能解决上面说的问题,但AI大模型其实不是用来解决这种小点问题的,也不体现AI大模型的经济性,会有点像大炮打蚊子。这次的AI大模型其实更适合扮演全科的医生,而不是专科医生,可显然的全科医生会碰到更大的权责问题、投入产出问题。
再递进一步就到了一个脑洞环节,如果说AI确实可以提供更好的诊疗服务但现实总与现在的既有运转流程的兼容性不好,那我们是不是可以换个视角:
是不是可以构建一个AI优先的医院,这个医院里主要是AI,不是人类医生在提供服务。当然这个要符合国家的规定。这样这个医院可以有更大的服务数量和质量。
这点上徐老师补充的是在AI的技术进化上,10年应该可行做到手术之外的部分。侯老师的补充则是往往产业中突破都是从一体的模式开始突破,然后才走到细碎分工比如电脑、手机等都是先单起一套体系。
上面这些问题并不局限于医疗健康,在法律等领域其实存在类似的问题。
和这种产业问题并列,碰撞还谈到了一个偏技术的问题,大家针对一体机这种新产品谈了许多。一体机其实就是一种跑AI大模型的新电脑,里面有GPU、大模型、行业应用等。
有意思的是虽然大家对AI创造了什么样的机会感知度差异很大,比如有的认为C端基本没机会,有的则认为C端在新技术条件下还会产出很多新的尝试,但和过去的应用形态就不一样了。
但在一体机上大家的观点则出奇的一致。行业里面落地形式基本就是一体机,也不可能是公有云、SaaS等。类似数据不能出医院这种规定很多很多,不是一体机也搞不定。
但一体机一样面临一串细节问题:对应的行业问题适合哪个规模的模型?哪个规模的大模型需要什么配置的一体机?那家的GPU性价比更高?后续升级怎么处理?
这些记录中没有办法详细展开,因为会牵涉很多厂家,引发不必要的争议。简单总结就是当前这个产品的整体成熟度还可以,如果真要介入那还是需要对模型的技术参数有一定程度的认识,并没有标准到电脑那个程度。
活动结束时大家的合影
还有不少很有意思的碰撞条线没法一一展开,其中最值得一提的是关于:B端到底能不能做?当大家提出这个问题并谈到挑战实在太多的时候,未名企鹅的邹晓亮师兄结合自己的亲身经历给了一个走产业逻辑的例子:早期的几年你可能会很痛苦,这部分可以看成是介入的成本,但一旦成功介入你就会形成比较稳定的业务基础,并不是那个大厂突然冲击一下就会威胁你的业务基础的。他们自己也是到第六年才实现收支平衡。
这个时点的AI太混沌了,宣称有赚钱方法的大概率是骗子,宣称全无机会的又过于消极。面对AI就得解剖麻雀,研究案例,回到现场,获取一线信息。反之越高大上、越论文就越危险。关键是真实案例不好找,所以就有了琢磨事AI碰撞局。研究清楚多个案例,弄明白产业底层逻辑,再回到自己问题差不多是眼下最靠谱的方式了。对活动感兴趣的同学请联系cathywangyue。 老李话一三,公众号:琢磨事
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.