网易首页 > 网易号 > 正文 申请入驻

少即是多!10亿参数「小巨人」击败ChatGPT

0
分享至


新智元报道

编辑:耳朵 庸庸

【新智元导读】只有10亿参数的xLAM-1B在特定任务中击败了LLM霸主:OpenAI的GPT-3.5 Turbo和Anthropic的Claude-3 Haiku。上个月刚发布的苹果智能模型只有30亿参数,就连奥特曼都表示,我们正处于大模型时代的末期。那么,小语言模型(SLM)会是AI的未来吗?

大语言模型的Scaling Law被一些人视为「金科玉律」,但另一些人却不以为意。前阵子,香港大学马毅教授就公开宣称,「如果相信只靠Scaling Law就能实现AGI,你该改行了」。

确实有很多模型不是单纯靠资源的堆砌,而是凭借创新能力脱颖而出。验证了一条不同于Scaling Law的道路——少即是多。

xLAM-1B就是如此,只有10亿参数,但是在功能调用任务中表现优于更大规模的模型,包括OpenAI的GPT-3.5 Turbo和Anthropic的Claude-3 Haiku。


它也因此被称为「Tiny Giant」——小巨人!

凭借远超预期的卓越性能,这个小模型或许会改变端侧AI的格局。


西方将这种以弱胜强的故事称之为「David-versus-Goliath」(大卫迎战歌利亚),这源于一个圣经故事——大卫与巨人歌利亚作战时还是个孩子,他不像歌利亚那样穿着盔甲,他捡了一块石头,放在投石器里。把石头甩出去,击中歌利亚的额头,击倒了这个巨人。

科技媒体Venturebeat在报道这个小模型时,就将之比喻为人工智能领域的「大卫迎战歌利亚」时刻。

我们最关心的一点是,xLAM-1B是如何做到的?

简言之,这得益于在数据处理上的创新方法。其背后团队开发了APIGen,这是一套自动化流程,可以生成高质量、多样化且可验证的数据集,用于训练AI模型在函数调用任务中的表现。


论文地址:https://arxiv.org/pdf/2406.18518

小而强大:高效AI的力量

xLAM-1B最令人欣喜的在于,它不占地儿。因为模型规模小,所以适合设备上的应用。这对企业人工智能的影响是巨大的,它有可能使AI助手功能更强大、反应更灵敏,并且能在计算资源有限的智能手机或其他设备上本地运行。

训练数据的质量和多样性是支撑xLAM-1B强大性能的关键。APIGen自动数据生成流水线利用21个不同类别的3673个可执行API,对每个数据点进行了严格的三阶段验证:格式检查、实际函数执行和语义验证。


各种AI模型在不同评估指标下的性能对比图。GPT-4-0125-Preview在总体准确性方面遥遥领先,而xLAM-7B等较小的模型在特定任务中表现出了竞争力,这对大模型总是表现更好的说法提出了挑战

这种方法代表了人工智能发展战略的重大转变。

虽然许多公司都在竞相建立越来越大的模型,但xLAM-1B所使用的方法表明,更智能的数据处理可以带来更高效、更有效的人工智能系统。

通过关注数据质量而非模型大小,xLAM-1B提供了一个很好的例子,它可以用比竞争对手少得多的参数执行复杂的任务。

颠覆AI现状:从LLM到SLM

这一突破的潜在影响绝不仅限于xLAM-1B这个模型的推出。

通过证明更小、更高效的模型可以与更大的模型竞争,xLAM-1B正在挑战人工智能行业的主流观点,作为小语言模型(SLM)的新军,和一统江湖的大语言模型(LLM)开战。


科技公司一直在争相建立最大的大语言模型。例如,今年4月,Meta公司发布了拥有4000亿参数的Llama 3,它所包含的参数数量是2022年OpenAI最初的ChatGPT模型的两倍。

尽管尚未得到证实,但GPT-4估计拥有约1.8万亿个参数。

不过,在过去几个月里,包括苹果和微软在内的一些最大的科技公司都推出了小语言模型。

这些模型的大小仅为LLM对应模型的一小部分,但在许多基准测试中,它们在文本生成方面可以与LLM相媲美,甚至更胜一筹。

6月10日,在苹果公司的全球开发者大会上, 发布了拥有约30亿参数的苹果智能模型 。

4月底,微软发布了其 Phi-3 SLM系列 ,拥有38亿到140亿个参数。

在一系列测试中,微软最小的模型Phi-3-mini与OpenAI的GPT-3.5(1750亿个参数)不相上下,其表现也优于谷歌的Gemma(70亿个参数)。


测试通过向模型提出有关数学、哲学、法律等方面的问题,评估了模型对语言的理解能力。

更有趣的是,拥有70亿个参数的微软Phi-3-small在许多基准测试中的表现都明显优于GPT-3.5。

波士顿东北大学研究语言模型Aaron Müller并不惊讶SLM在某些功能上可以与LLM相提并论。

Müller说,「这是因为一味增加参数数量并不是提高模型性能的唯一方法,在更高质量的数据上进行训练也能产生类似的结果。」

例如,微软的Phi模型是在经过微调的「教科书质量」数据上训练出来的,这些数据的风格更加一致,比LLM通常依赖的来自互联网的高度多样化文本更容易学习。

同样,苹果公司也在高质量、更复杂的数据集上训练SLM。

Müller表示,更重要的是,SLM可以使语言模型的使用平民化。

迄今为止,人工智能的开发一直集中在几家有能力部署高端基础设施的大公司手中,而其他规模较小的公司和实验室则不得不支付高昂的费用来获得授权。

由于SLM可以在价格更低廉的硬件上轻松训练,因此资源有限的人更容易获得SLM。

SLM的兴起正值LLM之间的性能差距迅速缩小,科技公司希望能在Scaling Law之外,探索其他性能升级途径。

在4月份的一次活动中,OpenAI 的首席执行官Altman表示,他相信我们正处于大模型时代的末期。「我们将以其他方式让模型变得更好。」

也就是说,经过精心策划的SLM向构建可解释性人工智能更近了一步。

对于像苏黎世联邦理工学院计算机科学研究员Alex Warstadt这样的研究人员来说,SLM还能为一个长期存在的科学问题提供新的见解:儿童是如何用很少的文字数据就学会语言和思维的。

Warstadt和包括东北大学Müller在内的一批研究人员一起组织了BabyLM挑战赛,参赛者要在小数据上优化语言模型训练。


SLM不仅有可能揭开人类认知的新秘密,还有助于改进生成式人工智能。

在儿童13岁时,他们已经接触了约1亿个单词,在语言方面比聊天机器人更胜一筹,但他们只能获得0.01%的数据。

Warstadt说,虽然没人知道是什么让人类如此高效,但「在小规模上进行高效的类人学习,当扩展到LLM规模时,可能会带来巨大的改进」。

重塑AI的未来:从云到设备

xLAM-1B展现出的端侧AI的发展潜力,很可能标志着人工智能领域的重大转变——挑战「模型越大越好」的观念,让人工智能在消耗有限资源的条件下也能持续生长。

目前,由于所涉及模型的规模和复杂性,许多先进的人工智能功能都依赖于云计算。

如果像xLAM-1B这样的较小模型也能提供类似的功能,就能让更强大的人工智能助手直接在用户的设备上运行,从而提高响应速度,并解决与基于云的人工智能相关的隐私问题。

随着边缘计算和物联网设备的激增,对更强大的设备上人工智能功能的需求也将激增。

xLAM-1B的成功可能会催生新一轮的人工智能开发浪潮,其重点是创建为特定任务量身定制的超高效模型,而不是「样样通」的庞然大物。

这可能会带来一个更加分布式的人工智能生态系统,在这个生态系统中,专业模型在设备网络中协同工作,可能会提供更强大、反应更快、更能保护隐私的人工智能服务。

这一发展还能使人工智能能力民主化,让较小的公司和开发人员无需大量计算资源就能创建复杂的人工智能应用。

此外,它还可以减少人工智能碳足迹,因为较小的模型在训练和运行时所需的能源要少得多。

xLAM-1B给业界带来的冲击有很多,但有一点是显而易见的:在人工智能的世界里,大卫刚刚证明了他不仅可以与歌利亚竞争,还有可能将其淘汰。人工智能的未来可能不在被巨头所操控的云端,而是在你自己手中。

参考资料:

https://venturebeat.com/ai/salesforce-proves-less-is-more-xlam-1b-tiny-giant-beats-bigger-ai-models/

https://x.com/SFResearch/status/1807811770267971984?t=j_LOjgVPy41ZpjwkoXmRiQ&s=19


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
山东泰山2大重拳出手!曝费南多违反队规被三停,克雷桑遭处罚

山东泰山2大重拳出手!曝费南多违反队规被三停,克雷桑遭处罚

足球慢镜头
2024-07-07 19:10:54
胡锡进:洞庭湖大堤决口,当地群众都得到安全转移,非常值得肯定

胡锡进:洞庭湖大堤决口,当地群众都得到安全转移,非常值得肯定

火山诗话
2024-07-07 11:45:50
令人意外!
意大利向中国示好!

令人意外! 意大利向中国示好!

仰望沧海
2024-07-07 16:27:10
iPhone16没有惊喜,华为Mate70,将在国内称王

iPhone16没有惊喜,华为Mate70,将在国内称王

互联网.乱侃秀
2024-07-06 16:02:16
媒体人热议克雷桑染红:情绪古怪!内部出状况,全队都没心思踢球

媒体人热议克雷桑染红:情绪古怪!内部出状况,全队都没心思踢球

奥拜尔
2024-07-06 20:29:21
狂飙兄弟翻车后续:道歉被拒绝,提出18万回购车辆,网友口诛笔伐

狂飙兄弟翻车后续:道歉被拒绝,提出18万回购车辆,网友口诛笔伐

小徐讲八卦
2024-07-07 08:42:57
他是人民的好总理,主政山东多年,65岁成为副总理,晚年捐200万

他是人民的好总理,主政山东多年,65岁成为副总理,晚年捐200万

茶小姐说历史
2024-07-07 12:40:55
泽连斯基最大的功劳,就是治好了“恐俄症”

泽连斯基最大的功劳,就是治好了“恐俄症”

老唐有话说
2024-07-05 16:32:45
国军中将吴石被老蒋枪决,周总理临终前为何叮嘱:不要忘记吴石

国军中将吴石被老蒋枪决,周总理临终前为何叮嘱:不要忘记吴石

我是斌哥哥
2024-07-06 16:15:02
轰21+7+5+10失误无缘奥运:东契奇独木难支捂脸沮丧 准四双太扎心

轰21+7+5+10失误无缘奥运:东契奇独木难支捂脸沮丧 准四双太扎心

颜小白的篮球梦
2024-07-07 00:18:48
申花捡到宝!吴金贵当初坚持不用的本土悍将,如今在中超进球发威

申花捡到宝!吴金贵当初坚持不用的本土悍将,如今在中超进球发威

评球论事
2024-07-07 14:12:43
科尔:都说克莱糟糕 而很多拥有他那种数据的球员能签2.2亿合同

科尔:都说克莱糟糕 而很多拥有他那种数据的球员能签2.2亿合同

直播吧
2024-07-07 08:38:05
24岁网红吃播突然猝死,血管畸形腹部胀大,尸检时胃里塞满食物

24岁网红吃播突然猝死,血管畸形腹部胀大,尸检时胃里塞满食物

科学之城
2024-06-24 17:14:16
生吃降火,熟吃健脾!每天吃一点,作用真大,不懂吃可惜了!

生吃降火,熟吃健脾!每天吃一点,作用真大,不懂吃可惜了!

阿龙美食记
2024-07-07 17:41:37
我1978年入伍,考上军校嫁给了首长儿子,改变了命运

我1978年入伍,考上军校嫁给了首长儿子,改变了命运

百年历史老号
2024-06-20 08:25:39
老天爷救一救洞庭湖

老天爷救一救洞庭湖

王姐懒人家常菜
2024-07-07 00:30:42
时隔5年进世联赛!挑战杯-男排3-1比利时 3连胜仅丢1局夺金

时隔5年进世联赛!挑战杯-男排3-1比利时 3连胜仅丢1局夺金

搜狐体育
2024-07-07 21:14:01
西热大手笔!同曦连签三将,争议国手+47分外援加盟,志在季后赛

西热大手笔!同曦连签三将,争议国手+47分外援加盟,志在季后赛

理工男评篮球
2024-07-07 12:53:54
这就是张学良真实的样貌,都看看吧!这可不是演员饰演的

这就是张学良真实的样貌,都看看吧!这可不是演员饰演的

年代回忆
2024-07-05 18:33:15
云南抚仙湖百名游客沉船无人生还,探险者潜入水底发现千年尸陀林

云南抚仙湖百名游客沉船无人生还,探险者潜入水底发现千年尸陀林

真实故事汇
2024-07-02 12:47:27
2024-07-07 21:58:44
新智元
新智元
AI产业主平台领航智能+时代
11247文章数 65553关注度
往期回顾 全部

科技要闻

临时加关税 欧版"元PLUS"成本涨近8000欧元

头条要闻

香港人到深圳"反向消费":有老人拉小推车买一周的菜

头条要闻

香港人到深圳"反向消费":有老人拉小推车买一周的菜

体育要闻

转发这篇索斯盖特,你也能运气爆棚!

娱乐要闻

49岁林志玲在日本带娃被偶遇

财经要闻

齐创阶段新高 一线城市楼市又可以了?

汽车要闻

18.98万起 宝马新电动MINI COOPER上市

态度原创

艺术
本地
游戏
数码
公开课

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

本地新闻

云游中国 | 走进安塞,寻觅黄土高原文化记忆

小伙一人开6台电脑打PVP,结果被一张高科技图,喷到自闭

数码要闻

三星Galaxy Buds 3耳机价格曝光,比国产贵出一大截

公开课

连中三元是哪三元?

无障碍浏览 进入关怀版