摘要:拥抱瞬息万变的大模型产业,需要“诚心诚意、真金白银、扬长补短”。
从年头到年尾“高质量语料短缺”始终是讨论人工智能大模型时的热点议题。临近年末,业界对“解题之道”似乎已有推进结果。
在12月5日举行的2024科创大会“‘模速’赋能空间共塑”分论坛上,在AI大模型的关键三要素“算力、算法、数据”层面,三个领域的代表企业围绕今年政府工作报告中提到的“加快发展新质生产力”提出了一番真知灼见。
高质量语料比“高质量人类”更难培育?
当天论坛上发布了来自上海库帕思科技有限公司的“库帕思语料终端”及其联合体,华为、商汤、兆芯、联想、东海、浪潮信息等行业头部企业成为首批成员。
大模型的“语料”,广义上理解就是人们常说的“数据”。但在库帕思首席执行官黄海清看来,眼下,大模型语料领域面临诸多行业挑战,具体可总结为“行业没标准、安全没保障、生态不协同、部署太复杂、技术不解渴、语料低质量”。
挑战纷繁复杂,但并非无解。尤其针对“语料质量低”这一大模型领域日渐“老生常谈”的问题,黄海清把英文“VALID有效的”拆解为“Vividness鲜活度”“Authenticity真实性”“Large Sample大样本”“Integrity完整性”“Diversity多样性”以及“High Density Knowledge高知识密度”,从行业角度为高质量语料进行了定义。
不过,如何同时解决六大挑战,就不只是下定义这么简单。当天发布的库帕思语料终端“小库”是全国首个语料终端产品,其标准版使用场景可满足200人并发使用的部门级应用需求,旗舰版一个机架则能容纳4个终端,同时满足1500并发的企业级应用需求。
不仅如此,“小库”的模型区还配置了“书生”“千问”“商汤日日新”“阶跃”“智谱”等几乎当下所有最主流的基础大模型。语料区则包含了行业垂类语料库、向量数据库和语料加工工具。算力区囊括了来自壁仞、天数、寒武纪、华为、登临、燧原、沐曦、阵量等主流算力供应商的服务。
“语料终端的诞生,是希望为‘0-1’阶段的种子企业挨过最艰难的时期,与‘1-3’发展阶段的灯塔用户共同打磨产品,最终为‘3到无限大’发展阶段的各类企业服务,让大模型真正实现赋能千行百业的愿景。”黄海清说。
黄海清
算力和算法“代表”怎么看
华院计算技术(上海)股份有限公司董事长宣晓华最近观察到,大模型领域一系列算法创新正在为不同行业提升效率添砖加瓦。例如,语言领域的智能问答已经是走在最前列的大模型应用场景;医疗领域的辅助诊断也有大模型广泛应用的身影。
相比之下,工业领域的大模型应用相对滞后,原因在于传统工业的数字化尚显不足,其本身又对知识水平有较高要求。
在探索工业领域大模型应用的过程中,宣晓华梳理出算法研究领域目前存在的挑战。最明显的就是如何把“大”模型“变小”,用尽量小的算力成本,生成最有效率的大模型应用。这一议题目前是国内外业界共同关注的焦点。
事实上,不仅传统企业、AI初创企业关注如何降低大模型的研发成本,头部企业同样关注成本控制。商汤科技联合创始人、大装置事业群总裁杨帆表示,无论是算力、算法还是语料数据,降低研发成本、少走弯路都需要很强的专业能力在背后供给。
“最近有人问我,如果时间倒退至五年前,作为国内最大整机厂商,我们是否会选择做芯片,答案或许还是坚持我们当时的选择,专注做整机。”浪潮集团副总裁郭强表示,目前市面上常见的算力来源包括先进算力、合规算力以及国产自主可控的芯片产品。三种算力多元共存,衍生出算力出海、算力入关、算力购买等不同的应用模式。
在大模型行业总体欣欣向荣的趋势下,作为算力企业的代表,郭强也提出了几点建议。
其一是大模型企业应坚持“发展”和“底线”两种思维,了解自己应该生成怎样的大模型应用,来支撑当下我国的数字化转型战略,同时兼顾技术的自主可控。其二是当数据的作用和能量越来越大,企业应该把80%以上的精力放在非算力上,不要盲目扩大算力支出。其三是选择算力时,应当综合考虑性价比,包括能耗、稳定性、安全性等,“持有算力设备和用好手中的算力,其实是两码事。”
大模型社区重塑区域产业空间
过去人们会问,“为何没有互联网大厂在上海。”如今这个问题似乎开始“过时”。
圆桌讨论环节,主持人在介绍全国首个大模型创新生态社区“模速空间”一年多来的建设成果时,上海大模型生态发展有限公司(模速空间)总经理陈海慈现场“校准”了数据:目前,模速空间三期总计交付3万平方米,集聚104家大模型企业,上海通过备案上线的34款大模型中,模速空间所在的徐汇区占到了22个,占比高达65%。
记者发现,过去一年来,每隔一段时间参与此类科技论坛,模速空间的“成绩单”都有动态变化的增量,侧面反映出大模型产业的发展速度。在陈海慈看来,拥抱瞬息万变的大模型产业,徐汇区和模速空间的具体举措可用“诚心诚意、真金白银、扬长补短”来概括。
“本周,模速空间就将发放完毕今年第三批算力补贴,今年累计已达1亿元;预计到四季度结束,全年为入驻企业发放的算力补贴将达1.5亿元。”陈海慈表示,北京、上海和深圳被视为中国三大“大模型之城”,其中上海正用“真金白银”的算力补贴支持大模型产业发展。在此过程中,上海正积极发挥在营商环境、市场环境、金融中心建设等方面的优势,规模达225亿元的上海三大先导产业人工智能母基金已于今年8月正式落地徐汇区。
“上海的大模型行业从业者可以经常去北京的中关村东路走走,那里集聚了清华、北大、人大,是创新浓度高度集聚的地方。”陈海慈说。
在创新策源力上“补短”,上海已经迈开了步子。眼下,包括上海人工智能实验室、国家人工智能学院、上海交通大学人工智能学院等高校和新型研发机构均已落地徐汇区。上述机构均位于模速空间15分钟车程之内,助力模速空间打造垂直向的高浓度创新容器。
当天论坛现场,徐汇区还同步启动了“科创绣带”系列项目,其中包括了“央视听媒体大模型体育技战术分析系统”、大模型语料“超级工厂”等一批新项目。记者了解到,未来,徐汇区将整合科创成果、机构、人才、资金等资源,提供更优质的成果转化全周期服务。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.