网易首页 > 网易号 > 正文 申请入驻

如何解决“国外一开源,国内就创新” AI治理与安全挑战?|钛媒体AGI

0
分享至


(图片来源:钛媒体AGI编辑林志佳拍摄)

12月28日消息,钛媒体AGI获悉,阿里巴巴集团于26日联合发布《大模型技术发展及治理实践报告》,再度披露 AI 技术带来的治理与安全问题面临重要挑战。

据统计,随着ChatGPT引爆全球AI大模型热潮,截至2023年6月底,全球 AI 企业共计3.6万家。美国 AI 企业数量约1.3万家,在全球占比33.6%,中国5734家,全球占比为16%。截至目前,中国已经完成备案并对外服务的AI大模型超过270个,总注册帐户数超过13亿。

其中,北京占据国内大模型产业头部地位。据北京市互联网信息办公室副主任潘锋介绍,今年以来,北京推进第八批、第九批生成式人工智能大模型通过备案并上线,备案大模型数量达到105个。北京的头部大模型企业占全国一半以上,已经赋能超过1.4万家企业,辐射带动的能力和作用凸显。

然而,在大模型技术能力不断突破、模型性能不断提升的同时,人们对大模型安全风险以及安全治理的研究也在持续推进。根据大模型的技术特征和应用特点,对大模型进行有效治理,让大模型始终处在人类控制之下,不断降低大模型的安全风险,让大模型更好地服务人类发展,已成为全球共识。

“网上有个说法,‘国外一开源,国内就创新’,自主创新基础不牢。大量国产模型采用国外的开源架构进行训练,由于国外的原生创新是用国外的语料进行训练,导致国内与国际的顶尖水平还有一定的差距。”潘锋谈到,AI行业“百模大战”之下,真正有竞争力的模型并不多,不少企业还没有找到可盈利的商业模式,面临比较大的生存压力。在对话搜索场景面临竞争红海的同时,自动驾驶、办公、教育、医疗等垂直领域加速释放潜能,还没被充分挖掘。面临内生安全不足、原生程度不足、重生能力不足等挑战。

潘锋认为,政府部门需要建立健全大模型研发、上线、运行等全生命周期管理体系,统筹推进算力、数据等基础要素供给,协同各方夯实 AI 发展的基础。

作为提供全国80%的科技企业和超过一半AI大模型公司的头部AI和云服务商,阿里不仅提供通义大模型,而且还持续建立安全架构。据阿里巴巴集团副总裁、阿里安全总裁钱磊披露,过去一年,阿里坚持云和AI协同发展,投入大量资源到 AI 算力基础设施建设当中,“通义千问”API调用价格一年间下降了97%。同时,中国一汽、联想、微博等30多万家企业已经接入通义大模型。

另外,在开源层面,Hugging Face社区上,目前全球开发者基于阿里自研“通义”开源模型二次开发的衍生模型已经突破8万个,仅次于美国Meta的Llama系列;阿里 AI 模型社区“魔搭”(ModelScope)则提供超15000个优质AI模型, 汇聚了600万AI开发者,累计下载量超过1亿次

值得注意的是,报告中提到,大模型的安全问题一直是学术界和工业界关注的热点问题。为了提升大模型的安全性,常见的技术可以归纳为两大类,一类是内生安全技术,包括安全微调(SFT) 、基于人类反馈的安全对齐(RLHF) 等。另一类是对模型的输入输出内容进行风险识别,例如Meta的LLama Guard等类型模型。这类技术一般称为外层护栏,对暴力犯罪、隐私、色情等风险进行识别,拦截用户请求或模型输出的内容,从而确保大模型的安全使用。然而,这两类技术都有各自的缺陷,安全对齐技术目前主要是依赖安全微调数据,这类数据驱动的方法往往是过拟合到数据,是数据上的对齐,而非让大模型真正了解如何回复才是得体的。此外,安全对齐往往会牺牲模型的通用能力,同时防控护栏出于安全考虑会无差异化地对各类风险问题进行拦截,但有些安全性高的模型实际上能够很好且得体地回答部分风险问题,无差异化的拦截策略使用户的体验变得很差。

因此,报告中提出一个新的概念:宪法人工智能 (Constitutional AI) 。

所谓宪法AI,是通过人为设定宪法准则,对模型进行微调和强化学习,从而让模型和宪法准则进行对齐,该技术最先由 Anthropic提出并用于基于 AI 反馈强化学习做对齐。IBM 也提出了基于准则的 Self-Align对齐技术。通过利用少量人类定义的原则 (或规则) 来引导大模型对用户查询生成响应,极大地减少了人工监督的工作量。

中国电子技术标准化研究院副院长范科峰表示,在 AI 时代,发展与安全从来都不是对立的,而是相辅相成。AI安全标准化工作,既是AI安全治理的重要支撑,也是推动技术健康发展的基本保证。展望未来,AI技术的发展与治理必然需要更加广泛、更加紧密的协作与配合。

(本文首发于钛媒体App,作者 | 林志佳,编辑 | 胡润峰)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
13中12!威少连爆两场!成为NBA历史首人

13中12!威少连爆两场!成为NBA历史首人

篮球教学论坛
2025-01-02 14:42:27
窦靖童宋妍霏传恋情!疑跨年晒图秀恩爱秒删,两人交往早有端倪

窦靖童宋妍霏传恋情!疑跨年晒图秀恩爱秒删,两人交往早有端倪

小海娱计
2025-01-02 18:18:39
何超琼澳门晚宴被偶遇,仙女裙打台球,62岁胶原蛋白满满嫩似26岁

何超琼澳门晚宴被偶遇,仙女裙打台球,62岁胶原蛋白满满嫩似26岁

柴叔带你看电影
2025-01-01 18:42:39
今晚首播!39集刑侦剧来袭,3大卫视联播,我敢说:这剧收视能爆

今晚首播!39集刑侦剧来袭,3大卫视联播,我敢说:这剧收视能爆

老鹈爱历史
2025-01-02 17:01:31
央视紧急叫停李幼斌反腐剧《守望者》,两集下架引发舆论热议

央视紧急叫停李幼斌反腐剧《守望者》,两集下架引发舆论热议

华人星光
2024-12-31 11:08:12
看完《我是刑警》再看《真心英雄》差别太大,真的没对比就没伤害

看完《我是刑警》再看《真心英雄》差别太大,真的没对比就没伤害

美食阿鳕
2025-01-02 10:01:46
2025年局势严峻?为何中国这么强大,却从不轻言战争?

2025年局势严峻?为何中国这么强大,却从不轻言战争?

兵国大事
2025-01-01 00:15:02
故事:女子一月交2万燃气费,一怒之下关掉阀门,隔壁却传来尖叫

故事:女子一月交2万燃气费,一怒之下关掉阀门,隔壁却传来尖叫

兰姐说故事
2024-12-30 15:00:03
43岁范冰冰和男友人圣诞狂欢,大秀火辣身材!豹纹上衣撩翻全场!

43岁范冰冰和男友人圣诞狂欢,大秀火辣身材!豹纹上衣撩翻全场!

柴叔带你看电影
2025-01-01 18:55:29
17岁森碟变化大,下巴后缩明显错过最佳矫正期,田亮夫妇再遭质疑

17岁森碟变化大,下巴后缩明显错过最佳矫正期,田亮夫妇再遭质疑

小咪侃娱圈
2025-01-02 11:23:35
28岁男子相亲看上空姐,月入8000把女生给整笑了:你怎么养得起我

28岁男子相亲看上空姐,月入8000把女生给整笑了:你怎么养得起我

唐小糖说情感
2025-01-02 18:01:12
黄岩岛阻拦网被强拆,54艘菲船直接闯入,菲律宾方面都蒙圈了!

黄岩岛阻拦网被强拆,54艘菲船直接闯入,菲律宾方面都蒙圈了!

猫眼观史
2025-01-02 21:51:34
我56岁,突然发现人“不生大病”的秘诀,不在于运动,在于这4点

我56岁,突然发现人“不生大病”的秘诀,不在于运动,在于这4点

荷兰豆爱健康
2025-01-01 15:45:31
智利车厘子小果充大果乱象频发?京东超市所售车厘子每箱附赠卡尺确保品质

智利车厘子小果充大果乱象频发?京东超市所售车厘子每箱附赠卡尺确保品质

中国财富网
2025-01-02 17:04:04
苹果官网降价 限定支付方式和指定产品

苹果官网降价 限定支付方式和指定产品

环球Tech
2025-01-02 14:29:08
“最美伴娘”火了,媚眼如丝轻咬嘴唇堵住门,伴郎想跟她就地结婚

“最美伴娘”火了,媚眼如丝轻咬嘴唇堵住门,伴郎想跟她就地结婚

白宸侃片
2025-01-01 09:58:45
俄军副司令康斯坦丁被曝阵亡!乌克兰正式切断俄天然气

俄军副司令康斯坦丁被曝阵亡!乌克兰正式切断俄天然气

项鹏飞
2025-01-01 22:10:20
美国和菲律宾炸锅了!

美国和菲律宾炸锅了!

玲子日记
2025-01-02 15:28:09
尴尬了!尹锡悦刚强硬表态,不到24小时,坏消息又传来了

尴尬了!尹锡悦刚强硬表态,不到24小时,坏消息又传来了

小鬼头体育
2025-01-02 18:36:54
他们说:又大又圆的D杯,最过分的是最后一图!!!

他们说:又大又圆的D杯,最过分的是最后一图!!!

风子说个球
2024-12-01 22:10:05
2025-01-02 22:31:00
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
112183文章数 859706关注度
往期回顾 全部

科技要闻

新能源价格战继续 更省钱的国补马上到位?

头条要闻

"火星"导演公布聊天截图力挺赵露思:没有人不喜欢她

头条要闻

"火星"导演公布聊天截图力挺赵露思:没有人不喜欢她

体育要闻

迈克·布朗,背锅侠的自我修养

娱乐要闻

张颂文要凉?家暴、假慈善,人设崩塌

财经要闻

证监会:"1月15号前释放全部利空"是谣言

汽车要闻

10万元级无图智驾 悦也PLUS全路况实测

态度原创

教育
本地
健康
游戏
公开课

教育要闻

RD来不及申几所就都要截止了?1-2月还有这10所好大学可申请!

本地新闻

云游中国|冰雪“祁”缘照进现实,谁懂多震撼

属于北京的一处精神“乌托邦”宝地

梦幻西游两大联赛强帮官宣合并!新区土豪6.6w拿下罗汉愤怒

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版