网易首页 > 网易号 > 正文 申请入驻

国内首份“大模型安全实践”报告出炉:大模型“短板”如何补齐

0
分享至

摘要:“安全、可靠、可控,是人工智能的三大红线。”


经过一年多的“野蛮生长”,大模型的应用正在聚沙成塔,安全问题也随之引发关注。2024世界人工智能大会暨人工智能全球治理高级别会议发表的《人工智能全球治理上海宣言》明确提出,要确保其发展过程中的安全性、可靠性、可控性和公平性。

目前,针对大模型的安全评测绝大多数是针对内容类场景,对智能体等高级应用仍是空白区。昨日(5日)下午,《大模型安全实践(2024)》白皮书发布,这是国内首份“大模型安全实践”研究报告,从安全性、可靠性、可控性等维度提供技术框架。

大模型仍无法做出专业决策

近两年来,大模型的进步有目共睹,从本届WAIC的现场来看,大模型在智能涌现能力上提升明显,从初级的语言对话到如今多模态、具身智能的发展趋势,不难看出大模型从规模化迈向产业化。

但是在产业化过程中,业界人士也逐渐发现了大模型的“短板”:泛化能力强但专业能力差,还有长期诟病的幻觉问题。即便是OpenAI最强的大模型GPT-Turbo,依然避免不了事实性错误的局限。

“特别是要求严谨的行业中,我们发现大模型的幻觉问题和缺乏复杂推理的问题非常严重。”蚂蚁集团大模型应用部总经理顾进杰安全实验室首席科学家王维强举例说,大模型对专业领域知识图谱的学习有限,在实际使用过程中得谨慎对待。尤其是金融、医疗等领域对模型输出的专业性和准确性要求极高,“很多医疗的知识不是在书本里,都是在很多医生的脑袋中,大模型就没有办法做复杂的专业决策”。

特别是Transformer架构成为主流后,以此为基础的大模型在泛化能力突飞猛进,但“智能涌现”的能力依然是处于“黑盒”中,人类无法控制其生成的结果,因此造成专业能力进步缓慢。即便是OpenAI CEO Sam Altman也坦言,GPT-4的专业性仅相当于专业人士的10%—15%。

对此,白皮书总结大模型发展在当下面临的技术、个人、企业和社会四大挑战:大模型技术存在自身缺陷,包括生成内容不可信、能力不可控以及外部安全隐患等问题,带来诸多风险挑战,比如生成“幻觉”问题影响生成内容的可信度;在个人层面,大模型挑战广泛涉及信息获取、公平正义、人格尊严、个人发展以及情感伦理等多个重要维度,同时加剧了“信息茧房”效应;在企业层面,大模型面临用户隐私与商业秘密泄露、版权侵权及数据安全等多重风险挑战;在社会层面,大模型的广泛应用不仅冲击就业市场、扩大数字鸿沟,还可能危及公共安全与利益。

安全、可靠、可控是三大红线

那么,什么样的大模型在应用过程中能称之为安全?“安全、可靠、可控,是人工智能的三大红线。”中国信通院华东分院人工智能事业部主任常永波认为,这三方面缺一不可。

他介绍,安全性意味着确保模型在所有阶段都受到保护,包含了数据安全、应用安全、内容安全、伦理安全、认知安全等诸多方面。可靠性要求大模型在各种情境下都能持续地提供准确、一致、真实的结果,包含模型的鲁棒性(异常情况下能否运行)、真实性、价值对齐。而可控性关乎模型在提供结果和决策时能否让人类了解和介入,可根据人类需要进行调适和操作,包含大模型的可解释研究、大模型的指令遵循能力、安全检测和水印追溯。

常永波表示,国内头部厂商走得比较靠前,蚂蚁、商汤等围绕安全和治理都有系统化的技术指标。而个别公司急于在大模型商业化过程中抢占市场,未能配备相应“安全防护”,如未规范标注和安全自测,会在企业应用和社会治理过程中留有隐患。

“目前,大模型的安全评测绝大多数是针对内容类场景,随着大模型技术快速发展和广泛应用,对智能体这类复杂大模型应用架构和未来通用AGI(通用人工智能)的评估是当下面临的挑战。”常永波认为,以智能体为核心的检测,是大模型安全不可或缺的一环。

记者了解到,上届WAIC“镇馆之宝”蚁天鉴在今年推出2.0版本,新增的“测评智能体”可针对大模型的内在神经元进行“X光扫描”来做探查和判断。“能让技术人员直观感受大模型内部在发生什么、定位可能引发风险的神经元、并进行编辑修正,从而在模型内部治理幻觉,实现从源头识别和抑制风险。”蚂蚁集团安全内容智能负责人赵智源介绍,蚁天鉴如今还新增了“AI鉴真”技术如今的“AI鉴真”技术可,可以快速精准鉴别图像、视频、音频、文本内容的真伪,图像识别准确率99.9%。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太炸裂!随着郑钦文进中网4强,狂揽228万奖金,产生5个不可思议

太炸裂!随着郑钦文进中网4强,狂揽228万奖金,产生5个不可思议

侃球熊弟
2024-10-04 21:36:41
门当户对!詹姆斯长子布朗尼与星二代女友官宣恋情 互道我爱你

门当户对!詹姆斯长子布朗尼与星二代女友官宣恋情 互道我爱你

醉卧浮生
2024-10-04 10:02:20
东风41在欧美蔓延:外媒坚定认为,先进导弹绝非东风31AG

东风41在欧美蔓延:外媒坚定认为,先进导弹绝非东风31AG

现代小青青慕慕
2024-10-03 21:22:28
炸裂!捐精有多乱,女的被约到宾馆,捐精者:直接怀孕只收800元

炸裂!捐精有多乱,女的被约到宾馆,捐精者:直接怀孕只收800元

吃鱼思故渊
2024-09-23 15:50:30
全球航班都躲得远远的,可咱们中国的一架飞机却偏偏往那飞!

全球航班都躲得远远的,可咱们中国的一架飞机却偏偏往那飞!

日风的故事屋
2024-10-05 14:49:16
费舍尔亮相NBA,老婆是巴恩斯前妻,退役开训练营很成功

费舍尔亮相NBA,老婆是巴恩斯前妻,退役开训练营很成功

大西体育
2024-10-05 10:26:44
揭秘女性自慰和性生活的差异!

揭秘女性自慰和性生活的差异!

智见派
2024-09-24 17:18:46
39岁戚薇“瘦”出新高度,网友惊呼“认不出”

39岁戚薇“瘦”出新高度,网友惊呼“认不出”

十二生肖运势分析
2024-10-05 06:30:02
外媒:特朗普不同意拜登说法,并称他认为以色列应该打击伊朗核设施

外媒:特朗普不同意拜登说法,并称他认为以色列应该打击伊朗核设施

环球网资讯
2024-10-05 12:31:32
台名嘴张友骅跌倒陷昏迷,传已装上叶克膜,医院方面拒绝透露病情

台名嘴张友骅跌倒陷昏迷,传已装上叶克膜,医院方面拒绝透露病情

海峡导报社
2024-10-04 17:28:09
记者:今天上午国足进行赴澳前最后一次训练,程进将接受采访

记者:今天上午国足进行赴澳前最后一次训练,程进将接受采访

懂球帝
2024-10-05 09:58:12
广电网络重大改革:取消月费和机顶盒

广电网络重大改革:取消月费和机顶盒

小柱解说游戏
2024-10-01 19:20:26
在华无人问津的韩国现代捷尼赛思,在美国的总销量已突破了30万辆

在华无人问津的韩国现代捷尼赛思,在美国的总销量已突破了30万辆

随波荡漾的漂流瓶
2024-10-04 11:50:20
挑战赛再出反常规律,战胜头号种子者,大多与冠军无缘

挑战赛再出反常规律,战胜头号种子者,大多与冠军无缘

网球之家
2024-10-04 13:37:07
排面拉满!迈阿密国际官方:首场季后赛将在纽约时代广场大屏直播

排面拉满!迈阿密国际官方:首场季后赛将在纽约时代广场大屏直播

直播吧
2024-10-05 13:03:08
这位母亲的举动是2024年大众生活真实写照!网友:我不笑她 我敬她

这位母亲的举动是2024年大众生活真实写照!网友:我不笑她 我敬她

奇特短尾矮袋鼠
2024-09-27 11:15:38
炸裂!捐精有多乱,双方直接在宾馆完成怀孕过程,一次几百到几万

炸裂!捐精有多乱,双方直接在宾馆完成怀孕过程,一次几百到几万

小彭谈历史
2024-09-21 12:40:15
鏖战7局遗憾输球 莫雷加德:真希望能在这里再打一场

鏖战7局遗憾输球 莫雷加德:真希望能在这里再打一场

阿牛体育说
2024-10-05 07:43:10
我国100个退休人员中,养老金能达到5000有多少?结果意想不到

我国100个退休人员中,养老金能达到5000有多少?结果意想不到

庞明说楼市
2024-10-03 10:12:38
浙江一男子实名举报,扳倒对方后,自己也妻离子散

浙江一男子实名举报,扳倒对方后,自己也妻离子散

一场奇遇日记
2023-09-20 21:34:10
2024-10-05 15:36:49
上观新闻
上观新闻
站上海,观天下
188009文章数 744712关注度
往期回顾 全部

科技要闻

十一直击:鸿蒙智行、小米汽车人气高涨

头条要闻

复旦团队脑脊接口研究获突破:瘫痪者有望重新行走

头条要闻

复旦团队脑脊接口研究获突破:瘫痪者有望重新行走

体育要闻

张帅:每朵花都有自己的花期

娱乐要闻

肖战晒照庆33岁生日,阳光帅气有活力

财经要闻

“抢筹”中国资产!外资巨头发声!

汽车要闻

售17.78万元 蒙迪欧1.5T混动舒雅型上市

态度原创

时尚
房产
本地
艺术
军事航空

40岁女人怎么穿出气质?秋天来看看这些穿搭,超有“女王”范

房产要闻

国庆到啦!快来查收你的买楼大礼包

本地新闻

云游中国|还有谁不知道 荆门人有属于自己的仙本那

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

军事要闻

特朗普:以色列应该打击伊朗核设施

无障碍浏览 进入关怀版