网易首页 > 网易号 > 正文 申请入驻

大模型安全与伦理研究(2024)

0
分享至

日前,腾讯发布了大模型安全白皮书《大模型安全与伦理研究报告2024:以负责任AI引领大模型创新》。该报告由腾讯朱雀实验室、腾讯研究院、腾讯混元大模型、清华大学深圳国际研究生院、浙江大学区块链与数据安全全国重点实验室联合研究撰写,对大模型发展中的安全机遇与挑战、大模型安全框架和实践做法、AI伦理和价值对齐进行了系统性梳理,并展望了大模型安全与伦理未来趋势。

大模型发展的技术新动向

1、多模态解析世界的本来面貌,并实现“三生万物”

多模态是人类世界的本来样貌,AGI的发展趋势一定是朝向多模态。技术将从文本、图像、视频(2D和3D),再到声、光、电,甚至分子、原子等各类模态,而且具备跨模态迁移的特性。未来理想的框架是“多模态的对齐和融合+统一的编码器和解码器”。

比尔盖茨近日撰文:AIAgent将是下一个平台,人工智能即将彻底改变人们使用计算机的方式并颠覆软件行业。在不久的将来,任何上网的人都将能够拥有由人工智能驱动的个人助手,远超今天的技术水平。

3、端侧大模型加速部署,或将成为未来交互新入口

大模型正在向端侧转移,AI推理将在在手机、PC、耳机、音箱、XR、汽车,以及其它可穿戴式新型终端上运行。

4、AI助力科研探索,贯穿科研全过程

AI与各个科学领域结合后,正在发生一场充满潜力和挑战的科技革命。

大模型安全框架

在人工智能安全领域,通用的数据安全问题和模型安全问题在大型模型中依然存在相似的风险。总的来说,大模型同样具有通用人工智能面临的安全风险问题,同时引入了一些大模型场景中特有的安全风险。因此,如何安全、可控地应用大模型相关技术尤为关键。

大模型安全框架首先从大模型生产研发的角度,将大模型的生命周期进行拆解,划分为数据处理、大模型训练部署、大模型应用三个不同阶段,并且对这三个阶段可能涉及的资产进行了梳理。接着,大模型安全框架围绕大模型的安全生命周期,从全局视角剖析了在大模型安全研发应用流程中存在的安全风险问题,以及如何应用这类安全风险的可能解决方案。

大模型安全框架的设计旨在具备全局性、实用性和前瞻性:

·全局性

大模型的研发应用是集数据、模型、算法、应用于一体的有机体,经历了数据处理、模型训练、模型评估、模型部署等多个阶段。大模型安全应用框架面向大模型研发应用的所有关键基础组件,覆盖大模型全生命周期,提出全面且有针对性的安全建议。

·实用性

目前面对新出现的大模型安全风险,目前行业内还未形成成熟完善的解决方案。大模型安全应用框架旨在提供大模型生命中周期中实用的、可操作的、有针对性的安全建议。

·前瞻性

目前行业内已经暴露出诸多大模型安全风险,然而目前大模型安全仍然属于一个新兴的安全领域,许多安全攻防理论和技术仍然处于建设阶段。因此,大模型安全应用框架的设计,不局限于当前已发现的安全风险的解决,而是立足于保障大模型技术安全应用这一目标,同样关注未来可能出现的安全风险问题,提出能有效应对新风险的大模型安全框架。

大模型安全与伦理未来趋势

AI安全和伦理已经成为了AI领域不可或缺的组成部分,对于大模型而言,其安全、伦理、人机对齐等问题之应对和解决,将需要政府、业界、学界等利益相关方进行持续的探索。

其一,数据安全、隐私泄露、抗攻击能力提升等问题是现有大模型应用面临的真实挑战,解决这些问题的技术手段还存在一定的局限性。对抗性人工智能技术与防御策略之间的竞赛将加剧,为了应对对抗性攻击和操纵等恶意行为,模型需要被设计为更加具有鲁棒性。

其二,从整体上对AI大模型的安全风险进行建模,系统化地构建安全评估系统是大模型安全领域的未来发展方向。这将最大程度地确保大模型应用是在符合社会价值与应用价值方面同步进行。

其三,增强模型透明度和可解释性。研究模型的可解释性,提高模型的透明度既是未来AI的发展方向,也能帮助提升AI模型的安全性。未来的人工智能模型可能会融入更先进的XAI技术。

其四,人机价值对齐和伦理嵌入设计(ethicsbydesign)的理念将变得越来越重要。无论是AI价值对齐还是伦理嵌入设计,都需要人们发展新的更加务实的AI伦理框架及其实践指南。

其五,人工智能监管立法和国际治理合作将得到进一步推进。未来立法和监管措施将给大模型安全和伦理的研究和实践提供更进一步的指导。

最后,在大模型安全和伦理研究中,跨学科合作是一个重要趋势。未来大模型安全和伦理研究需要吸收多领域的知识和技术,形成跨学科的研究团队,共同解决不断升级的复杂安全和伦理问题,确保负责任的、安全可控的AI发展应用。

具体内容如下:

责任编辑:张薇

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
A股:大家要做好心理准备了,今天5.18,股市或将重演历史!

A股:大家要做好心理准备了,今天5.18,股市或将重演历史!

媛来这样
2026-05-18 10:58:44
胡适评价毛主席写的词,“没有一句通的”,那么胡适的水平如何?

胡适评价毛主席写的词,“没有一句通的”,那么胡适的水平如何?

英子谈
2026-05-09 05:08:00
陈婉珍送别何超蕸需搀扶,何猷启与第二任妻子现身,何超云带男友

陈婉珍送别何超蕸需搀扶,何猷启与第二任妻子现身,何超云带男友

一盅情怀
2026-05-18 10:57:01
抢七来了!骑士老板专门包下25辆大巴 组织球迷再赴底特律助威

抢七来了!骑士老板专门包下25辆大巴 组织球迷再赴底特律助威

罗说NBA
2026-05-18 06:26:53
“内裤姐”事件大结局:几万块和解,伤能治,被践踏的尊严没人还

“内裤姐”事件大结局:几万块和解,伤能治,被践踏的尊严没人还

千言娱乐记
2026-05-17 14:45:56
熟客不再光顾都是因为啥?网友:这老板掉钱眼里了

熟客不再光顾都是因为啥?网友:这老板掉钱眼里了

解读热点事件
2026-05-05 00:05:15
曾陪伴杭州人十多年,如今正式破产清算!创始人已提前套现,会员请尽快申报债权

曾陪伴杭州人十多年,如今正式破产清算!创始人已提前套现,会员请尽快申报债权

都市快报橙柿互动
2026-05-17 20:42:06
韩股跌至熔断后V字反转 瞬间拉升近500点 三星涨超5% SK海力士涨超2%

韩股跌至熔断后V字反转 瞬间拉升近500点 三星涨超5% SK海力士涨超2%

每日经济新闻
2026-05-18 11:11:45
别喝“驼奶”了,全世界的骆驼也挤不出那么多的驼奶

别喝“驼奶”了,全世界的骆驼也挤不出那么多的驼奶

黄河新流域
2026-05-14 15:10:42
英国伦敦爆发游行示威,反抗首相与穆斯林市长的移民政策

英国伦敦爆发游行示威,反抗首相与穆斯林市长的移民政策

老李观历史
2026-05-17 10:01:40
他把79元宜家台灯拆了,塞进一块芯片,结果让官方设计师都意外

他把79元宜家台灯拆了,塞进一块芯片,结果让官方设计师都意外

时光慢邮啊
2026-05-17 01:32:16
爆冷摘金!昔日中国体操新星强势拿下“双冠王”,网友一片惊叹

爆冷摘金!昔日中国体操新星强势拿下“双冠王”,网友一片惊叹

罗掌柜体育
2026-05-17 11:47:29
婚礼仪式未结束宾客提前离场,敬酒环节被迫取消,新娘:酒店提前上菜,让停止不配合;酒店:她换装花46分钟,人要走我们也留不住

婚礼仪式未结束宾客提前离场,敬酒环节被迫取消,新娘:酒店提前上菜,让停止不配合;酒店:她换装花46分钟,人要走我们也留不住

极目新闻
2026-05-17 14:00:27
5月18日 广东队最新消息 助理外教离队 黄明依续约B类 徐杰作出牺

5月18日 广东队最新消息 助理外教离队 黄明依续约B类 徐杰作出牺

晓徙娱乐
2026-05-18 10:45:24
任正非论AI:一位工业哲学家的清醒与远见

任正非论AI:一位工业哲学家的清醒与远见

新浪财经
2026-05-17 00:29:09
《水浒传》中猛将排名,他才是武力值天花板

《水浒传》中猛将排名,他才是武力值天花板

史政先锋
2026-05-17 15:49:01
央视1.1亿拿下世界杯版权

央视1.1亿拿下世界杯版权

HR圈内招聘网
2026-05-18 09:09:46
穆帅的秘密藏不住了,皇马即将任命穆帅为总导演兼男主,大戏上演

穆帅的秘密藏不住了,皇马即将任命穆帅为总导演兼男主,大戏上演

福酱的小时光
2026-05-18 08:24:56
上海首批不婚女性养老院生活,曝光后网友炸了:和想的完全不一样

上海首批不婚女性养老院生活,曝光后网友炸了:和想的完全不一样

青眼财经
2026-05-17 20:53:49
26款奔驰GLE国内正式首发!68.8万起售价曝光,内外细节全面焕新

26款奔驰GLE国内正式首发!68.8万起售价曝光,内外细节全面焕新

华庭讲美食
2026-05-17 11:28:42
2026-05-18 13:19:00
数据观 incentive-icons
数据观
数据观是专业的大数据内容平台
14879文章数 3136关注度
往期回顾 全部

科技要闻

国产大模型集体更新后能力有多强?

头条要闻

牛弹琴:特朗普很焦虑 出访回国后几小时就召高官开会

头条要闻

牛弹琴:特朗普很焦虑 出访回国后几小时就召高官开会

体育要闻

哈登晋级东决:第5次分区决赛第5次赢抢七

娱乐要闻

小S晒全家福怀念大S,爷爷奶奶最疼姐姐

财经要闻

前4月工业生产较快增长 失业率5.3%

汽车要闻

小米YU7 GT定档5月21日19:00上市 跑车级轿跑SUV

态度原创

健康
时尚
本地
公开课
军事航空

专家揭秘干细胞回输的安全风险

夏天裤子不用多买,提前准备几条休闲的阔腿裤,百搭舒适显瘦

本地新闻

用苏绣的方式,打开江西婺源

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

黎以停火再延长 空袭却未停止

无障碍浏览 进入关怀版