网易首页 > 网易号 > 正文 申请入驻

完善数据要素市场化架构,探索隐私计算新技术和新应用

0
分享至

随着网络安全需求的深入人心,今年三月至今,国家网信办、工信部、公安部、市监局联合印发了一系列通知。包括《常见类型移动互联网应用程序必要个人信息范围规定》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》等。这三部法律法规明确了个人信息的范围、合法使用途径和保护措施,强调未来数据安全与数字发展并重的顶层观念。

与此同时,由国家信息中心大数据发展部牵头的研究小组于今年发布论文《全国一体化大数据中心引领下超大规模数据要素市场的体系架构与推进路径》,提出要在搭建全国一体化的大数据中心的基础上,据此进一步构建完整的数据要素市场化体系。在文章中,研究小组将全社会范围内数据要素的流动路径划分为数据共享、数据开放、数据交易三类,并构建了包括技术层、数据层、政策层等的数据要素体系架构,并在各个层面都提出了搭建建议。

从市场角度来看,随着人工智能和机器学习技术在各个行业都有了更多实践的场景,企业也不再满足于自己内部的数据来做模型训练,需要更多的数据购买与合作。为了应对数据共享过程中数据安全性的问题,隐私计算逐渐成为近年来业内的技术趋势和研究重点。

在技术尚未成熟、法规尚未明确、实践场景和效果尚未标准化的过程中,关于隐私计算还有许多值得探讨。

01 以系统化的视角,构建新型数据流通观

在国家信息中心大数据发展部提出的数据要素市场中,数据流通方式主要有三种。第一数据共享,也就是各个政府机构间数据的互联互通;第二数据开放,包括政府和央企将自己的数据开放给企业与公众,让其能通过这些数据产生价值;第三数据交易,包括大型互联网企业或数据收集企业将数据作为资产进行出售、购买等。

但事实上,这三种流通方式在具体实践的过程中有许多模糊的部分。比如可以拿来共享的数据不一定能开放、能开放的数据不一定能交易,这里不仅在不同的业务、行业、时间点上都会有差异。

具体来说,数据必须要经过加工、成为有价值的信息后才能流通,也只有经过确权和定价才能成为数据要素。而这个过程中比如数据物理汇集所带来的安全性、隐私性的问题,加工数据所带来的数据处理者的权责问题、风险问题,都还在起步和探索阶段。

面对高速发展又尚不完善的市场,书牍科技副总裁张迎春提出,「我们要用系统化的方式来看待这些问题」。也就是说,当一个环节出现问题的时候,我们要把问题放到系统化的大环境视角下来发现解决问题的方法。这就正是业内常说的「构建新型数据要素流通观」。

具体来说,这种「新型数据要素流通观」有三个核心。

第一,要从过往数据转移时候直接将所有权物理汇集、转移,或用API形式物理转型,转变为「计算分布式,监管有中心」的方式,也就是常说的「可用不可见」。「计算分布式」让数据不让数据所有方不需要再物理地交出数据,从而保证了数据的安全。如果像过往一样交数据交了出去,就无法保证数据使用者会合规地使用原来的数据。「监管有中心」需要监管方在不触碰数据的同是,又能对整个数据协同的网络有一个柔性的监管能力。通过一些评估办法来探测交易中是否有安全隐患,比如信通院近年来就在研究《数据安全治理能力评估方法》,也是业内的一个重要参考。

第二,从数据生产方式来看也会有巨大的变革。在过往的数据购买和使用中,数据提供方通常需要满足购买者在数据内容、含义和使用各个方面的需求,这这些需求增加了数据提供方的人员成本。张迎春觉得,在新型数据流通观下,「将数据变得更贴近自己的需求」的步骤可以开放给数据使用方自己来做,也就是「消费即生产」。未来还可以开放这些消费者所构建起来的模型给其他消费者使用,产生更多的价值。

第三,生态化的数据要素市场需要完善的社会分工。具体来说,每个进入的主体需要在政策上有一定确定的责权利,并且整体的市场交易过程需要能够被全面而柔性地监管。在这个基础上,供给侧的产业链会更加细分,而需求侧也会有更多业务融合和创新。比如供给侧可以出现数据处理、风险评估、交易运维等各个细分环节的服务商。

02 综合利用基础建设,推进隐私计算技术的发展

从具体实践来看,随着网络基础设施的逐步完善,隐私计算技术也在逐步发展。

数据在流动的过程中,数据具有数据内容、数据来源和数据去向这几个具体信息。那么对应的隐私计算来说,需要做隐私处理的场景就可以简单地分为数字隐匿、身份隐匿和轨迹隐匿。

数字隐匿主要使用的技术是零知识证明(Zero—Knowledge Proof),指双方在不透露信息的情况下传递知识,并给予双方一个交易凭证的技术。

身份隐匿主要应用于公民投票、匿名竞标等场景,主要有两种技术。第一种是不经意传输(Oblivious transfer),指发送方可以发送信息给接受方,接受方收到信息但不知道发送方的身份。第二种是群签名,接受方只能知道信息来自于一个群的某一位,但不知道具体的人。群签名相对于前一种的好处是由于有群的存在,在信息发送方这里也可以有一定的监管。

轨迹隐匿方面相对更难以实现, 因为不管是被了解到信息的发出方还是接受方,都是信息的泄露。目前国际上常常使用洋葱网络来解决这方面的问题,国内通常会通过代理机构来完成。然而非官方的代理机构又会面临监管、安全性等更多问题。也就是说,轨迹的隐匿并不只是算法层面的问题,而是要从数据的存储、传输甚至是整体系统架构方面来综合思考。

以上技术主要还是针对两方的数据传输,对于更多方的数据信息传递,问题将变得更为复杂。不仅是在数据流通过程中对第三四五六方的隐秘性,更要考虑这三四五六方各自对于系统是否是诚实的、是否有共谋、共谋的比例有多大。

针对多方信息的安全传输,微众银行区块链隐私计算技术负责人李辉忠认为,目前业内主流的技术趋势主要三层,包括区块链、多方安全学习和联邦学习。

首先,当涉及到多方的时候,会存在不同角色的不同分工问题。每一方在隐私计算的过程中所拥有的资源、付出的劳动和贡献都是不同的,需要有一个完善的标准来做整体的衡量。区块链的技术可以解决多方角色之间的身份治理、审计、验证等工作,以确保整个隐私计算的过程公平公正。

其次,基于一系列算法协议,通过安全多方计算技术可以根据不同的参与方数、每方可信度,给出不同的解决方案和优化路径。而综合这些单独协议和技术,又可以应用到更多的场景。

而联邦学习则是在区块链和安全多方计算的基础上,在多个机构之间保证「数据不出域」的情况下完成机器之间的互相训练。联邦学习主要应用于机器学习领域,在训练之后还可以在机构之间联合建模和实践,同时保护各自的数据源。

03 多行业应用广泛,环保合法需求下亦有挑战

对于李辉忠来说,虽然隐私计算的未来发展还有巨大潜力,隐私计算服务商也应该在认清哪里是业务真正的痛点、难点的情况下,合法合规地为企业场景化地提供解决方案。具体来说,服务商应该在关注个人数据、政务数据、企业数据的基础上,发展核心业务场景及隐私保护需求,而后提供产品和解决方案。

比如在医疗领域,AI制药是隐私的一项重要应用场景。在国外已经有较为成熟的多方数据协作研发案例,如汤森制药联合10家药企参与的MELLODY项目,在本地训练AI模型并将结果传回,整合成一个综合模型。在国内,翼方健数的XDP平台为中山大学肿瘤医院落地了一个大型单项病种的大数据开放平台,让相关医院在平台上共享病患数据,并综合整合分析。在此基础上,基于医疗医疗信息化的隐私安全计算平台,也许还能满足更多的功能。

在金融场景下,隐私计算产品是基于大数据、人工智能产品或软硬件一体机来售卖的。其中,同一银行内部不同支行之间的数据共享是联邦学习最早也是应用最广的领域。另外,金融机构希望介入外部数据(如用户标签、信用信息等)的时候,过往通过API接口或脱敏后综合建模的方式都无法让人满意,未来隐私计算还有巨大的发展潜力。

未来,隐私计算在电商、智慧城市、广告、政府政务等领域也将有更具体和完善的实践。

然而隐私计算也面临着硬件支持和能源消耗等方面的挑战。复旦大学博士生导师韩伟力表示,在目前的联邦学习训练中,数据传输的耗时远远大于数据处理,算法和算力还有许多盈余。而对于企业的本地的数据训练来说,算力依旧是人工智能实践的心头难。目前,星云Clustar的CTO张骏雪提出使用异构一体机的方式,综合CPU、GPU、FPGA的特征和优势,提升整体的算力水平。而在中国和国际对环保、尤其是碳中和的重视程度越来越高的过程中,如何在「提升运算性能和安全性以优化资源利用」和「节省能源消耗」之间找到平衡,还需要全行业一起站在更高的视角来共同探索。

今年第三届中国产业高质量发展论坛上,中国信通院云计算与大数据研究所所长何宝宏提到,截止到2020 年隐私计算整体速度只比明文计算慢 25 倍。

正如所有专家所提到的,隐私计算是基于数据安全保护而发展起来的技术,最终也需要法律的支持与保护。在此基础上,未来数据在政府与政府、政府与企业、企业与企业、企业与个人之间的流动中,隐私计算还有许多发展的机遇与实践的可能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
0-5到1-6!中国队第3败诞生,球迷怒了+喊主帅下课,亚预赛告急

0-5到1-6!中国队第3败诞生,球迷怒了+喊主帅下课,亚预赛告急

足球慢镜头
2024-07-01 17:04:08
3-0!4-1!美洲杯进球盛宴,哥伦比亚出线,巴西狂轰4球

3-0!4-1!美洲杯进球盛宴,哥伦比亚出线,巴西狂轰4球

足球狗说
2024-06-29 11:08:25
极端最高气温39℃!长沙7月平均气温为……

极端最高气温39℃!长沙7月平均气温为……

鲁中晨报
2024-07-01 14:39:04
中方想要的,欧盟已经点头,征税问题反转,中国车企的机会来了

中方想要的,欧盟已经点头,征税问题反转,中国车企的机会来了

北哥全球观察
2024-07-01 17:18:53
后继乏力的小米SU7,已经按下“暂停键”

后继乏力的小米SU7,已经按下“暂停键”

户外小阿隋
2024-07-01 19:48:07
本土教练最大希望!谢晖接手12场仅输3场:陈洋6轮输5场!

本土教练最大希望!谢晖接手12场仅输3场:陈洋6轮输5场!

中超球评
2024-07-01 15:57:54
湃调查|暗访福寿螺产业链(上):商贩大量收购野捕福寿螺,冒充田螺销售

湃调查|暗访福寿螺产业链(上):商贩大量收购野捕福寿螺,冒充田螺销售

澎湃新闻
2024-06-28 10:02:35
马斯克明码标价接2名被困航天员,印度:我愿提供自己的飞船

马斯克明码标价接2名被困航天员,印度:我愿提供自己的飞船

嘿哥哥科技
2024-07-01 22:00:34
德转宣!山东泰山再出走一人,34岁前国脚租借加盟中甲球队

德转宣!山东泰山再出走一人,34岁前国脚租借加盟中甲球队

中超伪球迷
2024-07-01 20:11:52
何香凝坐船遇海匪,船长陷入绝望,她却镇定道:告诉他们我在船上

何香凝坐船遇海匪,船长陷入绝望,她却镇定道:告诉他们我在船上

百年历史老号
2024-05-25 10:44:27
亚羽联现场组织为张志杰默哀,国羽队友催泪一幕:赢球后跪地指天

亚羽联现场组织为张志杰默哀,国羽队友催泪一幕:赢球后跪地指天

我爱英超
2024-07-01 11:12:54
中方打法完全变了!董军在北京见了一位贵客,美国突遭晴天霹雳

中方打法完全变了!董军在北京见了一位贵客,美国突遭晴天霹雳

青年的背包
2024-07-02 02:34:06
是!假!的!央视曝光“999足金”陷阱!

是!假!的!央视曝光“999足金”陷阱!

南国今报
2024-06-30 21:28:59
教育部同意:北京,再添一部属大学!

教育部同意:北京,再添一部属大学!

双一流高校
2024-06-29 17:41:27
社会上流行着“不欠祖国只欠父母”的思想,非常可怕

社会上流行着“不欠祖国只欠父母”的思想,非常可怕

雪莉故事汇
2024-06-18 08:56:23
最后关头,冯德莱恩被要求辞职,中方反制再加码,欧盟成最大输家

最后关头,冯德莱恩被要求辞职,中方反制再加码,欧盟成最大输家

通文知史
2024-07-01 19:00:02
浙江一工地挖掘机打钢板桩把国防光缆打断,官方:按秒赔偿

浙江一工地挖掘机打钢板桩把国防光缆打断,官方:按秒赔偿

文雅笔墨
2024-07-01 16:38:22
高血糖与喝水有关?医生多次强调:高血糖患者,切记2种水不要喝

高血糖与喝水有关?医生多次强调:高血糖患者,切记2种水不要喝

今日养生之道
2024-07-01 22:06:41
恭喜皇马!六冠功勋回心转意!接任队长,获退役盛典,C罗羡慕了

恭喜皇马!六冠功勋回心转意!接任队长,获退役盛典,C罗羡慕了

阿泰希特
2024-07-01 12:10:39
华为官宣,降价6000元!优惠幅度逐步收窄

华为官宣,降价6000元!优惠幅度逐步收窄

21世纪经济报道
2024-07-01 13:00:10
2024-07-02 05:56:49
朋湖网
朋湖网
科技产业信息资讯平台
206文章数 109关注度
往期回顾 全部

科技要闻

天兵科技巩义现场工作人员:正寻找黑匣子

头条要闻

欧洲杯-法国1-0比利时晋级8强 维尔通亨自摆乌龙

头条要闻

欧洲杯-法国1-0比利时晋级8强 维尔通亨自摆乌龙

体育要闻

他们距离创造历史,只差1分33秒

娱乐要闻

今年内娱最大的闹剧,该收场了

财经要闻

债牛疯狂不止,引央行“出手”!

汽车要闻

奥迪Q6 e-tron Sportback官图曝光

态度原创

艺术
健康
教育
家居
房产

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

人类为何至今无法攻克渐冻症?

教育要闻

学霸解了半天,到最后还是放弃了,有根号难度大

家居要闻

美式风格 呈现田园风格

房产要闻

官宣去库存!海南这一区域商办产品,已无限接近住宅!

无障碍浏览 进入关怀版