网易首页 > 网易号 > 正文 申请入驻

美AI巨头频陷非法数据收集争议

0
分享至


本报驻美国、德国特约记者 冯亚仁 昭 东 本报记者 王 冬 ●甄 翔
“有许多专家相信,Open AI公司在使用公共视频网站的数据训练其大模型。”美国“商业内幕”网站18日刊文称,这家业界领先的人工智能(AI)初创企业获取数据的方式正在引发争议。不只是Open AI,近期美国多个头部科技企业遭遇类似争议。训练人工智能大模型的数据来源是否合法?如何界定企业使用公众数据的边界?都成为未来各国完善人工智能法规需要认真考虑的问题。
Open AI遭遇质疑
“商业内幕”网的文章以Open AI公司旗下大火的人工智能视频创作工具Sora为例称,Sora的训练依赖海量数据,这些数据很可能搜刮自谷歌旗下的YouTube视频网站,而这已经几乎是公开的秘密。事实上,YouTube官方一直禁止使用自动化工具批量下载网站视频的做法,也禁止下载YouTube视频用于商业目的,并采取限流等措施应对工具刮削。文章称,目前尚不清楚Open AI是用了什么样的技术手段绕过YouTube的拦截。
美国《华尔街日报》近期采访Open AI首席技术官米拉·穆拉蒂,在被问及公司使用什么数据训练Sora时,她回应称“使用的是公开和被许可数据”。但被问及其中是否包括YouTube视频内容时,她表示“对此并不确定”。
中关村信息消费联盟理事长项立刚20日告诉《环球时报》记者,人工智能大模型分为通用大模型和垂直(行业)大模型。Open AI做的是通用大模型,会在YouTube等公共平台上爬取数据。图片和视频的版权往往较文字更为明确,更容易引发争议。“比如,我拍的视频、图片就是我所创作的内容,但被整合到人工智能大模型里后,就成为后者的内容。这里面有很多法律问题是需要解决的。”
当前,人工智能赛道在全球持续火热,众多初创公司争先恐后地收集高质量的数据训练人工智能大模型。“商业内幕”网援引熟悉Open AI运营的人士的话称,该公司指派了一个“秘密团队”来获取训练数据,公司内部也不会深究数据来源。互联网界的各大玩家似乎达成某种“共识”——只要自身能抓取到别人的数据,也就默许其他玩家采取相同的做法。
在一些人看来,这样的“共识”是狂飙突进中的人工智能产业需要留意的一大隐患。“商业内幕”网的报道认为,生成式人工智能的快速兴起掀起了一场世界范围内的技术竞赛,在这个新领域中,什么是合法的,什么是合乎道德的,目前尚缺乏明确而成熟的规则。
“混乱”中推动监管措施变革
“商业内幕”网称,人们对复杂的生成式人工智能系统给公众带来的潜在危害有很多担忧,公众对这些人工智能大模型从何处获取数据、如何使用数据以及在涉及敏感信息时是否采取保护措施知之甚少,科技公司不仅没有告诉公众太多信息,甚至连自身都无法将这一过程彻底解释清楚。
一段时间以来,美国多家业内头部企业因人工智能训练数据来源而陷入侵权纠纷,甚至吃到官司。本月初,3名作家在美国加州对英伟达公司发起集体诉讼,指控该公司的NeMo AI平台使用盗版文学网站素材训练人工智能的自然语言撰写技能。早前,包括《冰与火之歌》作者在内的18名作家起诉Open AI侵权;《纽约时报》起诉Open AI和微软非法使用其内容;在2023年,就有许多设计师起诉人工智能绘画软件Midjourney和Stability AI未经许可使用其版权作品训练人工智能绘图工具。美国娱乐游戏网站IGN评价上述官司称,这些案例或成为推动监管措施变革的关键。
面对外界越来越频繁的质疑,一些巨头对训练人工智能所用的海量数据来源讳莫如深。去年年底,两名美国议员提出一项《人工智能基础模型透明法案》,要求所有人工智能基础模型都必须披露训练数据来源、获取数据的方式以及使用的算法等。但这项法案何时能成为正式立法不得而知。
多国法规有待检验
中国经济学者盘和林告诉《环球时报》记者,对于获取训练人工智能大模型的数据,各国法规尚有分歧,甚至是一片空白。有些国家的法规更加倾向于信息公开,有些国家的法规更加倾向于信息安全。共识在于,选取数据不能涉及个人隐私数据。如果企业爬取公共数据,需对数据进行处理以达到脱敏脱密。
项立刚告诉记者,中国去年在人工智能大模型的管理方面出台了相关的条例。至于涉及知识产权的管理,需要在未来随着人工智能产品的完善和技术的发展进一步制定相关的法律和法规。
在管理人工智能训练数据来源方面,欧洲步子迈得较大。瑞士《一瞥报》19日称,人们已经意识到,会有犯罪者通过网络数据进行非法AI创作,甚至还会出现勒索事件。欧洲议会13日以压倒性票数通过《人工智能法案》。该法案为人工智能技术设置严格的规则,旨在确保人工智能的使用不会侵犯人的基本权利,如隐私、数据保护和非歧视等。欧盟官员将其称为“世界上第一部针对可信人工智能的全面、具有约束力的法规”。
盘和林表示,与美国不同,中国主流人工智能大模型多基于企业内部数据进行训练。美国是判例法国家,经纪商可能从数据平台购买数据,更多的则是从互联网公开数据中爬取有用数据。包括社交媒体的所有资料。继而对数据进行预标注和加工处理。“商业内幕”网认为,谷歌、Open AI和一些科技公司认为,在当前的“共识”下,即使使用受版权保护的内容进行人工智能模型训练是合法的,但这样的诉求也有待得到监管机构或法庭的检验。▲

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2025年,静一静,淡一淡,走一走

2025年,静一静,淡一淡,走一走

洞读君
2025-01-08 11:31:20
布林肯走后第2天!执政党受命,对尹锡悦下手,李在明釜底抽薪

布林肯走后第2天!执政党受命,对尹锡悦下手,李在明釜底抽薪

国际阿尝
2025-01-07 22:24:59
与中国硬刚?缅甸克伦邦武装竟成妙瓦底电诈活动保护伞,什么来头

与中国硬刚?缅甸克伦邦武装竟成妙瓦底电诈活动保护伞,什么来头

琉璃聊科学
2025-01-07 08:38:56
6000万,利物浦宣布努涅斯

6000万,利物浦宣布努涅斯

球文速递
2025-01-07 14:07:26
雷鸟V3正式发布,定价1799元

雷鸟V3正式发布,定价1799元

界面新闻
2025-01-07 22:02:55
全民狂欢!怎样逮住尹锡悦?

全民狂欢!怎样逮住尹锡悦?

那山星火
2025-01-08 08:09:25
刘烨混血儿子诺一长大了,14岁身高一米八,长相和爸爸如复制粘贴

刘烨混血儿子诺一长大了,14岁身高一米八,长相和爸爸如复制粘贴

最炫时尚
2024-11-26 21:12:46
第43届香港电影金像奖报送片单出炉,刘德华、黄子华和林峰争影帝

第43届香港电影金像奖报送片单出炉,刘德华、黄子华和林峰争影帝

千信齐飞
2025-01-07 19:56:19
抗癌网红“彭大哥”去世,年仅47岁,长期嚼槟榔割右脸,张不开嘴

抗癌网红“彭大哥”去世,年仅47岁,长期嚼槟榔割右脸,张不开嘴

180°视角
2025-01-08 10:23:01
爸爸压力太大,独自坐在阳台沉思,女儿看到搬过板凳努力逗爸爸笑

爸爸压力太大,独自坐在阳台沉思,女儿看到搬过板凳努力逗爸爸笑

老王侃趣闻
2025-01-08 11:56:53
特斯拉焕新版model Y全新换代,热议之下的销量明星春节前见。

特斯拉焕新版model Y全新换代,热议之下的销量明星春节前见。

沙雕小琳琳
2025-01-08 10:00:26
人类清除计划开始了?俄罗斯爆料称:美国在全球建生物实验室

人类清除计划开始了?俄罗斯爆料称:美国在全球建生物实验室

粤语音乐喷泉
2025-01-08 00:28:26
成功瞒天过海?时隔半月,日媒才爆料:中方曾成功封锁过宫古海峡

成功瞒天过海?时隔半月,日媒才爆料:中方曾成功封锁过宫古海峡

兵器观察员
2025-01-07 13:15:20
银行新规,全国已开始实施,以后,死者的存款不再受银行的气!

银行新规,全国已开始实施,以后,死者的存款不再受银行的气!

巢客HOME
2024-12-04 07:25:03
好莱坞美艳女星首封影后!出道45年靠跳脱衣舞获全球最高片酬,领奖激动落泪:我不是花瓶!

好莱坞美艳女星首封影后!出道45年靠跳脱衣舞获全球最高片酬,领奖激动落泪:我不是花瓶!

英国报姐
2025-01-06 21:46:25
王星得救了,我却为他女朋友捏把汗!王星彻底火了,可别变负心汉

王星得救了,我却为他女朋友捏把汗!王星彻底火了,可别变负心汉

小娱乐悠悠
2025-01-08 10:40:37
两性关系:女人年龄过了50岁,大部分女性都会出现以下状况

两性关系:女人年龄过了50岁,大部分女性都会出现以下状况

十二生肖运势分析
2025-01-01 14:02:11
江苏宿迁光明村,刘强东给家乡父老拜年:送去50000万件礼物

江苏宿迁光明村,刘强东给家乡父老拜年:送去50000万件礼物

阿昌走遍中国
2025-01-08 08:32:32
赵本山外孙周岁宴曝光,球球一家同框好幸福,宝贝像舅舅又像姥爷

赵本山外孙周岁宴曝光,球球一家同框好幸福,宝贝像舅舅又像姥爷

涵豆说历史
2025-01-08 08:52:32
争议!曝前央视名嘴承办WTT赛事 收入441万未按规定上交

争议!曝前央视名嘴承办WTT赛事 收入441万未按规定上交

念洲
2025-01-08 08:58:08
2025-01-08 13:15:00
环球时报新闻 incentive-icons
环球时报新闻
侧重突发国内外新闻、视频
60290文章数 622652关注度
往期回顾 全部

科技要闻

定了!买手机,国家最高补贴500元

头条要闻

多位老师回应“刘强东发10万现金” 师生旧合照披露

头条要闻

多位老师回应“刘强东发10万现金” 师生旧合照披露

体育要闻

消失3年后,国乒冠军成为一名大学老师

娱乐要闻

王星假装顺从保命,采访时看泰警脸色

财经要闻

重要通知!以旧换新加力扩围

汽车要闻

10万元级无图智驾 悦也PLUS全路况实测

态度原创

房产
亲子
时尚
健康
手机

房产要闻

惊艳白鹅潭的“鼎豪瑧品”,竟是保利造!

亲子要闻

宝宝戴帽子一气呵成,动作干净利落,好熟练的样子,网友:我家的就只会扯帽子快

女人到了40岁,穿衣要整齐大方有质感,这些穿搭让你更有灵感

抑郁症患者称好的“乌托邦”宝地

手机要闻

大屏长续航 征服入门市场!Redmi 14C评测:499元的良心守门人

无障碍浏览 进入关怀版