网易首页 > 网易号 > 正文 申请入驻

美AI巨头频陷非法数据收集争议

0
分享至


本报驻美国、德国特约记者 冯亚仁 昭 东 本报记者 王 冬 ●甄 翔
“有许多专家相信,Open AI公司在使用公共视频网站的数据训练其大模型。”美国“商业内幕”网站18日刊文称,这家业界领先的人工智能(AI)初创企业获取数据的方式正在引发争议。不只是Open AI,近期美国多个头部科技企业遭遇类似争议。训练人工智能大模型的数据来源是否合法?如何界定企业使用公众数据的边界?都成为未来各国完善人工智能法规需要认真考虑的问题。
Open AI遭遇质疑
“商业内幕”网的文章以Open AI公司旗下大火的人工智能视频创作工具Sora为例称,Sora的训练依赖海量数据,这些数据很可能搜刮自谷歌旗下的YouTube视频网站,而这已经几乎是公开的秘密。事实上,YouTube官方一直禁止使用自动化工具批量下载网站视频的做法,也禁止下载YouTube视频用于商业目的,并采取限流等措施应对工具刮削。文章称,目前尚不清楚Open AI是用了什么样的技术手段绕过YouTube的拦截。
美国《华尔街日报》近期采访Open AI首席技术官米拉·穆拉蒂,在被问及公司使用什么数据训练Sora时,她回应称“使用的是公开和被许可数据”。但被问及其中是否包括YouTube视频内容时,她表示“对此并不确定”。
中关村信息消费联盟理事长项立刚20日告诉《环球时报》记者,人工智能大模型分为通用大模型和垂直(行业)大模型。Open AI做的是通用大模型,会在YouTube等公共平台上爬取数据。图片和视频的版权往往较文字更为明确,更容易引发争议。“比如,我拍的视频、图片就是我所创作的内容,但被整合到人工智能大模型里后,就成为后者的内容。这里面有很多法律问题是需要解决的。”
当前,人工智能赛道在全球持续火热,众多初创公司争先恐后地收集高质量的数据训练人工智能大模型。“商业内幕”网援引熟悉Open AI运营的人士的话称,该公司指派了一个“秘密团队”来获取训练数据,公司内部也不会深究数据来源。互联网界的各大玩家似乎达成某种“共识”——只要自身能抓取到别人的数据,也就默许其他玩家采取相同的做法。
在一些人看来,这样的“共识”是狂飙突进中的人工智能产业需要留意的一大隐患。“商业内幕”网的报道认为,生成式人工智能的快速兴起掀起了一场世界范围内的技术竞赛,在这个新领域中,什么是合法的,什么是合乎道德的,目前尚缺乏明确而成熟的规则。
“混乱”中推动监管措施变革
“商业内幕”网称,人们对复杂的生成式人工智能系统给公众带来的潜在危害有很多担忧,公众对这些人工智能大模型从何处获取数据、如何使用数据以及在涉及敏感信息时是否采取保护措施知之甚少,科技公司不仅没有告诉公众太多信息,甚至连自身都无法将这一过程彻底解释清楚。
一段时间以来,美国多家业内头部企业因人工智能训练数据来源而陷入侵权纠纷,甚至吃到官司。本月初,3名作家在美国加州对英伟达公司发起集体诉讼,指控该公司的NeMo AI平台使用盗版文学网站素材训练人工智能的自然语言撰写技能。早前,包括《冰与火之歌》作者在内的18名作家起诉Open AI侵权;《纽约时报》起诉Open AI和微软非法使用其内容;在2023年,就有许多设计师起诉人工智能绘画软件Midjourney和Stability AI未经许可使用其版权作品训练人工智能绘图工具。美国娱乐游戏网站IGN评价上述官司称,这些案例或成为推动监管措施变革的关键。
面对外界越来越频繁的质疑,一些巨头对训练人工智能所用的海量数据来源讳莫如深。去年年底,两名美国议员提出一项《人工智能基础模型透明法案》,要求所有人工智能基础模型都必须披露训练数据来源、获取数据的方式以及使用的算法等。但这项法案何时能成为正式立法不得而知。
多国法规有待检验
中国经济学者盘和林告诉《环球时报》记者,对于获取训练人工智能大模型的数据,各国法规尚有分歧,甚至是一片空白。有些国家的法规更加倾向于信息公开,有些国家的法规更加倾向于信息安全。共识在于,选取数据不能涉及个人隐私数据。如果企业爬取公共数据,需对数据进行处理以达到脱敏脱密。
项立刚告诉记者,中国去年在人工智能大模型的管理方面出台了相关的条例。至于涉及知识产权的管理,需要在未来随着人工智能产品的完善和技术的发展进一步制定相关的法律和法规。
在管理人工智能训练数据来源方面,欧洲步子迈得较大。瑞士《一瞥报》19日称,人们已经意识到,会有犯罪者通过网络数据进行非法AI创作,甚至还会出现勒索事件。欧洲议会13日以压倒性票数通过《人工智能法案》。该法案为人工智能技术设置严格的规则,旨在确保人工智能的使用不会侵犯人的基本权利,如隐私、数据保护和非歧视等。欧盟官员将其称为“世界上第一部针对可信人工智能的全面、具有约束力的法规”。
盘和林表示,与美国不同,中国主流人工智能大模型多基于企业内部数据进行训练。美国是判例法国家,经纪商可能从数据平台购买数据,更多的则是从互联网公开数据中爬取有用数据。包括社交媒体的所有资料。继而对数据进行预标注和加工处理。“商业内幕”网认为,谷歌、Open AI和一些科技公司认为,在当前的“共识”下,即使使用受版权保护的内容进行人工智能模型训练是合法的,但这样的诉求也有待得到监管机构或法庭的检验。▲

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
东风31导弹是纸老虎!台当局一语,国安意识到:内部混进了间谍!

东风31导弹是纸老虎!台当局一语,国安意识到:内部混进了间谍!

诗经往史
2024-09-28 12:35:03
项立刚盲目挺华为,用力过猛反为害!

项立刚盲目挺华为,用力过猛反为害!

关尔东
2024-09-28 18:27:56
唐斯交易内幕曝光:森林狼未沟通直接清洗 2.24亿顶薪状元受辱

唐斯交易内幕曝光:森林狼未沟通直接清洗 2.24亿顶薪状元受辱

厝边人侃体育
2024-09-28 12:08:48
空空如也!中网很难成为大满贯级别的赛事,存在5个扎心的事实!

空空如也!中网很难成为大满贯级别的赛事,存在5个扎心的事实!

田先生篮球
2024-09-28 12:55:51
一排长汇报作战方案,被师长连忙打断:停!你是哪所军校毕业的

一排长汇报作战方案,被师长连忙打断:停!你是哪所军校毕业的

历史龙元阁
2024-09-27 23:48:05
江苏一女子用“硫磺皂”洗头,坚持半年后,头发发生了4大变化!

江苏一女子用“硫磺皂”洗头,坚持半年后,头发发生了4大变化!

今日养生之道
2024-09-28 16:57:38
知名景区多家酒店默认早9点退房,网友吐槽起不来,老板:你来睡觉的吗?

知名景区多家酒店默认早9点退房,网友吐槽起不来,老板:你来睡觉的吗?

北京商报
2024-09-26 14:40:24
A股:大家要做好心理准备,A股,很可能会重演历史?

A股:大家要做好心理准备,A股,很可能会重演历史?

财经大拿
2024-09-29 01:30:02
大众将关闭南京工厂,40年合资时代结束:中国的支票没有了

大众将关闭南京工厂,40年合资时代结束:中国的支票没有了

象视汽车
2024-09-28 07:00:03
网传青海无人区三人拦车抢劫,警方调查后却发现这是一起误会

网传青海无人区三人拦车抢劫,警方调查后却发现这是一起误会

映射生活的身影
2024-09-28 11:05:16
他曾被作为接班人培养,称得上党的良心人物

他曾被作为接班人培养,称得上党的良心人物

霹雳炮
2024-09-28 23:19:58
还剩3轮!海港仍2分领先申花,中间还有2场亚冠,谁的赛程更难?

还剩3轮!海港仍2分领先申花,中间还有2场亚冠,谁的赛程更难?

直播吧
2024-09-28 20:15:36
石破茂当选不到24小时对华示好,称想每年都来中国,自曝访华趣事

石破茂当选不到24小时对华示好,称想每年都来中国,自曝访华趣事

牛锅巴小钒
2024-09-28 19:28:33
阿兰官宣无缘国足新名单,伊万火线征召欧洲金靴入替,已提前入籍

阿兰官宣无缘国足新名单,伊万火线征召欧洲金靴入替,已提前入籍

小海要说球
2024-09-28 21:11:08
妖书现世,细思恐极

妖书现世,细思恐极

我是历史其实挺有趣
2024-09-27 10:03:03
“后悔没生在中国”,美国汉语0分试卷走红,国内学生笑不活了

“后悔没生在中国”,美国汉语0分试卷走红,国内学生笑不活了

熙熙说教
2024-09-28 11:00:03
18号台风生成!强冷空气已发货!假期广东天气最低将降至“1字头”

18号台风生成!强冷空气已发货!假期广东天气最低将降至“1字头”

城事特搜
2024-09-28 20:28:42
帕劳总统惠普斯发声:中国洲际导弹试射引区域安全担忧

帕劳总统惠普斯发声:中国洲际导弹试射引区域安全担忧

视觉攻城狮
2024-09-28 14:58:52
一个马斯克搞定全球宽带,中国移动花了上千亿!星链凭啥这么猛?

一个马斯克搞定全球宽带,中国移动花了上千亿!星链凭啥这么猛?

Thurman在昆明
2024-09-28 23:12:23
黄仁勋最新谈对中国芯片管制:美国政府应在国家安全与技术繁荣之间平衡|钛媒体AGI

黄仁勋最新谈对中国芯片管制:美国政府应在国家安全与技术繁荣之间平衡|钛媒体AGI

钛媒体APP
2024-09-28 11:36:20
2024-09-29 03:00:51
环球时报新闻
环球时报新闻
侧重突发国内外新闻、视频
57160文章数 622056关注度
往期回顾 全部

科技要闻

豆包“王炸”,字节版Sora来了,有多厉害

头条要闻

媒体:布林肯主动约王毅见面 双方的关注点有一些差异

头条要闻

媒体:布林肯主动约王毅见面 双方的关注点有一些差异

体育要闻

那个偶像是德里克-罗斯的男孩

娱乐要闻

噩耗!英国皇家影星玛吉史密斯离世

财经要闻

沪市部分股票深夜成交?回应来了!

汽车要闻

售11.99-14.69万元 深蓝2025款SL03正式上市

态度原创

时尚
教育
游戏
手机
军事航空

姚晨这样的大女人,穿上Chloé都变甜了!

教育要闻

不太对呀,姐姐放假只想玩一玩,没想到在家里面更累了

继斯宾塞之后 Xbox官方也来玩梗手柄"X键位置"

手机要闻

四款子系列新机再被确认:均搭载骁龙8 Elite,屏幕材质也已清晰

军事要闻

黎巴嫩真主党声明证实领导人已被杀害

无障碍浏览 进入关怀版