网易首页 > 网易号 > 正文 申请入驻

复旦再推AI文本检测工具“谛听” 识别ChatGPT成功率达80%

0
分享至

GPT-4让AI更加具有像人一样的能力,AI生成的文本的流畅度也令人惊叹,越来越难以辨识。在这一背景下,AI检测文本工具可以通过对生成文本进行追踪和检测,来识别文本是否由AI生成,这也成为防止大型AI语言模型用于作弊等行为的利器。

日前,复旦大学自然语言处理实验室推出了一款用于AI生成文本检测的测试软件“谛听”(英文:Sniffer),基于黑盒假设,无需大规模监督训练,就能检测AI生成的文本。据该软件的英文版本介绍,对于ChatGPT生成文本的检测率达到80%左右。

实验室负责人邱锡鹏教授3月16日晚间在微信朋友圈上表示:“后续将会在MOSS语言模型开源后,将Sniffer与MOSS进行联动,构成一对矛与盾,相互提升,继续探索大模型的新技术。”

上个月,邱锡鹏告诉第一财经记者,如果优化顺利,MOSS将于3月底开源。团队表示,未来“谛听”软件工具还将支持GPT-4等更多大模型等检测,并在检测性能提升后整理公开模型。

不过团队坦言,由于“谛听”的模型是建立在“黑盒假设”下,因此对于输入文本的来源模型并不知晓,而且与监督训练的分类器相比 ,将仅使用少部分数据进行训练。

值得注意的是,测试集的检测结果显示,该模型中文检测的准确率低于英文,因此中文检测结果还需要进一步提升。

根据“谛听”的英文版介绍,在保留的测试集上检测结果显示,识别ChatGPT生成文本的成功率在80%左右,识别人类书写文本或GPT-2生成文本的成功率高于90%;非常短的文本(50个单词或更少)很难被检测到。此外,英文人工编写的示例文本来自维基百科。

“谛听”英文检测结果分为四类:来自人类; 来自人类、但可能有大模型如GPT-3辅助;来自GPT-3模型;来自GPT-2模型。

“谛听”中文版的检测结果分为三类:一是“文本是人写的”、二是“文本是人写的,但是也很可能包含AI参与”、三是“文本是出自于AI模型的”。

3月17日,邱锡鹏对第一财经记者表示:“对ChatGPT级别的中文检测准确率目前只有约40%,不过对于小模型(3B左右的开源GPT-2模型)生成的准确率可以达到90%左右。”

他解释称,中文检测的准确率低于英文有几个原因。“首先是英文采用的wikipedia数据集进行特征提取,因此覆盖面更广,中文选择的数据质量差一些,这也是我们发布beta测试并且正在改进的地方;第二个是中文大模型的tokenizer(分词器)差异会大一些。”邱锡鹏说道。

他还表示,关于生成文本检测,国外有一些已经发布的产品,对比下来,针对GPT-2级别的模型,准确率比较高,针对GPT-3级别的模型,检测结果还比较差。

“一方面是这些模型是黑盒,我们的掌握信息有限,另一方面是这些模型生成质量很高,多样性也很好,尤其是GPT-4出现以后,相比于GPT-3.5,检测难度进一步增加了。”邱锡鹏对第一财经记者表示,“总而言之,在大模型时代,文本检测的机器评测准确率仍然较低,还需要进一步的研究。”

目前的AI文本检测方式大致可分为两类:黑盒假设和白盒假设。所谓的“黑盒假设”对大型语言模型通常只有API级别的访问权限。因此,这类方法依靠于收集人类和机器的文本数据样本来训练分类模型;“白盒假设”拥有对大型语言模型的所有访问权限,并且可以通过控制模型的生成行为或者在生成文本中加入水印(watermark)来对生成文本进行追踪和检测。

在实践中,黑盒检测器通常由第三方构建,例如较为著名的GPTZero,而白盒检测器通常由大型语言模型开发人员构建。不过由于“黑盒假设”在数据收集的过程中很容易引入偏见(biases),这些偏见常常会被黑盒分类器作为分类的主要特征。而随着大型语言模型能力的提升,大型语言模型生成的文本和人类的差距越来越小,这会导致黑盒模型的检测准确性越来越低

此外,对于黑盒检测,用户可以微调他们的模型,改变模型输出的风格或者格式,从而导致黑盒检测无法找到通用的检测特征。

复旦大学的语言模型MOSS自上个月推出以来备受各界关注。邱锡鹏认为,国外开发者不太可能以中文为主去发展他们的模型,中国要想开发一个大型语言模型的基座,用于国内的信息处理,就必须建设一个中文能力非常强的大型语言模型。

除了复旦大学之外,包括百度、阿里巴巴在内的中国互联网巨头以及初创公司也都在开发基于AI的大模型技术。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
MLCC产业链:AI算力与国产替代共振下的投资机遇

MLCC产业链:AI算力与国产替代共振下的投资机遇

新浪财经
2026-05-23 18:43:01
台湾第一千金蒋孝章有多美?29岁在爷爷寿宴上留影,风采照人!

台湾第一千金蒋孝章有多美?29岁在爷爷寿宴上留影,风采照人!

萧矹影视解说
2026-05-22 14:26:40
别再同情张豆豆了,看到孙扬生气时她的反应,就知道她并不可怜

别再同情张豆豆了,看到孙扬生气时她的反应,就知道她并不可怜

TVB的四小花
2026-05-24 00:36:28
东风 - 31 泄密大案:总工程师被美色策反,国之重器险遭灭顶之灾

东风 - 31 泄密大案:总工程师被美色策反,国之重器险遭灭顶之灾

干史人
2026-04-18 13:44:12
耻辱!皇马水货惨遭除名!穆里尼奥 2500 万砸世界级王牌取代他!

耻辱!皇马水货惨遭除名!穆里尼奥 2500 万砸世界级王牌取代他!

澜归序
2026-05-24 03:49:00
最后通牒!美前军官惊曝:伊朗密会中俄后,宣布开战先铲除此国

最后通牒!美前军官惊曝:伊朗密会中俄后,宣布开战先铲除此国

老黯谈娱
2026-05-24 12:43:53
梅根在瑞士日内瓦,一本正经的对着空气演讲,那场面真是让人发笑

梅根在瑞士日内瓦,一本正经的对着空气演讲,那场面真是让人发笑

毒舌小红帽
2026-05-22 18:13:40
开拓者选帅变数!基德进候选名单:他也有可能成为杨瀚森的新教练

开拓者选帅变数!基德进候选名单:他也有可能成为杨瀚森的新教练

罗说NBA
2026-05-24 07:03:24
新生儿腰斩、房价下跌?别怪政策了,这才是中国经济的残酷真相!

新生儿腰斩、房价下跌?别怪政策了,这才是中国经济的残酷真相!

冷夜说
2026-05-11 20:31:08
夺冠后却被开除,每月拿600,如今为法国14次夺冠,已成法国媳妇

夺冠后却被开除,每月拿600,如今为法国14次夺冠,已成法国媳妇

古木之草记
2025-12-15 14:31:43
儿女双全却活成孤寡老人?宋世雄的晚年,撕开了多少家庭的遮羞布

儿女双全却活成孤寡老人?宋世雄的晚年,撕开了多少家庭的遮羞布

梦醉为红颜一笑
2026-05-21 20:51:32
比塞克:落选国家队?我已经拼尽全力,希望欧洲杯能得到征召

比塞克:落选国家队?我已经拼尽全力,希望欧洲杯能得到征召

懂球帝
2026-05-24 02:41:06
一手术人就废了?医生:这6疾病保守治疗更好,动刀反而过度医疗

一手术人就废了?医生:这6疾病保守治疗更好,动刀反而过度医疗

岐黄传人孙大夫
2026-05-13 10:00:10
海风:放弃“台独”拥抱和平才有活路

海风:放弃“台独”拥抱和平才有活路

环球网资讯
2026-05-23 21:26:31
美国调整移民政策,申请绿卡须返回本国递交申请

美国调整移民政策,申请绿卡须返回本国递交申请

澎湃新闻
2026-05-23 12:24:21
扬眉吐气!李国旭打了大连英博球迷的脸,还要让他们排队道歉?

扬眉吐气!李国旭打了大连英博球迷的脸,还要让他们排队道歉?

罗掌柜体育
2026-05-24 06:00:14
再次提醒:腿上有这种红血丝的人,可能是身体发出的危险信号

再次提醒:腿上有这种红血丝的人,可能是身体发出的危险信号

健康科普365
2026-05-22 21:05:05
极氪汽车再次证明:中国消费者买车,压根不在乎什么原创设计!

极氪汽车再次证明:中国消费者买车,压根不在乎什么原创设计!

音乐时光的娱乐
2026-05-23 20:35:48
G3输尼克斯!阿特金森谈对抗防守差距,被布伦森打服,考虑扩轮换

G3输尼克斯!阿特金森谈对抗防守差距,被布伦森打服,考虑扩轮换

篮球资讯达人
2026-05-24 13:07:59
外资爆买4只电力设备小票!最低6.2元,主力暗度陈仓

外资爆买4只电力设备小票!最低6.2元,主力暗度陈仓

慧眼看世界哈哈
2026-05-24 10:37:40
2026-05-24 14:24:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
254011文章数 622435关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

白宫发生枪击事件枪手已死亡 曾多次踩点问如何进白宫

头条要闻

白宫发生枪击事件枪手已死亡 曾多次踩点问如何进白宫

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

李晨郑恺冲上热搜!跑男停宣引热议

财经要闻

爆炸致82人遇难 留神峪煤业存违法行为

汽车要闻

2027款星途瑶光上市 把"全球车"标准卷进13万级市场

态度原创

手机
艺术
旅游
教育
时尚

手机要闻

苹果绝对王者,华为国产第一,vivo、小米呢?

艺术要闻

日本发现赵孟頫真迹!水平媲美王羲之

旅游要闻

文博观察|不止看展!深圳文博会山东展区,承包你的文旅消费新体验

教育要闻

南京信息工程大学,就业又爆出大新闻了!

伊姐周六热推:电视剧《嫁金枝》;电视剧《大唐迷雾 第一季》......

无障碍浏览 进入关怀版