网易首页 > 网易号 > 正文 申请入驻

学术写作哪家强?比较DeepSeek、ChatGPT、通义千问等生成式AI在学术写作中的应用

0
分享至

编辑丨王多鱼

排版丨水成文

随着人工智能(AI)技术的快速发展,尤其是大语言模型(LLM)的进步,生成式人工智能(Generative AI)在学术写作中的应用越来越广泛。

近日,滑铁卢大学等机构的研究人员发表了一篇题为:Generative AI in Academic Writing: A Comparison of DeepSeek, Qwen, ChatGPT, Gemini, Llama, Mistral, and Gemma 的预印本论文,该论文旨在评估几种主流大语言模型(包括 DeepSeek v3、Owen 2.5 Max、ChatGPT、Gemini、Llama、Mistral 和 Gemma)在学术写作中的表现,特别是它们在生成高质量学术内容方面的能力。

这篇论文为生成式人工智能(Generative AI)在学术写作中的应用提供了详细的评估和比较,为未来的研究提供了重要参考。

论文作者使用了 40 篇关于“数字孪生”和“医疗保健”主题的学术文章,通过生成式 AI 工具生成文本,并对生成的文本进行以下评估:

1、抄袭检测:使用 iThenticate 工具检测文本的抄袭率。

2、AI 检测:使用 StealthWriter.ai 和 Quillbot.com 检测文本是否由 AI 生成。

3、字数比较:比较不同大预言模型生成的文本字数。

4、语义相似性:使用 ChatGPT、DeepSeek v3 和 Owen 2.5 Max 工具评估生成文本与原文的语义相似性。

5、可读性评估:使用 Hemingway Editor、Grammarly 和 WebFX 工具评估文本的可读性。

结果显示:

从性价比来看,DeepSeek v3 的性价比最高

在文本生成能力方面,Owen 2.5 Max 和 DeepSeek v3 生成的文本字数最多,内容较为详细,而 Mistral 7B 和 Deepseek-coder-v2 16B 生成的文本较为简洁。

在抄袭率方面,ChatGPT 4o mini 生成的文本的抄袭率最高(57%),而 Llama 3.1 8B 的抄袭率最低(9%)。

在 AI 检测方面,几乎所有的大模型生成的文本都能够被 AI 检测工具识别为 AI 生成,只是 AI 痕迹有多有少。

在可读性方面,所有大模型生成的文本在可读性方面表现都较差,尤其是 Hemingway Editor 给出的评分普遍较低。

在语义相似性方面,所有大模型生成的文本在语义上与原文保持了较高的相似性,尤其是 Owen 2.5 Max 和 DeepSeek v3 的表现最为一致。

研究表明,Owen 2.5 Max 和 DeepSeek v3 在学术写作任务中表现较好,尤其是在生成详细内容方面。然而,不同模型在不同场景下各有优势,例如 Llama 3.1 8B 在抄袭率和可读性方面表现较好。未来的研究可以进一步探讨如何优化这些模型,以提高生成文本的质量和可读性,并减少 AI 生成的痕迹。

论文作者进一步指出,未来可以从以下几个方面改进生成式人工智能在学术写作中的表现,包括扩展数据集,使用更大规模的数据集评估模型的泛化能力;通过人机协作,探索如何更有效地将 AI 工具与人类用户结合,以提高学术写作的质量;优化模型生成过程,减少 AI 生成的痕迹,使文本更加自然。此外,还需要进一步研究 AI 生成内容的伦理和法律问题(例如版权、引用规则等)。

论文链接

https://www.researchgate.net/publication/388681921

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
平均每人负债1300万,书记吴仁宝去世10年后,华西村的现况如何?

平均每人负债1300万,书记吴仁宝去世10年后,华西村的现况如何?

哄动一时啊
2026-01-24 21:29:54
罗马诺实锤!穆里尼奥皇马首签来了!王牌中场加盟板上钉钉

罗马诺实锤!穆里尼奥皇马首签来了!王牌中场加盟板上钉钉

奶盖熊本熊
2026-05-19 04:36:24
5244人全扒完!黑龙江26年公务员录取名单曝光,发现三个让家长失眠真相

5244人全扒完!黑龙江26年公务员录取名单曝光,发现三个让家长失眠真相

老满说高考
2026-05-18 20:54:36
视同缴费并没有完全消失,依然存在80、90后社保档案里,都谁有?

视同缴费并没有完全消失,依然存在80、90后社保档案里,都谁有?

娱乐的硬糖吖
2026-05-19 14:20:24
中国楼市:如果未来2年,你还是坚持不买房,请读完这篇文章

中国楼市:如果未来2年,你还是坚持不买房,请读完这篇文章

专业聊房君
2026-05-19 10:12:29
孙铭徽回应伤情动态!身体只恢复五六成,新受伤的两只脚出现肿胀

孙铭徽回应伤情动态!身体只恢复五六成,新受伤的两只脚出现肿胀

篮球资讯达人
2026-05-19 12:45:07
这是啥剧情!堂堂状元郎,29岁拿着3800万年薪,30岁直奔退役而去

这是啥剧情!堂堂状元郎,29岁拿着3800万年薪,30岁直奔退役而去

球毛鬼胎
2026-05-18 17:08:17
2.0T!奔驰5款新车上市,45万起

2.0T!奔驰5款新车上市,45万起

科技堡垒
2026-05-17 12:17:09
最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

周军律师聊案子
2026-04-21 09:50:16
美媒集体震惊:这次访华,才真正见识到中国温度!

美媒集体震惊:这次访华,才真正见识到中国温度!

福建睿平
2026-05-18 11:56:20
5月19日影响市场大事件

5月19日影响市场大事件

每日经济新闻
2026-05-19 06:55:23
景美人更美

景美人更美

蓝色海洋009
2026-05-11 10:35:22
江西举报恩人沈女士已社死!正脸照曝光,大叔被调岗景区出面回应

江西举报恩人沈女士已社死!正脸照曝光,大叔被调岗景区出面回应

星娱叨叨社
2026-05-19 15:40:34
浙江女子190万把房子卖给租客,租客觉得贵拒绝了,随后女子找其他人170万成交,租客却起诉女子,要求赔偿20万!法院判了

浙江女子190万把房子卖给租客,租客觉得贵拒绝了,随后女子找其他人170万成交,租客却起诉女子,要求赔偿20万!法院判了

大爱三湘
2026-05-18 11:54:26
蒋凡的压力比吴泳铭还大

蒋凡的压力比吴泳铭还大

蓝鲸新闻
2026-05-18 18:58:42
官方:CCTV5转播U17亚洲杯半决赛,国少vs澳大利亚

官方:CCTV5转播U17亚洲杯半决赛,国少vs澳大利亚

懂球帝
2026-05-18 17:05:09
历史性的1-0!英超冠军在望!曼城慌了,输球=无缘冠军

历史性的1-0!英超冠军在望!曼城慌了,输球=无缘冠军

乌龙球OwnGoal
2026-05-19 10:13:36
本田在华销量锐减百万,谁按了自毁按钮

本田在华销量锐减百万,谁按了自毁按钮

老头的传奇色彩
2026-05-19 15:37:10
假如许世友的两套作战方案得到采纳,估计越南历史会被重写

假如许世友的两套作战方案得到采纳,估计越南历史会被重写

勇哥读史
2026-05-11 14:54:10
突然爆发,半导体龙头“20cm”涨停

突然爆发,半导体龙头“20cm”涨停

数据宝
2026-05-19 15:07:23
2026-05-19 16:27:00
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科学研究
9418文章数 145083关注度
往期回顾 全部

科技要闻

马斯克败诉,法院判他起诉OpenAI太晚了

头条要闻

赖清德"偷渡式"窜访非洲国家被中国"踢出群" 大使发声

头条要闻

赖清德"偷渡式"窜访非洲国家被中国"踢出群" 大使发声

体育要闻

文班亚马1比0雷霆:凌驾MVP的史诗价值

娱乐要闻

姚晨删博难平众怒,为什么她还能蹦哒

财经要闻

从卖流量到卖Token,运营商算力生意破局

汽车要闻

德味操控+聪明大脑,与众07不输新势力

态度原创

本地
手机
亲子
数码
时尚

本地新闻

别搜晋江小说了,去看真的晋江

手机要闻

Omdia:东南亚智能手机市场2026Q1平均售价同比大增19%

亲子要闻

带娃复查鼻炎腺样体肥大,还好一切安然无恙,孩子身体无小事早发

数码要闻

优派上架LX720-4KC Ultra投影仪

休闲阔腿裤怎么穿才美?看看这些穿搭公式,解锁不重样的造型

无障碍浏览 进入关怀版