用AI打败AI,毕业论文AI检测靠谱吗?
用AI打败AI,毕业论文AI检测靠谱吗?
用AI打败AI,毕业论文AI检测靠谱吗?临近毕业,为了论文(lùnwén)达到AI率标准,有一批大学生不得不狠狠(hěnhěn)修改论文。
对于一些高校的应届毕业生而言,除了传统的查重、盲审、答辩,毕业路上又(yòu)多了一道关卡(guānqiǎ)——AIGC检测。
收到学校对毕业论文进行AIGC检测(jiǎncè)(jiǎncè)的通知,大四学生一帆对“用(yòng)AI查AI”的方式感到不放心。而检测结果让他惊讶:“虽然我(wǒ)自己写的几个段落被误判为99%AI,但没想到我用AI润色的部分也被查出来了”。
利用(lìyòng)系统改写后,他产生了好奇:“降AI也是AI写的,为什么就查不出来?”查看修改(xiūgǎi)内容后,他发现(fāxiàn)“系统降AI方法就是删掉逻辑词、把很多话的表述变成口水话”。
对于AI率降低后的论文,他认为“论文质量反而下降了,但(dàn)为了合格,只能这样改(gǎi)。”
AI 检测再“升级”,不仅判 AI 率还能判(néngpàn)论文质量?
论文“AI味”渐浓,是全球高校共同面对(miànduì)的新难题。
第三方机构(jīgòu)麦可思在2024年对3000多名中国高校师生进行的问卷调查显示,近三成大学生将(jiāng)AI用于论文或作业写作。
2025年Open AI发布(fābù)的报告显示,“美国三分之一以上的大学生使用ChatGPT,他们发送的约四分之一的消息与学习和(hé)学校作业相关”,内容涵盖构思论文框架、寻找主题和拓展观点(guāndiǎn)等。
2024年初,福州大学(fúzhōudàxué)、中国传媒大学(chuánméidàxué)等高校陆续发布了毕业论文(设计)AIGC 检测的通知。相比2024年,今年有更多高校将AIGC检测列入(lièrù)了毕业论文评价体系。西南(xīnán)大学、浙江科技大学、西南交通大学纷纷颁布关于(guānyú)2025届本科毕业论文(设计)AIGC检测的通知。
部分去年(qùnián)已采纳AIGC检测(jiǎncè)的高校则在今年提出了更细致的规定。以福州大学为例,去年的要求是“AIGC检测结果将作为学生毕业设计(论文)成绩评定和校级优秀本科生毕业设计(论文)评选参考依据”。到今年,校方指导文件(wénjiàn)明确指出“AIGC全文检测值应(yīng)≤20%”,并(bìng)规定终稿环节“查重(cházhòng)检测或AIGC检测第二次才通过的论文最终总评成绩只能记作及格”。
在检测AI率(lǜ)的基础上,一些高校进一步采用了AI智评系统,用以评判(píngpàn)论文质量。有别于拿AI率作为(zuòwéi)优秀论文参考依据,广东海洋大学、上海海事大学、温州理工学院等高校采用AI智评系统对本科毕业论文进行评级(píngjí),结果包含四个等级:A(良好论文)、B(合格论文)、C(建议修改(xiūgǎi))、D(高危论文)。
这些(zhèxiē)评级意味着什么?不同(bùtóng)的高校有着不同的标准,构成了难度不一的毕业门槛(ménkǎn)。网友@可回收(kěhuíshōu)分享自己查重定稿后,论文却被智评系统评为C级,她的学校要求论文达到B级才能答辩。网友@一往无前和网友@lady luck则表示自己的学校要求C级即可达标。
根据校方指导文件,一些高校要求学生依据AI评估的(de)结果对论文进一步修改。比如,广东海洋大学(hǎiyángdàxué)要求盲审前,“AI智评结果为C或D以及检测(jiǎncè)智能生成内容比例(bǐlì)超过40%的论文,应予以修改完善”。江苏大学则将AI 论文质量评估系统给出(gěichū)的数值列入了检测标准,要求评估数值“原则上预估合格概率要高于 75%;低于(dīyú) 75%的,需做进一步优化和修改”。
又贵又不稳定,大学生被(bèi)AIGC检测困扰
“查了两次AI率,花了140块,太贵了。”考虑到一旦利用学校免费的查询次数,论文会被计入系统(xìtǒng)成为定稿,应届生立君将论文在(zài)其他平台(píngtái)进行了检测,确保AI率稳定,“一般大家都会提前自费查好,我们不敢(bùgǎn)把学校的检测次数当作试错”。
区别于论文查重精确(jīngquè)到重合的语句标识,AIGC检测以片段为单位,这意味着修改范围扩大和不确定性增加。而面对被(bèi)系统识别为“疑似AI生成”的专业术语和著作原文,不少(bùshǎo)大学生感到困惑。
网友@小狐狸在人间(rénjiān)种花分享了自己的毕业论文检测记录,在正文一字未改、仅添加了参考文献表和封面的情况下,间隔两小时(xiǎoshí)后的AI特征值从27.2%骤降为0.5%。对于花了两百块钱得到的这一波动检测结果,她感到无奈:“现在花钱查的结果也(yě)不敢相信了,好怕学校(xuéxiào)查重不过(bùguò)”。
评论区里,大学生(dàxuéshēng)们倾诉着类似的苦恼,获得高赞的网友@来一口猫钧嘛评论称“很多自己写(xiě)的都会被判定AI,我的摘要写不好,最后是老师给我写的,也被判为中度AI了”;网友@圆镜表示“我连引用的北大(běidà)核心(héxīn)参考文献都被说是AI”。
“AI率降低后,我的论文(lùnwén)却变味了”
目前(mùqián)高校采用的(de)主流检测系统在2024到2025年间先后更新(gēngxīn)。维普于2025年2月26日(rì)完成AIGC检测更新,表示其“增强了对最新AI模型的检测效果”;知网个人(gèrén)查重服务系统于2025年2月13日进行了AIGC检测服务升级;格子达在2025年3月6日发布了AIGC检测3.0版本。
为了探究系统升级是否有效,澎湃新闻记者(xīnwénjìzhě)将(jiāng)去年《换个平台就相差 32%,AI 论文(lùnwén)检测成玄学》用于AIGC检测的(de)同(tóng)一篇“完全由AI生成”的论文投入相同的高校常用检测系统进行了检测。从结果来看,部分网站识别“完全由AI生成文本”的能力有所上升,但不同网站的差异仍然明显。
“我用AI帮我翻译的(de)英文(yīngwén)摘要都被识别出来了”。因此,电子科学与技术专业的晨夕认为,检测系统对于AI生成(shēngchéng)内容的判断还是准确的。但对于AI检测带来论文逻辑性减弱的后果,他(tā)感到无奈。为让AI率更低,他不得不在论文中的许多实验步骤前都加上了“我们(wǒmen)”,原本清晰的实验说明,变成(biànchéng)了“我们通过……,并且我们通过……,从而我们就能得到”的赘余版本。
AI检测器的(de)误判(wùpàn)概率大吗?一篇2024年教育技术领域的Q1级顶刊论文在检测了七款国外主流AI检测器后发现,这些检测器对未经过改写的AI生成内容的平均识别准确率为39.5%,对于(duìyú)人类写作的对照样本识别准确率为67%。这意味着人类有33%的概率被误判为AI,而AI却有高于(gāoyú)60%的概率可以(kěyǐ)蒙混过关。
在新版本发布的(de)公告中,格子达将其中一条区分人(rén)与(yǔ)AI创作的标准描述为(wèi):人类写作存在合理的不确定性,AI生成的文本过于“流畅”。这也导致了大学生们的无奈:为了降低AI率,不得不把论文改“笨”。
网友@江枫渔火对愁眠 分享了为AI率折腰的经历,她抱着把论文修改到最好的心态,却不得不弱化逻辑性,改书面语为口语,“虽然AI率达标了,终于定稿(dìnggǎo)了,但是我(wǒ)对自己的论文不满意(mǎnyì)了,自己把自己的论文改烂(gǎilàn)真的很难受”。
网络上也有不少经验帖分享用AI打败AI的(de)方法(fāngfǎ),但更改后的论文质量大打折扣。尝试过用系统降低AI率的一帆表示,AI改写(gǎixiě)的语句“不像人写的”。删减逻辑词、增加口水话后,论文与严谨、专业的大众印象渐行渐远(jiànyuǎn)。
采纳AI检测器(jiǎncèqì),国外高校态度审慎
除了(chúle)类似“AI 检测率”这样的硬指标划定,国内一些高校也在探索其他规范使用 AI 的方式,比如中国传媒大学(chuánméidàxué)继续教育(jiàoyù)学部设计(shèjì)了《本科毕业论文(设计)生成式人工智能使用情况说明表》,由学生自主披露论文中的 AI 使用情况。
而使用了AI智评系统的广东海洋大学也在指导文件里公布了允许使用AI工具的范围,如“可用于文献检索、关键词推荐和文献管理,但需(xū)确保引用文献的真实性与可靠性。可用于推荐统计图表类型(lèixíng)和辅助制图,但不得用于生成或修改原始研究(yánjiū)数据(shùjù)及关键研究图表”。
关于AI检测器,美国前20所(suǒ)顶尖高校普遍持“不建议使用”态度(tàidù),考虑的(de)主要因素为现有检测技术不成熟、系统无法提供证据、误判和漏判现象频出。
Open AI公司(gōngsī)在官网“教育者常见问题解答”中称:“我们对检测器的(de)研究表明它们并不可靠,因为(wèi)教育工作者可能会对学生作出判断,并造成长期影响”。在训练(xùnliàn)过程中,其研发的AI生成内容检测器将莎士比亚的作品和《独立宣言》等人类撰写(zhuànxiě)的内容标记为 AI 生成。
国内主流AIGC检测平台目前并未(bìngwèi)披露具体的训练集;对(duì)于(duìyú)相关的大模型(móxíng)原理,公开表述也比较模糊。以维普为例,其在官网对于判断标准的描述是“AIGC检测是运用AI大模型,预先对各大AIGC模型生成的海量文本数据进行特征反向演算,掌握AIGC模型文本生成的规律(guīlǜ)”。
根据同方知网数字出版(chūbǎn)技术股份有限公司2025年1月24日公布的专利《AI生成学术文本的判断方法、装置及相关产品(chǎnpǐn)》,其检测系统判定原理如下:首先“利用大(dà)模型对(duì)‘待判断’学术文本进行改写 ”,再(zài)通过对比改写前后的文本,判断该学术文本是否由AI生成。
AI检测技术(jìshù)落后于AI生成技术的(de)现状,导致规避检测变得相对容易。上文提及的检测了七款国外(guówài)主流AI检测器的2024年顶刊论文还提到,即便是相对简单的内容操控(例如添加拼写(xiě)错误、增加文本波动性)也(yě)能非常有效(yǒuxiào)地规避检测;“具备(jùbèi)技术敏感度、资源且有意愿的个体”则能更轻易将AI生成内容伪装成人类所写。这就意味着,滥用AI技术的学生并不担忧检测器的考验,而手写论文的学生却可能因误判而受煎熬。
2024年12月,发表在中文(zhōngwén)核心期刊上的一篇论文《大(dà)语言模型技术背景下重塑研究生论文评价与指导》指出,高校采用“AIGC值”标准要求学生,可能容易导致(dǎozhì)师生之间陷入“猫捉老鼠”困境——“检测软件不断(bùduàn)更新换代,抄袭者随之不断寻求新的规避办法”。“学生将精力投入(tóurù)无意义的表达(biǎodá)变换的文字游戏中”,或许才是AIGC检测最大的隐患。
文中(wénzhōng)一帆、立君、晨夕均为化名
澎湃新闻特约(tèyuē)作者 何洛伊 记者 卫瑶 舒怡尔
(本文来自澎湃(pēngpài)新闻,更多原创资讯请下载“澎湃新闻”APP)
临近毕业,为了论文(lùnwén)达到AI率标准,有一批大学生不得不狠狠(hěnhěn)修改论文。
对于一些高校的应届毕业生而言,除了传统的查重、盲审、答辩,毕业路上又(yòu)多了一道关卡(guānqiǎ)——AIGC检测。
收到学校对毕业论文进行AIGC检测(jiǎncè)(jiǎncè)的通知,大四学生一帆对“用(yòng)AI查AI”的方式感到不放心。而检测结果让他惊讶:“虽然我(wǒ)自己写的几个段落被误判为99%AI,但没想到我用AI润色的部分也被查出来了”。
利用(lìyòng)系统改写后,他产生了好奇:“降AI也是AI写的,为什么就查不出来?”查看修改(xiūgǎi)内容后,他发现(fāxiàn)“系统降AI方法就是删掉逻辑词、把很多话的表述变成口水话”。
对于AI率降低后的论文,他认为“论文质量反而下降了,但(dàn)为了合格,只能这样改(gǎi)。”
AI 检测再“升级”,不仅判 AI 率还能判(néngpàn)论文质量?
论文“AI味”渐浓,是全球高校共同面对(miànduì)的新难题。
第三方机构(jīgòu)麦可思在2024年对3000多名中国高校师生进行的问卷调查显示,近三成大学生将(jiāng)AI用于论文或作业写作。
2025年Open AI发布(fābù)的报告显示,“美国三分之一以上的大学生使用ChatGPT,他们发送的约四分之一的消息与学习和(hé)学校作业相关”,内容涵盖构思论文框架、寻找主题和拓展观点(guāndiǎn)等。
2024年初,福州大学(fúzhōudàxué)、中国传媒大学(chuánméidàxué)等高校陆续发布了毕业论文(设计)AIGC 检测的通知。相比2024年,今年有更多高校将AIGC检测列入(lièrù)了毕业论文评价体系。西南(xīnán)大学、浙江科技大学、西南交通大学纷纷颁布关于(guānyú)2025届本科毕业论文(设计)AIGC检测的通知。
部分去年(qùnián)已采纳AIGC检测(jiǎncè)的高校则在今年提出了更细致的规定。以福州大学为例,去年的要求是“AIGC检测结果将作为学生毕业设计(论文)成绩评定和校级优秀本科生毕业设计(论文)评选参考依据”。到今年,校方指导文件(wénjiàn)明确指出“AIGC全文检测值应(yīng)≤20%”,并(bìng)规定终稿环节“查重(cházhòng)检测或AIGC检测第二次才通过的论文最终总评成绩只能记作及格”。
在检测AI率(lǜ)的基础上,一些高校进一步采用了AI智评系统,用以评判(píngpàn)论文质量。有别于拿AI率作为(zuòwéi)优秀论文参考依据,广东海洋大学、上海海事大学、温州理工学院等高校采用AI智评系统对本科毕业论文进行评级(píngjí),结果包含四个等级:A(良好论文)、B(合格论文)、C(建议修改(xiūgǎi))、D(高危论文)。
这些(zhèxiē)评级意味着什么?不同(bùtóng)的高校有着不同的标准,构成了难度不一的毕业门槛(ménkǎn)。网友@可回收(kěhuíshōu)分享自己查重定稿后,论文却被智评系统评为C级,她的学校要求论文达到B级才能答辩。网友@一往无前和网友@lady luck则表示自己的学校要求C级即可达标。
根据校方指导文件,一些高校要求学生依据AI评估的(de)结果对论文进一步修改。比如,广东海洋大学(hǎiyángdàxué)要求盲审前,“AI智评结果为C或D以及检测(jiǎncè)智能生成内容比例(bǐlì)超过40%的论文,应予以修改完善”。江苏大学则将AI 论文质量评估系统给出(gěichū)的数值列入了检测标准,要求评估数值“原则上预估合格概率要高于 75%;低于(dīyú) 75%的,需做进一步优化和修改”。
又贵又不稳定,大学生被(bèi)AIGC检测困扰
“查了两次AI率,花了140块,太贵了。”考虑到一旦利用学校免费的查询次数,论文会被计入系统(xìtǒng)成为定稿,应届生立君将论文在(zài)其他平台(píngtái)进行了检测,确保AI率稳定,“一般大家都会提前自费查好,我们不敢(bùgǎn)把学校的检测次数当作试错”。
区别于论文查重精确(jīngquè)到重合的语句标识,AIGC检测以片段为单位,这意味着修改范围扩大和不确定性增加。而面对被(bèi)系统识别为“疑似AI生成”的专业术语和著作原文,不少(bùshǎo)大学生感到困惑。
网友@小狐狸在人间(rénjiān)种花分享了自己的毕业论文检测记录,在正文一字未改、仅添加了参考文献表和封面的情况下,间隔两小时(xiǎoshí)后的AI特征值从27.2%骤降为0.5%。对于花了两百块钱得到的这一波动检测结果,她感到无奈:“现在花钱查的结果也(yě)不敢相信了,好怕学校(xuéxiào)查重不过(bùguò)”。
评论区里,大学生(dàxuéshēng)们倾诉着类似的苦恼,获得高赞的网友@来一口猫钧嘛评论称“很多自己写(xiě)的都会被判定AI,我的摘要写不好,最后是老师给我写的,也被判为中度AI了”;网友@圆镜表示“我连引用的北大(běidà)核心(héxīn)参考文献都被说是AI”。
“AI率降低后,我的论文(lùnwén)却变味了”
目前(mùqián)高校采用的(de)主流检测系统在2024到2025年间先后更新(gēngxīn)。维普于2025年2月26日(rì)完成AIGC检测更新,表示其“增强了对最新AI模型的检测效果”;知网个人(gèrén)查重服务系统于2025年2月13日进行了AIGC检测服务升级;格子达在2025年3月6日发布了AIGC检测3.0版本。
为了探究系统升级是否有效,澎湃新闻记者(xīnwénjìzhě)将(jiāng)去年《换个平台就相差 32%,AI 论文(lùnwén)检测成玄学》用于AIGC检测的(de)同(tóng)一篇“完全由AI生成”的论文投入相同的高校常用检测系统进行了检测。从结果来看,部分网站识别“完全由AI生成文本”的能力有所上升,但不同网站的差异仍然明显。
“我用AI帮我翻译的(de)英文(yīngwén)摘要都被识别出来了”。因此,电子科学与技术专业的晨夕认为,检测系统对于AI生成(shēngchéng)内容的判断还是准确的。但对于AI检测带来论文逻辑性减弱的后果,他(tā)感到无奈。为让AI率更低,他不得不在论文中的许多实验步骤前都加上了“我们(wǒmen)”,原本清晰的实验说明,变成(biànchéng)了“我们通过……,并且我们通过……,从而我们就能得到”的赘余版本。
AI检测器的(de)误判(wùpàn)概率大吗?一篇2024年教育技术领域的Q1级顶刊论文在检测了七款国外主流AI检测器后发现,这些检测器对未经过改写的AI生成内容的平均识别准确率为39.5%,对于(duìyú)人类写作的对照样本识别准确率为67%。这意味着人类有33%的概率被误判为AI,而AI却有高于(gāoyú)60%的概率可以(kěyǐ)蒙混过关。
在新版本发布的(de)公告中,格子达将其中一条区分人(rén)与(yǔ)AI创作的标准描述为(wèi):人类写作存在合理的不确定性,AI生成的文本过于“流畅”。这也导致了大学生们的无奈:为了降低AI率,不得不把论文改“笨”。
网友@江枫渔火对愁眠 分享了为AI率折腰的经历,她抱着把论文修改到最好的心态,却不得不弱化逻辑性,改书面语为口语,“虽然AI率达标了,终于定稿(dìnggǎo)了,但是我(wǒ)对自己的论文不满意(mǎnyì)了,自己把自己的论文改烂(gǎilàn)真的很难受”。
网络上也有不少经验帖分享用AI打败AI的(de)方法(fāngfǎ),但更改后的论文质量大打折扣。尝试过用系统降低AI率的一帆表示,AI改写(gǎixiě)的语句“不像人写的”。删减逻辑词、增加口水话后,论文与严谨、专业的大众印象渐行渐远(jiànyuǎn)。
采纳AI检测器(jiǎncèqì),国外高校态度审慎
除了(chúle)类似“AI 检测率”这样的硬指标划定,国内一些高校也在探索其他规范使用 AI 的方式,比如中国传媒大学(chuánméidàxué)继续教育(jiàoyù)学部设计(shèjì)了《本科毕业论文(设计)生成式人工智能使用情况说明表》,由学生自主披露论文中的 AI 使用情况。
而使用了AI智评系统的广东海洋大学也在指导文件里公布了允许使用AI工具的范围,如“可用于文献检索、关键词推荐和文献管理,但需(xū)确保引用文献的真实性与可靠性。可用于推荐统计图表类型(lèixíng)和辅助制图,但不得用于生成或修改原始研究(yánjiū)数据(shùjù)及关键研究图表”。
关于AI检测器,美国前20所(suǒ)顶尖高校普遍持“不建议使用”态度(tàidù),考虑的(de)主要因素为现有检测技术不成熟、系统无法提供证据、误判和漏判现象频出。
Open AI公司(gōngsī)在官网“教育者常见问题解答”中称:“我们对检测器的(de)研究表明它们并不可靠,因为(wèi)教育工作者可能会对学生作出判断,并造成长期影响”。在训练(xùnliàn)过程中,其研发的AI生成内容检测器将莎士比亚的作品和《独立宣言》等人类撰写(zhuànxiě)的内容标记为 AI 生成。
国内主流AIGC检测平台目前并未(bìngwèi)披露具体的训练集;对(duì)于(duìyú)相关的大模型(móxíng)原理,公开表述也比较模糊。以维普为例,其在官网对于判断标准的描述是“AIGC检测是运用AI大模型,预先对各大AIGC模型生成的海量文本数据进行特征反向演算,掌握AIGC模型文本生成的规律(guīlǜ)”。
根据同方知网数字出版(chūbǎn)技术股份有限公司2025年1月24日公布的专利《AI生成学术文本的判断方法、装置及相关产品(chǎnpǐn)》,其检测系统判定原理如下:首先“利用大(dà)模型对(duì)‘待判断’学术文本进行改写 ”,再(zài)通过对比改写前后的文本,判断该学术文本是否由AI生成。
AI检测技术(jìshù)落后于AI生成技术的(de)现状,导致规避检测变得相对容易。上文提及的检测了七款国外(guówài)主流AI检测器的2024年顶刊论文还提到,即便是相对简单的内容操控(例如添加拼写(xiě)错误、增加文本波动性)也(yě)能非常有效(yǒuxiào)地规避检测;“具备(jùbèi)技术敏感度、资源且有意愿的个体”则能更轻易将AI生成内容伪装成人类所写。这就意味着,滥用AI技术的学生并不担忧检测器的考验,而手写论文的学生却可能因误判而受煎熬。
2024年12月,发表在中文(zhōngwén)核心期刊上的一篇论文《大(dà)语言模型技术背景下重塑研究生论文评价与指导》指出,高校采用“AIGC值”标准要求学生,可能容易导致(dǎozhì)师生之间陷入“猫捉老鼠”困境——“检测软件不断(bùduàn)更新换代,抄袭者随之不断寻求新的规避办法”。“学生将精力投入(tóurù)无意义的表达(biǎodá)变换的文字游戏中”,或许才是AIGC检测最大的隐患。
文中(wénzhōng)一帆、立君、晨夕均为化名
澎湃新闻特约(tèyuē)作者 何洛伊 记者 卫瑶 舒怡尔
(本文来自澎湃(pēngpài)新闻,更多原创资讯请下载“澎湃新闻”APP)





相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎