焦点热门:精准识别AI生成内容:让AI“识破”AI
时间:2025-08-18 15:02:21来源:中国青年报
近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着DeepSeek、ChatGPT、通义千问、豆包等AIGC国产大模型逐渐变成人们学习、工作中的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,即“AI幻觉”;依赖AI工具代写作业甚至毕业论文,冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。

近日,南开大学计算机学院媒体计算实验室取得最新研究成果,不仅从评估的角度揭示了现有AI检测方法的性能不足,还创新性地提出了“直接差异学习”优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025接收。

目前AI生成内容检测主要有两种路线:一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种标准进行分类。


【资料图】

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前曾有媒体报道,《荷塘月色》《流浪地球》等作品被某常用论文AI率检测系统检出高AI率。

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。

为此,研究团队另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。

“我们的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近10万条人类-AI文本对。

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。

MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用团队的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。

标签:

最新
  • 焦点热门:精准识别AI生成内容:让AI“识破”AI

    近日,OpenAI发布新一代人工智能模型GPT-5,再次引发全球关注。随着

  • 山洪+积水内涝双预警 北京这些地区需注意防范|精彩看点

    综合消息,北京市水务局与市气象局18日9时30分升级发布山洪灾害黄色

  • 湖北通城建鄂湘赣商贸物流中心 总投资超百亿元

    春分时节,位于武深高速出入口处的湖北通城县鄂湘赣商贸物流中心项

  • 业绩增长、财务安全,招商蛇口2024年报彰显高质量发展

    3月17日晚,招商蛇口(001979 SZ)发布2024年年报。报告期内,公司实

  • 7人参选!巴赫之后,谁将成为国际奥委会新掌门?

    2024年8月10日,也正值巴黎奥运会举办期间,现任国际奥委会主席巴赫

  • 李娜:奥运金牌背后的梦想与遗憾

    站上跳台,就只能从前面跳下来,不能从后面走下来。9岁离家,独自一

  • 股票多头排列是什么意思?股票多头排列的特征是什么?

    股票多头排列是什么意思?股票多头排列,就是价格呈上升趋势,说明过

  • 首届中亚国家室内田径邀请赛在新疆举行

    新华社乌鲁木齐11月11日电(记者孙哲、阿曼)11日,首届弹射者杯中

  • 环球聚焦:尺素金声|专利全球占比42%,中国5G加速跑——从十个新数据看中国经济高质量发展底座

    国庆长假,北京的刘先生一家飞抵新疆阿克苏,除了尽享当地美食,还

  • 焦点资讯:跨区域文旅协作 有“面子”更有“里子”

    据报道,湖北省武汉市黄陂区联合内蒙古锡林郭勒盟策划的木兰草原首

  • 每日速读!基金怎么才能全部赎回?基金可以随时赎回吗?

    基金怎么才能全部赎回?投资者在赎回基金的操作过程中点击全部赎回即

  • ​西平县焦庄毛寨小学开展劳动教育快乐成长活动

    2024年9月12日,西平县焦庄毛寨小学热闹非凡,一场充满意义的劳动教育

  • 微头条丨今年前7个月上海口岸对非洲进出口总值居全国首位

    中新社上海9月3日电 (记者 姜煜)据上海海关3日发布的统计数据,今

  • 今日热门!倩碧全球总裁Michelle Freyre:期待倩碧在中国市场发展取得显著成效

    1968年首创黄油神话,1976年首创高端男士护肤,2010年于美妆界率先

  • 环球视讯!国家统计局:6月份各线城市商品住宅销售价格环比降幅总体收窄

    中新网7月15日电 国家统计局网站发布2024年6月份70个大中城市商品

  • 全球热头条丨破解新能源消纳痛点难点

    近两年,我国新能源发展进一步提速,消纳需求大幅增加。为适应新能

  • 旅游
    • 上海发布曹杨新村街道15分钟社区生活圈地图,有江南、简洁、影像三种风格

    • 统计局:7月二线城市新建商品住宅销售价格环比由上月持平转为下降0.2%

    • 共享电动车未配头盔,发生事故谁担责?法院判了

    • 共享充电变钱包刺客?实测6款共享充电宝,真实数据告诉你有多坑