ai怎么做内容识别(OpenAI官方推出AI生成内容识别器)
ai怎么做内容识别(OpenAI官方推出AI生成内容识别器)
2024-09-30 08:57:20  作者:摧毁容颜  网址:https://m.xinb2b.cn/know/bqi296501.html

机器之心报道

编辑:泽南、杜伟

识别 ChatGPT 生成的内容,OpenAI 亲自上阵了。

很多人也许已经忘记,ChatGPT 正式发布时间是去年 11 月底,到现在才刚刚两个月,但它掀起的热潮却已引发科技公司纷纷跟进,催生了独角兽创业公司,还让学术界修改了论文接收的要求。

在 ChatGPT 引发 AI 领域「是否要禁用」大讨论之后,OpenAI 的真假鉴别工具终于来了。

1 月 31 日,OpenAI 官宣了区分人类作品和 AI 生成文本的识别工具上线,该技术旨在识别自家的 ChatGPT、GPT-3 等模型生成的内容。然而分类器目前看起来准确性堪忧:OpenAI 在博客里指出 AI 识别 AI 高置信度正确率约为 26%。但该机构认为,当它与其他方法结合使用时,可以有助于防止 AI 文本生成器被滥用。

「我们提出分类器的目的是帮助减少人工智能生成的文本造成的混淆。然而它仍然有一些局限性,因此它应该被用作其他确定文本来源方法的补充,而不是作为主要的决策工具,」OpenAI 发言人通过电子邮件对媒体介绍道。「我们正通过这个初始分类器获取有关此类工具是否有用的反馈,并希望在未来分享改进的方法。」

最近科技领域随着围绕生成式 AI,尤其是文本生成 AI 的热情正在不断增长,但相对的是人们对于滥用的担忧,批评者呼吁这些工具的创造者应该采取措施减轻其潜在的有害影响。

面对海量的 AI 生成内容,一些行业立刻作出了限制,美国一些最大的学区已禁止在其网络和设备上使用 ChatGPT,担心会影响学生的学习和该工具生成的内容的准确性。包括 Stack Overflow 在内的网站也已禁止用户共享 ChatGPT 生成的内容,称人工智能会让用户在正常的讨论中被无用内容淹没。


这些情况突出了 AI 识别工具的必要性。虽然效果不尽如人意,但 OpenAI AI 文本分类器(OpenAI AI Text Classifier)在架构上实现了和 GPT 系列的对标。它和 ChatGPT 一样是一种语言模型,是根据来自网络的许多公开文本示例进行训练的。与 ChatGPT 不同的是,它经过微调可以预测一段文本由 AI 生成的可能性 —— 不仅来自 ChatGPT,也包括来自任何文本生成 AI 模型的内容。

具体来说,OpenAI 在来自五个不同组织(包括 OpenAI 自己)的 34 个文本生成系统的文本上训练了 AI 文本分类器。这些内容与维基百科中相似(但不完全相同)的人工文本、从 Reddit 上共享的链接中提取的网站以及为 OpenAI 文本生成系统收集的一组「人类演示」配对。

需要注意的是,OpenAI 文本分类器不适用于所有类型的文本。被检测的内容至少需要 1000 个字符,或大约 150 到 250 个单词。它没有论文检测平台那样的查重能力 —— 考虑到文本生成人工智能已被证明会照抄训练集里的「正确答案」,这是一个非常难受的限制。OpenAI 表示,由于其英语前向数据集,它更有可能在儿童或非英语语言书写的文本上出错。

在评估一段给定的文本是否由 AI 生成时,检测器不会正面回答是或否。根据其置信度,它会将文本标记为「非常不可能」由 AI 生成(小于 10% 的可能性)、「不太可能」由 AI 生成(在 10% 到 45% 之间的可能性)、「不清楚它是否是」AI 生成(45% 到 90% 的机会)、「可能」由 AI 生成(90% 到 98% 的机会)或「很有可能」由 AI 生成(超过 98% 的机会)。

看起来和图像识别的 AI 很像,除了准确程度。根据 OpenAI 的说法,分类器错误地将人类编写的文本标记为 AI 编写的文本的概率为 9%。

一番试用之后,效果的确不大行

OpenAI 宣称其 AI 文本分类器的成功率约为 26%,一些网友上手试用之后,发现识别效果果然不行。

知名 ML 和 AI 研究人员 Sebastian Raschka 试用之后,给出了「It does not work」的评价。他使用其 2015 年初版的 Python ML 书籍作为输入文本,结果显示如下。

Randy Olson 的 foreword 部分被识别为不清楚是否由 AI 生成(unclear)他自己的 preface 部分被识别为可能由 AI 生成(possibly AI)第一章的段落部分被识别为很可能由 AI 生成(likely AI)


Sebastian Raschka 对此表示,这是一个有趣的例子,但自己已经为将来可能因离谱的论文识别结果而受到惩罚的学生感到难过了。

因此他提议,如果要部署这样的模型,请共享一个混淆矩阵。不然如果教育者采用这一模型进行评分,则可能会对现实世界造成伤害。此外还应该增加一些有关误报和漏报的透明度。

此外,Sebastian Raschka 输入了莎士比亚《麦克白》第一页的内容,OpenAI AI 文本分类器给出的结果竟然是很可能由 AI 生成。简直离谱!


还有人上传了 AI 写作工具 Easy-Peasy.AI 创作的内容,结果 OpenAI AI 文本分类器判定为由 AI 生成的可能性非常小。


最后,有人用上了反复翻译大法,把文本让 GPT3 重写一遍,也能骗过识别器。


总结一下的话就是正向识别不准,反向识别出错,也无法识破一些改论文的技巧。看来,起码在 AI 文本内容识别这一领域,OpenAI 还需努力。

参考内容:

https://techcrunch.com/2023/01/31/openai-releases-tool-to-detect-ai-generated-text-including-from-chatgpt/

https://openai.com/blog/chatgpt/

  • 举目无亲的意思(举目无亲是什么意思)
  • 2024-10-01举目无亲是什么意思举目无亲,汉语成语,拼音是jǔmùwúqīn,释义是抬起眼睛,看不见一个亲人比喻单身在外,人地生疏出自《刘无双传》唐·薛调《刘无双传》:“四海之广,举目无亲戚,未知托身之所”【近义词】无依无靠、孤苦伶。
  • 幼儿园的宝宝被亲了怎么办(宝宝可爱被狂亲)
  • 2024-10-01宝宝可爱被狂亲看见萌娃,你是不是也老想亲一口?家长们要注意了,小宝宝老被亲吻,可能会感染EB病毒,患上“亲吻病”“亲吻病”要与感冒鉴别什么是“亲吻病”?“亲吻病”即EB病毒感染,之所以被称为“亲吻病”,正是因为该病。
  • 三一八惨案谁被埋在老实人堆里(历史回顾)
  • 2024-10-01历史回顾段祺瑞政府卫队与群众对峙的情形1926年3月18日,北京发生了“三一八”惨案天津大沽口事件后,日本联合英美等八国于3月16日向北洋军阀段祺瑞执政府提出撤除津沽防务的所谓最后通碟,激起中国人民极大愤慨中。
  • 肚子里蛔虫大概多久形成(肚子里的蛔虫成真了)
  • 2024-10-01肚子里的蛔虫成真了现代快报讯(通讯员苏宣记者庄剑翔)扬州的张女士这段时间一直频繁腹痛,加上此前一直有便秘的问题,以为是肠道出了毛病,便来到位于扬州的苏北人民医院就诊而医生通过肠镜发现,导致她腹痛的“罪魁祸首”,是一条寄。
  • 如何水培独头蒜
  • 2024-10-01如何水培独头蒜水培独头蒜方法:在水培独头蒜的时候,要先挑选好没有受损后的大蒜,可根据情况决定是否要剥皮找来深浅和大小都适合的容器,将独头蒜的底部向下摆放好,并添加清水,水加到蒜的一半位置就行水培期间需控制温度在10。
  • 弹珠传说 动漫评分(星游记弹珠传说超兽武装国漫优秀配乐第二弹)
  • 2024-10-01星游记弹珠传说超兽武装国漫优秀配乐第二弹昨天推出的国漫优秀配乐系列收到了广大漫迷的热情支持,所以在下就不等看完《狐妖小红娘》就来先吐为快,谈一下其他动漫中那些优秀的配乐再飞行.wav——《星游记》歌词片段:眼前重复的风景渐渐模糊的约定星空下。
  • 本溪旅游最好最实惠的地方(一个不可错过的旅游打卡地)
  • 2024-10-01一个不可错过的旅游打卡地小市一庒位于著名的本溪水洞一公里处,这里是集旅游餐饮住宿于一体的,规模不是很大环境相当的优美这里有百年灵泉、千古奇石,万木争荣,四季水温保持在10°左右,山环水绕,依山傍水,鸟语花香,诗意傲然,景色宜。
  • 洗牙能让牙齿变白吗?(怎么让牙齿变白)
  • 2024-10-01怎么让牙齿变白如果是牙齿上有牙结石,色素还有牙垢等因素使牙齿变黑,通过洗牙,超声龈上洁治,局部冲洗上药,可以使牙齿变白但是如果是因为牙齿龋坏,还有其他原因出现牙齿变黑,通过洗牙的方法是不能使牙齿变白的如果龋坏出现牙。
  • 其木格蒙语是什么意思(其木格蒙语翻译)
  • 2024-10-01其木格蒙语翻译其木格,译为花蕊讯飞语音输入法可以切换成蒙语,打出来蒙语一般指蒙古语蒙古语(西里尔蒙古文:Монголхэл;英语:Mongolianlanguage),属于蒙古语系,主要使用者在中国蒙古族聚居区、蒙。
  • 危险化学品储存知识(危险化学品居然要这样的存储空间)
  • 2024-10-01危险化学品居然要这样的存储空间化学品因其具有毒性、易燃性、腐蚀性及易反应性等危害特性,在使用、储存、运输及废弃等运作过程中皆可能会产生严重事故为加强危化品存储管理,减少存储过程事故发生率,对化学品仓库的设计必须严格要求引用标准《化。
  • 干贝虾米紫菜炒饭(一个人发懒筋不想做菜时)
  • 2024-10-01一个人发懒筋不想做菜时老公送女儿开学去了,一个人在家空荡荡的暑期还有一个时不时地聊聊天、斗斗嘴的女儿13点了都没想到中午要吃什么,平常这时餐桌上有说有笑的,而现在心里空落落的“师母,还好吗?我过来送点干贝给你吃”“谢谢你,。