ai怎么做内容识别(OpenAI官方推出AI生成内容识别器)
ai怎么做内容识别(OpenAI官方推出AI生成内容识别器)
2024-11-25 01:06:05  作者:摧毁容颜  网址:https://m.xinb2b.cn/life/bqi296501.html

机器之心报道

编辑:泽南、杜伟

识别 ChatGPT 生成的内容,OpenAI 亲自上阵了。

很多人也许已经忘记,ChatGPT 正式发布时间是去年 11 月底,到现在才刚刚两个月,但它掀起的热潮却已引发科技公司纷纷跟进,催生了独角兽创业公司,还让学术界修改了论文接收的要求。

在 ChatGPT 引发 AI 领域「是否要禁用」大讨论之后,OpenAI 的真假鉴别工具终于来了。

1 月 31 日,OpenAI 官宣了区分人类作品和 AI 生成文本的识别工具上线,该技术旨在识别自家的 ChatGPT、GPT-3 等模型生成的内容。然而分类器目前看起来准确性堪忧:OpenAI 在博客里指出 AI 识别 AI 高置信度正确率约为 26%。但该机构认为,当它与其他方法结合使用时,可以有助于防止 AI 文本生成器被滥用。

「我们提出分类器的目的是帮助减少人工智能生成的文本造成的混淆。然而它仍然有一些局限性,因此它应该被用作其他确定文本来源方法的补充,而不是作为主要的决策工具,」OpenAI 发言人通过电子邮件对媒体介绍道。「我们正通过这个初始分类器获取有关此类工具是否有用的反馈,并希望在未来分享改进的方法。」

最近科技领域随着围绕生成式 AI,尤其是文本生成 AI 的热情正在不断增长,但相对的是人们对于滥用的担忧,批评者呼吁这些工具的创造者应该采取措施减轻其潜在的有害影响。

面对海量的 AI 生成内容,一些行业立刻作出了限制,美国一些最大的学区已禁止在其网络和设备上使用 ChatGPT,担心会影响学生的学习和该工具生成的内容的准确性。包括 Stack Overflow 在内的网站也已禁止用户共享 ChatGPT 生成的内容,称人工智能会让用户在正常的讨论中被无用内容淹没。


这些情况突出了 AI 识别工具的必要性。虽然效果不尽如人意,但 OpenAI AI 文本分类器(OpenAI AI Text Classifier)在架构上实现了和 GPT 系列的对标。它和 ChatGPT 一样是一种语言模型,是根据来自网络的许多公开文本示例进行训练的。与 ChatGPT 不同的是,它经过微调可以预测一段文本由 AI 生成的可能性 —— 不仅来自 ChatGPT,也包括来自任何文本生成 AI 模型的内容。

具体来说,OpenAI 在来自五个不同组织(包括 OpenAI 自己)的 34 个文本生成系统的文本上训练了 AI 文本分类器。这些内容与维基百科中相似(但不完全相同)的人工文本、从 Reddit 上共享的链接中提取的网站以及为 OpenAI 文本生成系统收集的一组「人类演示」配对。

需要注意的是,OpenAI 文本分类器不适用于所有类型的文本。被检测的内容至少需要 1000 个字符,或大约 150 到 250 个单词。它没有论文检测平台那样的查重能力 —— 考虑到文本生成人工智能已被证明会照抄训练集里的「正确答案」,这是一个非常难受的限制。OpenAI 表示,由于其英语前向数据集,它更有可能在儿童或非英语语言书写的文本上出错。

在评估一段给定的文本是否由 AI 生成时,检测器不会正面回答是或否。根据其置信度,它会将文本标记为「非常不可能」由 AI 生成(小于 10% 的可能性)、「不太可能」由 AI 生成(在 10% 到 45% 之间的可能性)、「不清楚它是否是」AI 生成(45% 到 90% 的机会)、「可能」由 AI 生成(90% 到 98% 的机会)或「很有可能」由 AI 生成(超过 98% 的机会)。

看起来和图像识别的 AI 很像,除了准确程度。根据 OpenAI 的说法,分类器错误地将人类编写的文本标记为 AI 编写的文本的概率为 9%。

一番试用之后,效果的确不大行

OpenAI 宣称其 AI 文本分类器的成功率约为 26%,一些网友上手试用之后,发现识别效果果然不行。

知名 ML 和 AI 研究人员 Sebastian Raschka 试用之后,给出了「It does not work」的评价。他使用其 2015 年初版的 Python ML 书籍作为输入文本,结果显示如下。

Randy Olson 的 foreword 部分被识别为不清楚是否由 AI 生成(unclear)他自己的 preface 部分被识别为可能由 AI 生成(possibly AI)第一章的段落部分被识别为很可能由 AI 生成(likely AI)


Sebastian Raschka 对此表示,这是一个有趣的例子,但自己已经为将来可能因离谱的论文识别结果而受到惩罚的学生感到难过了。

因此他提议,如果要部署这样的模型,请共享一个混淆矩阵。不然如果教育者采用这一模型进行评分,则可能会对现实世界造成伤害。此外还应该增加一些有关误报和漏报的透明度。

此外,Sebastian Raschka 输入了莎士比亚《麦克白》第一页的内容,OpenAI AI 文本分类器给出的结果竟然是很可能由 AI 生成。简直离谱!


还有人上传了 AI 写作工具 Easy-Peasy.AI 创作的内容,结果 OpenAI AI 文本分类器判定为由 AI 生成的可能性非常小。


最后,有人用上了反复翻译大法,把文本让 GPT3 重写一遍,也能骗过识别器。


总结一下的话就是正向识别不准,反向识别出错,也无法识破一些改论文的技巧。看来,起码在 AI 文本内容识别这一领域,OpenAI 还需努力。

参考内容:

https://techcrunch.com/2023/01/31/openai-releases-tool-to-detect-ai-generated-text-including-from-chatgpt/

https://openai.com/blog/chatgpt/

  • 田园土豆泥的做法(田园土豆泥怎么做)
  • 2024-11-25田园土豆泥怎么做土豆洗净,带皮上锅蒸20分钟准备好配料,木耳,胡萝卜,瘦肉,玉米粒胡萝卜,木耳,瘦肉,都切成丁然后依次放入玉米粒,胡萝卜丁,木耳丁翻炒大概三分钟,要加点水加少许酱油,大概两平勺的盐加入土豆,压成泥,要。
  • 轻松得到独角兽蛋糕(烘焙大师赛-爱好组-高筋)
  • 2024-11-25烘焙大师赛-爱好组-高筋金龙鱼面包粉蛋白质含量高,粉质细腻,做面包拉丝效果不错哦By水尝无华【豆果美食官方认证达人】用料金龙鱼面包用高筋小麦粉280克牛奶150克黄油21克白糖20克盐2克酵母粉3克鸡蛋1个全蛋液适量芝麻适量。
  • 京东白条交易疑似被他人利用(想变现京东白条)
  • 2024-11-25想变现京东白条在支付方式日新月异的当下,蚂蚁花呗、京东白条等信用卡式支付工具为越来越多网络交易提供便利,不成想,这种便利也被一些不法分子盯上了因为想在京东白条上套取现金,郭先生遭遇了意图空手套白狼的不法分子,现金没。
  • 赞美大海和心情的诗句(赞颂大海的诗句介绍)
  • 2024-11-25赞颂大海的诗句介绍乘风破浪会有时,直挂云帆济沧海——唐李白《行路难》译文:相信总有一天,能乘长风破万里浪;高高挂起云帆,在沧海中勇往直前!春江潮水连海平,海上明月共潮生——?唐·张若虚《春江花月夜》译文:春天的江潮水势。
  • 斗罗大陆最菜的封号斗罗(斗罗大陆最强十大封号斗罗)
  • 2024-11-25斗罗大陆最强十大封号斗罗说到十大,我们很多人都了解,有朋友问《斗罗大陆》的漫画在哪里看?,还有人想问绝世唐门十大封号斗罗,这到底怎么回事呢?其实斗罗大陆1到4所有的强者排名呢,接下来小编在这里给大家带来斗罗大陆中的十大最强封。
  • 浙江分布式光伏发电项目中标公告(国家电投浙江分公司)
  • 2024-11-25国家电投浙江分公司国家电投浙江分公司(2020-2021年度光伏电站运维)招标公告1.招标条件招标人:国家电力投资集团有限公司浙江分公司项目单位:国家电投集团杭州新能源有限公司国家电投集团宁波新能源投资有限公司项目业主。
  • 新能源发电的展望(年发电达50万千瓦)
  • 2024-11-25年发电达50万千瓦来源:人民网-湖北频道近日,湖北移动襄阳云计算中心屋面分布式光伏发电系统成功并网发电该系统光伏装机容量为500kWp(千瓦),预计年度发电量约为50万千瓦时,相当于每年节约标煤超158吨,减排二氧化碳。
  • 演员肖战最新消息行程(全球最帅男演员榜单公布)
  • 2024-11-25全球最帅男演员榜单公布肖战的优秀是有目共睹的,很多人都被他的品质所吸引,成为其粉丝不过,还有一部分人则是被他的颜值所吸引,成为他的颜值粉这不,肖战又因为高颜值冲上了热搜近日,肖战又获奖了,而且还是因为帅而得奖首先先给大家介。
  • 广东有哪些地方你没有听过(有什么关于广东的冷知识)
  • 2024-11-25有什么关于广东的冷知识有什么关于广东的冷知识?1.据说00后广东人已经不知道这是什么东西了2.广东有些食物名很暗黑:鸡屎果(番石榴)、屎坑粥(虾蟹烧骨粥)、牛欢喜(母牛生殖部位)、油炸鬼(油条)3.广东早茶中的冷(huái。
  • 血压高的怎样调理好得快(血压偏高应该怎样调理)
  • 2024-11-25血压偏高应该怎样调理北京东方医院脑病科陈宝鑫:血压偏高是一种常见的症状,在生活当中,我们常常见到老年人血压高,这对人体的健康不利那么血压偏高怎么调理呢?一起来看看吧血压高排毒血压偏高怎么调理1.食物疗法高维生素、高纤维素。
  • 都市天际线怎么增加路的宽度(都市天际线道路怎么加高)
  • 2024-11-25都市天际线道路怎么加高哈喽大家好,这里是聚合游戏,每天为你分享游戏相关的内容,喜欢的快来关注哟~都市天际线道路在建造的时候可以加高,玩家在建造道路的时候,按下pageup键就可以加高道路,玩家想要持续加高道路的话,需要一直。
  • 腰椎生理曲度变直的瑜伽动作(了解腰椎压力的原因吗)
  • 2024-11-25了解腰椎压力的原因吗大家应该都听到过这个说法,宇航员在太空中会变高,根据美国国家航空航天局的研究,当脊柱没有暴露在地球引力的牵引下时,椎间盘就会膨胀,结果脊柱就会变长一点然而,这种微小的增长是短暂的一旦宇航员返回地球,他。