chatgpt付费版好用吗 ChatGPT的智能是人的心镜吗
chatgpt付费版好用吗 ChatGPT的智能是人的心镜吗
2024-11-05 10:41:15  作者:一种执迷  网址:https://m.xinb2b.cn/life/biu177540.html


图片来源@视觉中国

文 | 追问NextQuestion,作者 | Terrence J.Sejnowski,编译 | 铸雪

最近,ChatGPT频频登上热搜,尽管存在这样或那样的不足,不少用户都不得不承认这将是改变人类未来工作生活形态的革命性成果。

ChatGPT以及前段时间Google发布的LaMDA,都属于大型语言模型(Large language model,LLM)。早先处理不同的任务往往需要开发者训练不同的网络模型,而LLM是经过预训练自我监督的基础模型,可以通过微调适应各种自然语言任务。这标志着语言模型朝着人类语言的多功能性又迈出了重要的一步。

ChatGPT可以利用预先给出的少量例子进行学习,进而可以与人类就多种主题展开对话。然而,对于类似的LLM是否可以理解对话的内容或者表现出具有智力的迹象,仍然存在广泛的讨论和争议,不同用户在测试之后往往会给出不同的结论。一种可能的解释是,LLM所表现出的“智能”实际上可能只是一面反映使用者心智水平的镜子,这显然可以被视作一种逆向的图灵测试。倘若这一假设成立,那么通过研究LLM,我们反而可能会更多地了解用户自身的心智水平及所持有的信念,而非LLM本身。随着LLM能力愈发强大,它们可能会改变我们与机器,甚至机器与机器之间的交互模式。

镜像假设与逆向图灵测试

对于LLM而言,一种常见的用户反馈是,LLM似乎是人类思想的镜子,反映出与之对话的人类用户所表现的信念和期望。这一现象在人类社会中也十分常见,是一种亲社会行为。正如Agüera y Arcas (2022)所指出的,人类是社会生物,语言的演化也并非用作形式推理,而是作为一种生物适应,帮助人类彼此互动并发展道德和行为准则(Churchland,2019)。

一种假设是,LLM即用户的需求和心智水平的镜像,这有点像哈利·波特故事里的厄里斯魔镜(the Mirror of ERISED,读过小说的读者也许还记得,“ERISED”其实就是英语单词“DESIRE”的镜像)。在哈利·波特的世界里,魔镜向人们“展示自己内心最深切、最强烈的渴望“。然而,“这面镜子不能教给我们知识,也不能告诉我们实情。人们在它面前虚度时日,为他们看到的东西而痴迷,甚至被逼得发疯,因为他们不知道镜子里的一切是否真实,是否可能实现”(Rowling,1997)。

关于镜像假设,我们其实可以从不同研究者对于LLM的测试中一见端倪,例如Hofstadter在2022对GPT-3的测试:


又例如在2022年,Lemoine对Google旗下的模型LaMDA进行的对话测试。这里我们摘录其中的一小段:


上面的对话就能很好地展示出镜像假设所述的现象。Hofstadter用荒诞无逻辑的问题开启对话,LLM便会根据提问煞有介事地回答。而Lemoine选择了与Hofstadter相反的测试思路,不仅开启对话的问题本身符合逻辑,且之后的问题也相互关联。在此情况下LLM给出有用的信息,且随着Lemoine的进一步追问,LLM所能提供的信息也就越多。

这不由得让我们思考,人类是否也能映射出与之互动的其他人类的心智。在网球等运动和国际象棋等游戏中,与更强大的对手交手可以提高参赛者的竞技水平,这就是一种镜像效应。甚至有研究显示,观看职业网球比赛也能提高比赛水平,这也许是通过激活大脑皮层相应区域的镜像神经元实现的,在实际完成相同动作时,这些区域也被激活(Kilner & Lemmon,2013)。在习得语言时,镜像神经元也可能被激活(Arbib,2010)。上述研究的有趣之处在于,它可以解释我们如何学习新单词的发音,以及为什么家教的教学效果往往比计算机教学甚至课堂教学更为有效,因为学生可以通过一对一的互动来模仿家教,而家教也可以读懂学生的想法。那么,可以读懂“学生”情况的LLM“家教”会成为一名卓有成效的老师吗?


图片来源:Midjourney bot

对AI进行图灵测试,可以了解它们能否如人类一样做出反应。在模仿使用者的过程中,LLM可能也在进行一种更为复杂的逆向图灵测试,即通过将人们的指令和对话所表现出的智力水平映射回使用者,来测试其智力水平。你越聪明,你的指令越聪明,LLM就显得越聪明。如果你怀有某种强烈的观点,LLM也将加深这种观点。这是启动对话所带来的效果,使用者的语言能力也不必然使LLM具有像人类一样的心智或情感。但我们仍然可以得出,LLM具有模仿许多人类个性的非凡能力,尤其是在经过微调之后(Karra等,2022)。对镜像假设和逆向图灵测试的形式化测试可以通过让人类评估者评估人类用户的智力与LLM的智力来完成。根据镜像假设,两者的智力应该是高度相关的。

人工智能将通用智能作为圣杯,这似乎已经在LLM中出现,但并非以其倡导者们所设想的方式。LLM在形形色色的语言任务中用途广泛,甚至已经可以编写计算机程序。值得注意的是,模型似乎具有高度发达的社会意识。镜像假设为我们指明了一个新的思考方向:通用智能是否起源于人类社交互动的模式?而语言是否是演化过程中为增强社交属性而出现的产物?

道法自然

哺乳动物的感知运动系统演化了2亿多年,脊椎动物的大脑更是有5亿多年的历史。语言则是在最近几十万年内演化出现的。这段时间不足以演化出全新的大脑结构,但灵长类动物大脑皮层的现有区域本就可以扩展并重新用于语音产生和语音识别,无需进行实质性的结构改变。此外,由于社会互动的复杂性,增强的记忆能力和更快的学习速度进一步推动了语言的诞生。随着灵长类动物演化过程中大脑皮层的扩展,更多大脑皮层区域形成,层次结构加深(Allman,1999)。在大脑发育过程中,多一次有丝分裂,皮层神经元的数量就会增加一倍,从而达到新能力的阈值并增强认知功能。

演化造成了归纳偏差——预学习的架构和学习算法。然而,演化所采用的路径并不遵循人类设计的逻辑(Brenner,1996)。在生命的最初几年,婴儿的大脑在语言功能出现的同时,会形成大量的突触(Lister等,2013)。婴儿通过多种感官与世界互动并了解它,世界也用感知运动的经验、因果关系,以及语言表达塑造了婴儿的大脑(Gopnik等,1999)。然而,仅仅是基于抽象概念的传统人工智能缺乏这种基础。LLM表明,可以从原始文本中发现的各种不完美线索(包括句法标记、词序和语义),来学习语法语言是如何生成的。

在感知运动基础充分建立的同时,大脑也在快速发育。这可以解释为什么婴儿可以从日常语言表达中提取句法。语言学家得出结论,这种“缺乏刺激”证明句法是天生的(Chomsky,1971),但这忽略了大脑在发育过程中的构建方式(Quartz和Sejnowski,1995)。大脑结构和学习算法的演化是天生的,它们提取和概括世界的物理结构与社会结构。大自然将归纳偏差降至分子水平以最大限度地提高能量利用的效率。如果想减少LLM快速增长的能源预算,我们也必须走上这条道路(Sejnowski和Delbruck,2012)。

从大脑机制来看,语言和思维的演化是趋于同步的。皮层-基底核之间用于生成动作序列的循环被重新用于生成单词序列(见下图)。人类前额叶皮层的大幅扩张,使得思维序列可以通过基底核的类似回路产生(Graybiel,1997)。同样重要的是,对声道的调整允许声音在宽频谱上进行快速调制(Nishimura等,2022)。口腔和喉部快速发音是大脑能够产生的最快的运动程序(Simonyan和Horwitz,2011)。这些结构是脊椎动物的古老部分,它们在演化中变得完善和精致,这也使语言成为可能。人们用“语言器官”这一比喻意义上的术语,来解释语言的奥秘(Anderson & Lightfoot,2002),它通过改变原有的执行器和神经系统演化而来。


LLM也被训练来预测句子中缺失的单词(编者注:类似于英语考试中的完形填空)。为什么这是一个行之有效的策略?在强化学习模型中,时间差异学习是基于预测,来预测未来的奖励。同样地,大脑中的感知运动系统也会做出预测。小脑是与大脑皮层相互作用的重要脑结构,可预测运动指令的预期感知和认知结果(Sokolov等,2017)。如此说来,使用自我监督学习、通过不断做出许多小预测来引导越来越复杂的内部模型,其最终的结果就是形成所谓的“智能”吗?这可能就是婴儿的大脑如何在积极与世界互动的同时,通过做出预测和观察结果来快速了解世界因果结构的方法(Ullman等,2017)。已经有学者就此开展研究,并在使用深度学习从视频中学习直观物理方面取得了进展(Piloto等,2022)。

上世纪对大脑的研究启发了新的机器学习算法:视觉皮层区域的层次结构启发了卷积神经网络的诞生(LeCun等,1998,2015),操作性条件反射启发了用于强化学习的时间差分学习算法(Sutton,1988)。在人工神经网络进步的同时,美国“脑科学计划”(The Brain Research through Advancing Innovative Neurotechnologies,BRAIN Initiative)通过创新的神经技术加速了本世纪神经科学的发现(Ngai,2022)。由这些发现所产生的大脑功能的新概念框架将启发更先进的神经网络模型。机器学习正被用于分析来自数十个大脑区域的数十万个神经元的同时记录,并通过串行电子显微镜自动重建神经回路。这些进步改变了我们对跨皮层分布式处理的理解。

人工智能和神经科学之间的融合正在加速。人工智能和神经科学之间的对话是一个良性循环,同时丰富了这两个领域(Hassabis等,2017;Sejnowski,2020;Richards等,2022)。仿照研究大脑活动的方式,通过分析超高维空间中隐藏单元的活动模式,将会得出更好的人工智能理论;分析LLM中潜在状态的几何动力学、揭示其潜在的数学结构,可能会使我们更好地理解智能。由此,人工智能和神经科学正通过开发新的概念框架更广泛地彼此影响。

既然我们能够盘问整个大脑的神经元,我们或许能够解决其最大的谜团之一:分布在大脑如此多神经元上的信息是如何被整合到统一的感知之中,并汇集在一起做出决定的(Dehaene和Naccache,2001)?大脑的结构是分层的,每一层负责在感知和运动系统的不同时间尺度上做出决策(Wang,2022;Nakahira等,2021;Li,2022b)。当我们构建超大规模网络(very large-scale network,VLSN)架构时,许多元网络也需要集成到一个统一的系统中。这可能会揭示人类负责潜意识决策和意识控制的机制。

系统神经科学通常是在离散任务中对神经元进行研究,例如对视觉刺激的选择反应,其中强制选择和刺激的数量有限。对刺激和反应的严格控制确保了研究者可以对研究结果进行解释。但神经元可以以多种不同方式参与多项任务,因此从单一任务得出的解释可能会对研究者们产生误导。我们现在有能力记录全脑数十万个神经元,并且可以通过机器学习解码其行为,但神经科学家仍在使用旧的基于单一任务的范式。一个解决思路是针对许多不同的任务进行训练,但训练一只猴子完成每项任务需要数周到数月的时间;另一个解决思路则是在更长的时间间隔内扩展任务的复杂性(Gao等,2017)。

通过离散任务来研究行为还存在一个更基本的问题。现实世界中动物的自然行为大多是自发产生且有互动的,社交行为尤其如此。研究这种自发产生的连续行为比研究严格约束的反射行为要困难得多。如果LLM接受了自然行为期间大量大脑记录的训练,以及伴随的眼动追踪、视频、声音和其他模式,会产生怎样的效果?LLM是自监督的,可以通过预测跨数据流的缺失数据段来进行训练。从传统的实验角度来看,这在科学上并无用处,但从LLM提供新的计算角度来考察,它确实是有意义的。通过将在自然条件下工作的大脑下载到LLM中,大型神经基础模型(large neurofoundation model,LNM)可以针对任务进行快速微调,并作为大脑的代理接受询问,就像预训练的LLM可以针对许多任务进行微调一样。这将彻底改变大脑的研究方式并增进我们的理解,同时减少研究所需的动物的数量。人脑活动也可以类似地下载到先进的LNM中。

在不久的将来,我们可以对人工智能的发展有什么期待呢?一方面,调试预训练的LLM需要人类和LLM之间的合作。微调LLM的工作周期比开发某个单一应用的机器学习模型要快得多,后者需要自定义数据库和超参数搜索。基于LLM的产品将如雨后春笋般出现。LLM可以成为终极的信息工具。关键词搜索将被可以直接给出问题答案的LLM所取代。也许不出十年,LLM个人助理将如现在的Siri那样普及,帮助我们更好地安排生活。LLM助教可以在课堂上协助教学,LLM法律助手能够整合所有曾经在法庭上裁决过的案件,这对法律行业来说也是一个福音。但就创新对于人类的影响而言,人们的展望总是偏保守的。

许多年以后,面对无处不在的通用人工智能,我们将会想起今天这个历史性的转折点。如果一定要做一个比喻,或许科幻电影《她》中的私人助理可以让我们瞥见那个人工智能无处不在的未来。

原文链接:

direct.mit.edu/neco/article/35/3/309/114731/Large-Language-Models-and-the-Reverse-Turing-Test

  • 小小勇者里的佣兵哪些值得培养(小小勇者佣兵选择推荐)
  • 2024-11-06小小勇者佣兵选择推荐在小小勇者当中,有很多不同类型的佣兵可以选择,每个佣兵都有自己的独特之处很多玩家不知道选择什么佣兵比较好,下面小编就给大家带来《小小勇者》佣兵选择推荐,感兴趣的玩家一起来看看吧《小小勇者》佣兵选择推荐。
  • 什么是五味子五味子的用途(五味子是什么植物)
  • 2024-11-06五味子是什么植物五味子是什么植物呢?五味子的功效与作用有哪些呢?下面小编整理了一些相关资料,下面一起来看看吧一、五味子是什么植物五味子为木兰科植物五味子或华中五味子的干燥成熟果实前者习称“北五味子”,后者习称“南五味。
  • 十大最常见的害虫(农村有这6种害虫)
  • 2024-11-06农村有这6种害虫农村有这样六种害虫,因为长得漂亮,或者是因为能给人们带点乐趣,都以为它们是益虫,有那么几种人们还专门饲养它们,用于玩乐,有一种价格贵的能买几十万,实在是不敢相信如果不是翻看资料我还真的相信它们是无害的。
  • 不动产权证办理要什么材料(办理不动产权证需要哪些材料)
  • 2024-11-06办理不动产权证需要哪些材料  近日网友“晓晶”通过“百湖民声”大庆市网络问政平台问政:  我家房子在英伦三岛,现在要办房产证,但是手里就有购房合同和发票,其它的东西都没有,怎么办?  市自然资源局回复如下:  购买开发商房屋所。
  • 怎么要女生微信?(教你如何要女生微信的技巧)
  • 2024-11-06教你如何要女生微信的技巧“哇!路边的妹子好漂亮,好想和她做朋友,要是能有微信号就好了~”这一句话说出了多少男人心声,往往在遇到自己的心仪女生时,总会束手无策,眼睁睁的看着她在你身边走过,却毫无办法想上去说句话,却又不知该如何。
  • 进化史上最极端的动物(人是不是世界上最残暴的动物)
  • 2024-11-06人是不是世界上最残暴的动物欢迎点击「科学网」↑关注我们!倭黑猩猩与人DNA99%相似,它性格温和但偶尔也表现出攻击性前些日子,甘肃康乐县黄土高原之上,母亲杨改兰因“低保被取消”而把四子女用斧头劈死此案震惊中国,触痛了所有“盛世。
  • 东莞城市轨道交通第三期规划(东莞轨道交通大盘点)
  • 2024-11-06东莞轨道交通大盘点事情是这样的冒着滴老年卡的勇气,房姐曾盘点过东莞未来30年轨道交通规划回顾:未来30年东莞地铁怎么修,房姐都撸完了!|线路:《东莞市轨道交通网络规划(2035)》文件(点击可看大图~神图,建议收藏哦~。
  • 武夷山玉女峰下竹筏漂流(玉女峰下山盟海誓)
  • 2024-11-06玉女峰下山盟海誓来源:中国新闻网中新网南平5月20日电(张丽君周思念)借“5·20”东风,“山盟海誓·恋在武夷”主题文旅产品推广系列活动20日在福建武夷山景区玉女峰下举行5月20日,新人乘坐“百年修得同船渡”主题花筏。
  • 腊肉是放冰箱里好还是挂起来好(腊肉怎么保存)
  • 2024-11-06腊肉怎么保存腊肉放冰箱保存会更好一点腊肉是一种很常见的土特产,尤其是在中国北方的农村地区农村人常用的储藏方法是把腊肉挂起来风干,然后冷冻在冰箱里首先,新鲜熏出的腊肉应该存放一段时间在沉淀过程中,不得直接放入冰箱只。
  • 比亚迪宋max最不安全的车型(比亚迪宋max质量怎么样)
  • 2024-11-06比亚迪宋max质量怎么样比亚迪在新能源领域的成绩大家是有目共睹,比亚迪的新能源公交车都出口卖到美国1-2百万美元的定位还是为国争光了,国内卖的比美国便宜好多,核心技术当然是比亚迪的电池稳定可靠又很安全那么接下来为大家解析比亚。
  • 真三国无双五战功最易达成地图(真三国无双爆发智取篇)
  • 2024-11-06真三国无双爆发智取篇由光荣特库摩出品的动作策略卡牌手游《真·三国无双·爆发》即将在国服开启全新征程《真·三国无双·爆发》由天戏互动与天游网络携手发行,官方目前已经同步开启精彩活动,诸多超值奖励停不下来!今日就给大家带来《。