chatgpt付费版好用吗 ChatGPT的智能是人的心镜吗
chatgpt付费版好用吗 ChatGPT的智能是人的心镜吗
2024-06-29 06:27:57  作者:一种执迷  网址:https://m.xinb2b.cn/know/biu177540.html

chatgpt付费版好用吗 ChatGPT的智能是人的心镜吗(1)

图片来源@视觉中国

文 | 追问NextQuestion,作者 | Terrence J.Sejnowski,编译 | 铸雪

最近,ChatGPT频频登上热搜,尽管存在这样或那样的不足,不少用户都不得不承认这将是改变人类未来工作生活形态的革命性成果。

ChatGPT以及前段时间Google发布的LaMDA,都属于大型语言模型(Large language model,LLM)。早先处理不同的任务往往需要开发者训练不同的网络模型,而LLM是经过预训练自我监督的基础模型,可以通过微调适应各种自然语言任务。这标志着语言模型朝着人类语言的多功能性又迈出了重要的一步。

ChatGPT可以利用预先给出的少量例子进行学习,进而可以与人类就多种主题展开对话。然而,对于类似的LLM是否可以理解对话的内容或者表现出具有智力的迹象,仍然存在广泛的讨论和争议,不同用户在测试之后往往会给出不同的结论。一种可能的解释是,LLM所表现出的“智能”实际上可能只是一面反映使用者心智水平的镜子,这显然可以被视作一种逆向的图灵测试。倘若这一假设成立,那么通过研究LLM,我们反而可能会更多地了解用户自身的心智水平及所持有的信念,而非LLM本身。随着LLM能力愈发强大,它们可能会改变我们与机器,甚至机器与机器之间的交互模式。

镜像假设与逆向图灵测试

对于LLM而言,一种常见的用户反馈是,LLM似乎是人类思想的镜子,反映出与之对话的人类用户所表现的信念和期望。这一现象在人类社会中也十分常见,是一种亲社会行为。正如Agüera y Arcas (2022)所指出的,人类是社会生物,语言的演化也并非用作形式推理,而是作为一种生物适应,帮助人类彼此互动并发展道德和行为准则(Churchland,2019)。

一种假设是,LLM即用户的需求和心智水平的镜像,这有点像哈利·波特故事里的厄里斯魔镜(the Mirror of ERISED,读过小说的读者也许还记得,“ERISED”其实就是英语单词“DESIRE”的镜像)。在哈利·波特的世界里,魔镜向人们“展示自己内心最深切、最强烈的渴望“。然而,“这面镜子不能教给我们知识,也不能告诉我们实情。人们在它面前虚度时日,为他们看到的东西而痴迷,甚至被逼得发疯,因为他们不知道镜子里的一切是否真实,是否可能实现”(Rowling,1997)。

关于镜像假设,我们其实可以从不同研究者对于LLM的测试中一见端倪,例如Hofstadter在2022对GPT-3的测试:

chatgpt付费版好用吗 ChatGPT的智能是人的心镜吗(2)

又例如在2022年,Lemoine对Google旗下的模型LaMDA进行的对话测试。这里我们摘录其中的一小段:

chatgpt付费版好用吗 ChatGPT的智能是人的心镜吗(3)

上面的对话就能很好地展示出镜像假设所述的现象。Hofstadter用荒诞无逻辑的问题开启对话,LLM便会根据提问煞有介事地回答。而Lemoine选择了与Hofstadter相反的测试思路,不仅开启对话的问题本身符合逻辑,且之后的问题也相互关联。在此情况下LLM给出有用的信息,且随着Lemoine的进一步追问,LLM所能提供的信息也就越多。

这不由得让我们思考,人类是否也能映射出与之互动的其他人类的心智。在网球等运动和国际象棋等游戏中,与更强大的对手交手可以提高参赛者的竞技水平,这就是一种镜像效应。甚至有研究显示,观看职业网球比赛也能提高比赛水平,这也许是通过激活大脑皮层相应区域的镜像神经元实现的,在实际完成相同动作时,这些区域也被激活(Kilner & Lemmon,2013)。在习得语言时,镜像神经元也可能被激活(Arbib,2010)。上述研究的有趣之处在于,它可以解释我们如何学习新单词的发音,以及为什么家教的教学效果往往比计算机教学甚至课堂教学更为有效,因为学生可以通过一对一的互动来模仿家教,而家教也可以读懂学生的想法。那么,可以读懂“学生”情况的LLM“家教”会成为一名卓有成效的老师吗?

chatgpt付费版好用吗 ChatGPT的智能是人的心镜吗(4)

图片来源:Midjourney bot

对AI进行图灵测试,可以了解它们能否如人类一样做出反应。在模仿使用者的过程中,LLM可能也在进行一种更为复杂的逆向图灵测试,即通过将人们的指令和对话所表现出的智力水平映射回使用者,来测试其智力水平。你越聪明,你的指令越聪明,LLM就显得越聪明。如果你怀有某种强烈的观点,LLM也将加深这种观点。这是启动对话所带来的效果,使用者的语言能力也不必然使LLM具有像人类一样的心智或情感。但我们仍然可以得出,LLM具有模仿许多人类个性的非凡能力,尤其是在经过微调之后(Karra等,2022)。对镜像假设和逆向图灵测试的形式化测试可以通过让人类评估者评估人类用户的智力与LLM的智力来完成。根据镜像假设,两者的智力应该是高度相关的。

人工智能将通用智能作为圣杯,这似乎已经在LLM中出现,但并非以其倡导者们所设想的方式。LLM在形形色色的语言任务中用途广泛,甚至已经可以编写计算机程序。值得注意的是,模型似乎具有高度发达的社会意识。镜像假设为我们指明了一个新的思考方向:通用智能是否起源于人类社交互动的模式?而语言是否是演化过程中为增强社交属性而出现的产物?

道法自然

哺乳动物的感知运动系统演化了2亿多年,脊椎动物的大脑更是有5亿多年的历史。语言则是在最近几十万年内演化出现的。这段时间不足以演化出全新的大脑结构,但灵长类动物大脑皮层的现有区域本就可以扩展并重新用于语音产生和语音识别,无需进行实质性的结构改变。此外,由于社会互动的复杂性,增强的记忆能力和更快的学习速度进一步推动了语言的诞生。随着灵长类动物演化过程中大脑皮层的扩展,更多大脑皮层区域形成,层次结构加深(Allman,1999)。在大脑发育过程中,多一次有丝分裂,皮层神经元的数量就会增加一倍,从而达到新能力的阈值并增强认知功能。

演化造成了归纳偏差——预学习的架构和学习算法。然而,演化所采用的路径并不遵循人类设计的逻辑(Brenner,1996)。在生命的最初几年,婴儿的大脑在语言功能出现的同时,会形成大量的突触(Lister等,2013)。婴儿通过多种感官与世界互动并了解它,世界也用感知运动的经验、因果关系,以及语言表达塑造了婴儿的大脑(Gopnik等,1999)。然而,仅仅是基于抽象概念的传统人工智能缺乏这种基础。LLM表明,可以从原始文本中发现的各种不完美线索(包括句法标记、词序和语义),来学习语法语言是如何生成的。

在感知运动基础充分建立的同时,大脑也在快速发育。这可以解释为什么婴儿可以从日常语言表达中提取句法。语言学家得出结论,这种“缺乏刺激”证明句法是天生的(Chomsky,1971),但这忽略了大脑在发育过程中的构建方式(Quartz和Sejnowski,1995)。大脑结构和学习算法的演化是天生的,它们提取和概括世界的物理结构与社会结构。大自然将归纳偏差降至分子水平以最大限度地提高能量利用的效率。如果想减少LLM快速增长的能源预算,我们也必须走上这条道路(Sejnowski和Delbruck,2012)。

从大脑机制来看,语言和思维的演化是趋于同步的。皮层-基底核之间用于生成动作序列的循环被重新用于生成单词序列(见下图)。人类前额叶皮层的大幅扩张,使得思维序列可以通过基底核的类似回路产生(Graybiel,1997)。同样重要的是,对声道的调整允许声音在宽频谱上进行快速调制(Nishimura等,2022)。口腔和喉部快速发音是大脑能够产生的最快的运动程序(Simonyan和Horwitz,2011)。这些结构是脊椎动物的古老部分,它们在演化中变得完善和精致,这也使语言成为可能。人们用“语言器官”这一比喻意义上的术语,来解释语言的奥秘(Anderson & Lightfoot,2002),它通过改变原有的执行器和神经系统演化而来。

chatgpt付费版好用吗 ChatGPT的智能是人的心镜吗(5)

LLM也被训练来预测句子中缺失的单词(编者注:类似于英语考试中的完形填空)。为什么这是一个行之有效的策略?在强化学习模型中,时间差异学习是基于预测,来预测未来的奖励。同样地,大脑中的感知运动系统也会做出预测。小脑是与大脑皮层相互作用的重要脑结构,可预测运动指令的预期感知和认知结果(Sokolov等,2017)。如此说来,使用自我监督学习、通过不断做出许多小预测来引导越来越复杂的内部模型,其最终的结果就是形成所谓的“智能”吗?这可能就是婴儿的大脑如何在积极与世界互动的同时,通过做出预测和观察结果来快速了解世界因果结构的方法(Ullman等,2017)。已经有学者就此开展研究,并在使用深度学习从视频中学习直观物理方面取得了进展(Piloto等,2022)。

上世纪对大脑的研究启发了新的机器学习算法:视觉皮层区域的层次结构启发了卷积神经网络的诞生(LeCun等,1998,2015),操作性条件反射启发了用于强化学习的时间差分学习算法(Sutton,1988)。在人工神经网络进步的同时,美国“脑科学计划”(The Brain Research through Advancing Innovative Neurotechnologies,BRAIN Initiative)通过创新的神经技术加速了本世纪神经科学的发现(Ngai,2022)。由这些发现所产生的大脑功能的新概念框架将启发更先进的神经网络模型。机器学习正被用于分析来自数十个大脑区域的数十万个神经元的同时记录,并通过串行电子显微镜自动重建神经回路。这些进步改变了我们对跨皮层分布式处理的理解。

人工智能和神经科学之间的融合正在加速。人工智能和神经科学之间的对话是一个良性循环,同时丰富了这两个领域(Hassabis等,2017;Sejnowski,2020;Richards等,2022)。仿照研究大脑活动的方式,通过分析超高维空间中隐藏单元的活动模式,将会得出更好的人工智能理论;分析LLM中潜在状态的几何动力学、揭示其潜在的数学结构,可能会使我们更好地理解智能。由此,人工智能和神经科学正通过开发新的概念框架更广泛地彼此影响。

既然我们能够盘问整个大脑的神经元,我们或许能够解决其最大的谜团之一:分布在大脑如此多神经元上的信息是如何被整合到统一的感知之中,并汇集在一起做出决定的(Dehaene和Naccache,2001)?大脑的结构是分层的,每一层负责在感知和运动系统的不同时间尺度上做出决策(Wang,2022;Nakahira等,2021;Li,2022b)。当我们构建超大规模网络(very large-scale network,VLSN)架构时,许多元网络也需要集成到一个统一的系统中。这可能会揭示人类负责潜意识决策和意识控制的机制。

系统神经科学通常是在离散任务中对神经元进行研究,例如对视觉刺激的选择反应,其中强制选择和刺激的数量有限。对刺激和反应的严格控制确保了研究者可以对研究结果进行解释。但神经元可以以多种不同方式参与多项任务,因此从单一任务得出的解释可能会对研究者们产生误导。我们现在有能力记录全脑数十万个神经元,并且可以通过机器学习解码其行为,但神经科学家仍在使用旧的基于单一任务的范式。一个解决思路是针对许多不同的任务进行训练,但训练一只猴子完成每项任务需要数周到数月的时间;另一个解决思路则是在更长的时间间隔内扩展任务的复杂性(Gao等,2017)。

通过离散任务来研究行为还存在一个更基本的问题。现实世界中动物的自然行为大多是自发产生且有互动的,社交行为尤其如此。研究这种自发产生的连续行为比研究严格约束的反射行为要困难得多。如果LLM接受了自然行为期间大量大脑记录的训练,以及伴随的眼动追踪、视频、声音和其他模式,会产生怎样的效果?LLM是自监督的,可以通过预测跨数据流的缺失数据段来进行训练。从传统的实验角度来看,这在科学上并无用处,但从LLM提供新的计算角度来考察,它确实是有意义的。通过将在自然条件下工作的大脑下载到LLM中,大型神经基础模型(large neurofoundation model,LNM)可以针对任务进行快速微调,并作为大脑的代理接受询问,就像预训练的LLM可以针对许多任务进行微调一样。这将彻底改变大脑的研究方式并增进我们的理解,同时减少研究所需的动物的数量。人脑活动也可以类似地下载到先进的LNM中。

在不久的将来,我们可以对人工智能的发展有什么期待呢?一方面,调试预训练的LLM需要人类和LLM之间的合作。微调LLM的工作周期比开发某个单一应用的机器学习模型要快得多,后者需要自定义数据库和超参数搜索。基于LLM的产品将如雨后春笋般出现。LLM可以成为终极的信息工具。关键词搜索将被可以直接给出问题答案的LLM所取代。也许不出十年,LLM个人助理将如现在的Siri那样普及,帮助我们更好地安排生活。LLM助教可以在课堂上协助教学,LLM法律助手能够整合所有曾经在法庭上裁决过的案件,这对法律行业来说也是一个福音。但就创新对于人类的影响而言,人们的展望总是偏保守的。

许多年以后,面对无处不在的通用人工智能,我们将会想起今天这个历史性的转折点。如果一定要做一个比喻,或许科幻电影《她》中的私人助理可以让我们瞥见那个人工智能无处不在的未来。

原文链接:

direct.mit.edu/neco/article/35/3/309/114731/Large-Language-Models-and-the-Reverse-Turing-Test

  • 轴承型号的基本知识
  • 2024-06-29轴承型号的基本知识轴承型号是一组表示轴承基本结构、尺寸系列和内部结构特点“数字+字母”如,轴承型号6208—2RS所表示的内容:1.轴承结构:深沟球轴承2.轴承精度:普通级3.尺寸系列:内径40mm,外径80mm,宽度。
  • 下嫁的职场人有哪些(下嫁的职场人有人感叹)
  • 2024-06-29下嫁的职场人有人感叹退一步清零那些“下嫁”的职场人你要学会将目光出离于情绪之外我就是个下嫁的小媳妇“唉,我就像个下嫁的小媳妇……”雨文一坐下来就不断地唉声叹气雨文是我一个非常能干的朋友从高节奏、高要求的外企大公司出来后,。
  • 关于白玉兰的作文(怎么写关于白玉兰的作文)
  • 2024-06-29怎么写关于白玉兰的作文白玉兰正文早晨,我骑车去家附近的公园里玩一进去,就被雪白的玉兰花吸引住了,我急忙向玉兰树骑去玉兰花已经开了很多了,隐隐约约能闻到一股淡淡的花香傲立枝头的白玉兰洁白无瑕,像盖了一层雪有的含苞欲放,像几支。
  • word如何输入带圈数字(如何输入带圈数字)
  • 2024-06-29如何输入带圈数字我们一般使用word进行文档编辑的时候,特别是我们在做会议纪要或者每周五下午写工作总结的时候,内容上肯定涉及到一些条条款款的,这个时候我们的就涉及给编号了,有的同学说这个简单嘛,word【开始】选项里。
  • 月子里拉肚子腹泻怎么办(月子里拉肚子怎么办)
  • 2024-06-29月子里拉肚子怎么办众所周知,女性在坐月子期间,身体健康也是需要十分注意的事情而女性坐月子的时候出现拉肚子情况是有很多因素造成的,包括脾胃受到影响,饮食不当,身体着凉等等但是,坐月子期间拉肚子对女性和孩子都有一定的影响,。
  • 蜗居海萍真实原型(蜗居原著为1块钱)
  • 2024-06-29蜗居原著为1块钱1、对丈夫:不给丈夫喘息的机会,差点让苏淳坐牢《蜗居》原著中海藻去海萍家的时候,在楼梯口听见房间里传来海萍的咆哮:“你去!你去把那1块钱给我拿回来!你要是拿不回来,今天你就不要回来!”因为“1块钱”,。
  • 硬笔书法初级教程钢笔字 怎样写好钢笔字偏旁部首
  • 2024-06-29硬笔书法初级教程钢笔字 怎样写好钢笔字偏旁部首1.钢笔钢笔的种类和型号很多,其区别主要在于笔尖的用料上根据钢笔笔尖制作材料的不同,可分为金笔、铱金笔和普通钢笔三种挑选钢笔时,要看笔尖两片是否粗细均匀对称,顶端是否圆滑,书写是否流畅试笔时,可书写“。
  • 家庭自制补水面膜大全(补水面膜功效)
  • 2024-06-29补水面膜功效市面上的补水面膜有很多,而大家为了拥有一个让自己满意的皮肤也经常会选择购买相关产品,那么你们知道补水面膜到底有什么功效呢,它是怎样让我们的皮肤变好的,今天我们就一起来讨论一下它有何功效,这里向大家推荐。
  • 魔兽tbc最近怎么了(3天连着碰到3次黑金事件)
  • 2024-06-293天连着碰到3次黑金事件前天也就是本月的2号,祥子哥上午打了一个格鲁尔和玛瑟里顿金团,当时团长售完装备以后直接下线把9100金给黑了这是TBC怀旧服以来祥子哥第一次被黑金,之前暴雪一直在净化游戏环境,大力整治黑金等违规行为,。
  • 目前最值得入手的5个手机(目前这3部手机最值得买)
  • 2024-06-29目前这3部手机最值得买您在阅读前请点击上面的“关注”二字,后续会第一时间为您提供更多有价值的相关内容,感谢您的支持现在市场上的手机型号特别多,很多用户在选择手机的时候,经常出现左右两难的情况,不知道该选择哪一款更好,既想买。
  • 君子最大的特点是什么(什么是君子君子要干什么)
  • 2024-06-29什么是君子君子要干什么君子,闻“圣人之道”,见“圣人之道”,“对照”圣人之标准、在现实社会中不断“校对”自己,与天其时而天与其时,得乘天地之正气而游六合,行成“圣人”之道,这应该是真正的快乐吧君子,为共同的志向而联手,为共。