自我编码的AI算法即将到来(解决数学难题的AI模型)
自我编码的AI算法即将到来(解决数学难题的AI模型)
2024-11-22 12:34:45  作者:荷尔蒙的美  网址:https://m.xinb2b.cn/sport/vdh112503.html


当前,机器学习模型在解决微分方程等高难度数学问题方面一直存在很大限制,一些最好的模型也只是勉强回答高中水平的数学题目。

但现在,麻省理工学院(MIT)领导的研究小组开发的一种神经网络模型,可轻松应对相当于大学数学课程难度的问题。


(来源:MIT)

8 月 2 日,相关论文以《一个通过程序合成和人类层面的小样本学习的神经网络来解决、解释和生成大学数学问题》(A neural network solves, explains, and generates university math problems by program synthesis and few-shot learning at human level)为题发表在 PNAS 上。

MIT 电气工程与计算机科学系讲师伊多·德罗里(Iddo Drori)担任第一作者兼通讯作者,他也是哥伦比亚大学计算机科学系的兼职副教授。

“我们的研究是第一个解决本科数学问题的工作,这填补了使用代码和程序合成的缺失部分,并使得准确率从 8% 提高到 80% 以上。”德罗里在 MIT 官网上说。

该研究将有助于改善高等教育现状,新模型对学生和老师都能有所帮助。它能建立问题和课程的图表,基于数据的角度,助力理解课程及其先决条件之间的关系。

除了解答数学问题,新模型还能作为“机器导师”,向学生展现题目解答所涉及的步骤,并且快速生成新问题。同时,它还可以对课程内容进行简化,这可在大型开放式网络课程领域发挥重要作用。

据了解,研究人员在这项工作上花费了近两年。他们最开始发现,模型只接受文本数据训练的话,它回答高中水平数学问题时的错误率基本都在 92% 以上。

而那些利用图神经网络的模型经过一段时间训练后,能更好地解决机器学习课程问题。

然后,德罗里决定尝试将 MIT 和哥伦比亚大学的数学课程转变为相应的编程任务,这一过程用到了程序合成和小样本学习技术。


▲图 | (A)麻省理工学院、哥伦比亚大学数学课程和(B)MATH 基准数据集的自动求解率比较(来源:PNAS)

把一个问题变成一个编程任务,类似于将“找到两点之间的距离”问题重写为“编写一个找到两点之间差异的程序”,或者提供一些问题-程序对作为示例。

值得一提的是,相较之前只接受文本训练的神经网络(如 GPT-3),这一次,研究人员使用了由 OpenAI 制作的名为 Codex 的模型,该神经网络除了在文本上训练,也在 GitHub 存储库中的上千兆字节代码上做了“微调”。“微调”本质上是另一个预训练步骤,可以提高模型的性能。

由于 Codex 的训练数据有着数百万个文本单词和数百万行代码,因此它能够较好理解文本段和代码段之间的关系,并将两者进行转换,从而通过代码回答问题。


▲图 | 用 Codex 回答和生成课程题目的自动工作流示例(来源:PNAS)

值得注意的是,有时在将数学问题转化为编程任务时需要添加上下文(背景知识)或一些基本的定义解释,比如,对于问题中的“网络”一词,需要向模型标注该词代表“神经网络”,并不是指“社会网络”。

另外,可能还需要让它知道具体该使用哪个编程包。只有这样神经网络才可以正确处理问题,并输出超过 80% 的正确答案。

同时,在模型创建新的数学问题方面,德罗里在 MIT 官网表示:“在用新模型生成某些方面的问题时,它的表现让我们感到惊讶。它并不是单纯通过替换已有问题中的值来生成新问题。比如,在一个水平线和垂直线的量子检测问题中,模型生成了对角线量子探测的新问题。”

此外,研究团队还分别把模型和人类出的数学题(各 5 道)让学生去判断,看他们是否可以区分两者。结果显示,学生无法确定哪个问题具体是由 AI 产生的。

最后,在借助机器学习解决越来越困难问题领域,该研究又向前走了一步。不过,尽管模型的准确率已经非常高,但它永远不会百分百准确,而且总会有人提出一个更难的问题,它不会取代人类。这项工作在高等教育方面或可起到重要作用。

该团队还计划继续扩展该工作以突破一些限制,比如,进一步用可视化组件解决问题和提高问题的难度。此外,还会让模型接受几百门课程的训练,通过大量数据让其性能加速增强,从而能够对课程设计提出更好的见解。

参考资料:https://news.mit.edu/2022/machine-learning-university-math-0803https://www.pnas.org/doi/10.1073/pnas.2123433119


  • 外国人看见李小龙动作(李小龙功夫不是演的)
  • 2024-11-22李小龙功夫不是演的以无法为有法,以无限为有限,是中国功夫的最高境界!李小龙,一代功夫之王,他的双截棍和截拳道,开创了功夫新天地,手是两扇门,全凭脚赢人,李小龙的功夫口令,至今传颂不休,让一代又一代的武术爱好者,赞扬不止。
  • 有前途内涵的名字(这些名字大有学问)
  • 2024-11-22这些名字大有学问今天(5月18日)是国际博物馆日逛博物馆时,你也许会看到一些非常长的文物名字,明明每个字都认识,但读下来却一头雾水△很多文物都拥有长长的名字文物是怎么命名的?为啥有的文物名字那么长?给文物取名有啥讲究。
  • bj60多久会降价(连发动机都造不出来)
  • 2024-11-22连发动机都造不出来不知道大家有没有发现,一直以来都比较小众的硬派越野车,如今成了大厂们都愿意下场争抢的“香饽饽”如今年1月份的捷途T-X,到比亚迪全新硬派越野车谍照这意味着当下的高端硬派越野市场正是一片蓝海目前在这一细。
  • 最新的动漫游戏(从最新游戏到流行动漫)
  • 2024-11-22从最新游戏到流行动漫这次,我们要介绍的是拥有6,418位Twitter粉丝的Maa,她在dtwcn上发布了许多cosplay照片喜爱《新世纪福音战士》的她,以《SPY×FAMILY》、《STEINS;GATE》等《明日香。
  • 空调长时间开着会起火吗(用了20年的空调起火了)
  • 2024-11-22用了20年的空调起火了今年夏天格外热,“我这条命是空调给的”毫不夸张不过,在很多人依靠空调续命的同时,一些“用着用着就着火了”的空调也让人们一惊近期,媒体上有关空调安全事故报道明显增多,北京青年报记者梳理发现,这些出事的空。
  • pad和ipad有什么区别
  • 2024-11-22pad和ipad有什么区别1、生产公司不同:ipad:ipad是苹果公司生产的平板电脑,是美国公司,和苹果手机属于同级别产品pad平板电脑:pad平板电脑为其他公司生产的平板电脑,更多的是说除了苹果以外的所有平板电脑  2、系。
  • 聊斋志异胡四姐(从胡四娘到五女拜寿)
  • 2024-11-22从胡四娘到五女拜寿按作者简介:火烧彤云,湖南省长沙市人,建筑工程造价工程师,爱思考,爱写作,追求美好高尚的精神世界作者火烧彤云八十年代有一部著名的越剧电影,叫《五女拜寿》它并非传统戏剧,而是当代人根据《聊斋志异·胡四娘。
  • 小米对讲机2s和小米对讲机2区别(小米推出新款对讲机)
  • 2024-11-22小米推出新款对讲机早在2018年10月,小米就推出了旗下首款轻薄款对讲机:小米对讲机1S不知不觉,4年多时间过去了,曾经的1S也终于迎来了升级换代款产品——小米对讲机2S作为新品,2S的定位依旧是便携轻薄模拟对讲机,相。
  • 肺活量大的好处(肺活量大大脑灵活身体健康)
  • 2024-11-22肺活量大大脑灵活身体健康如果肺活量很大,提示人体对氧的吸入更多,能够供给细胞、组织充足的氧气,增强机体的新陈代谢,增强心脏和肺脏的功能,提高细胞组织的活力,而且能够提高自身的免疫能力,增强抵抗病原体的能力心肺功能良好,随着年。
  • 古人的眉毛为什么都那么奇特(古人说眉上一根长)
  • 2024-11-22古人说眉上一根长眉毛是人面目特殊的毛发,位于眼睛的上方,可以在一定程度上决定人的外部美观程度由于眉毛和头发一样能够新陈代谢,不仅具有生长周期还会自然脱落,很多爱美的人还喜欢去修剪好看的眉形在过去眉毛的长短还被当成长寿。
  • bilibili直播姬画面糊(用爱发电的bilibili又放大招)
  • 2024-11-22用爱发电的bilibili又放大招//大家好,我是三叔,给大家带来各种新鲜有趣的资讯听说B站也要搞电竞了?这里有个公告,B站正式成立电竞公司,由陈悠悠担任总裁,向B站总经理、Bilibili电竞公司董事长陈睿汇报那么,陈悠悠是谁?百度。