自我编码的AI算法即将到来(解决数学难题的AI模型)
自我编码的AI算法即将到来(解决数学难题的AI模型)
2024-07-02 03:36:04  作者:荷尔蒙的美  网址:https://m.xinb2b.cn/know/vdh112503.html

自我编码的AI算法即将到来(解决数学难题的AI模型)(1)

当前,机器学习模型在解决微分方程等高难度数学问题方面一直存在很大限制,一些最好的模型也只是勉强回答高中水平的数学题目。

但现在,麻省理工学院(MIT)领导的研究小组开发的一种神经网络模型,可轻松应对相当于大学数学课程难度的问题。

自我编码的AI算法即将到来(解决数学难题的AI模型)(2)

(来源:MIT)

8 月 2 日,相关论文以《一个通过程序合成和人类层面的小样本学习的神经网络来解决、解释和生成大学数学问题》(A neural network solves, explains, and generates university math problems by program synthesis and few-shot learning at human level)为题发表在 PNAS 上。

MIT 电气工程与计算机科学系讲师伊多·德罗里(Iddo Drori)担任第一作者兼通讯作者,他也是哥伦比亚大学计算机科学系的兼职副教授。

“我们的研究是第一个解决本科数学问题的工作,这填补了使用代码和程序合成的缺失部分,并使得准确率从 8% 提高到 80% 以上。”德罗里在 MIT 官网上说。

该研究将有助于改善高等教育现状,新模型对学生和老师都能有所帮助。它能建立问题和课程的图表,基于数据的角度,助力理解课程及其先决条件之间的关系。

除了解答数学问题,新模型还能作为“机器导师”,向学生展现题目解答所涉及的步骤,并且快速生成新问题。同时,它还可以对课程内容进行简化,这可在大型开放式网络课程领域发挥重要作用。

据了解,研究人员在这项工作上花费了近两年。他们最开始发现,模型只接受文本数据训练的话,它回答高中水平数学问题时的错误率基本都在 92% 以上。

而那些利用图神经网络的模型经过一段时间训练后,能更好地解决机器学习课程问题。

然后,德罗里决定尝试将 MIT 和哥伦比亚大学的数学课程转变为相应的编程任务,这一过程用到了程序合成和小样本学习技术。

自我编码的AI算法即将到来(解决数学难题的AI模型)(3)

▲图 | (A)麻省理工学院、哥伦比亚大学数学课程和(B)MATH 基准数据集的自动求解率比较(来源:PNAS)

把一个问题变成一个编程任务,类似于将“找到两点之间的距离”问题重写为“编写一个找到两点之间差异的程序”,或者提供一些问题-程序对作为示例。

值得一提的是,相较之前只接受文本训练的神经网络(如 GPT-3),这一次,研究人员使用了由 OpenAI 制作的名为 Codex 的模型,该神经网络除了在文本上训练,也在 GitHub 存储库中的上千兆字节代码上做了“微调”。“微调”本质上是另一个预训练步骤,可以提高模型的性能。

由于 Codex 的训练数据有着数百万个文本单词和数百万行代码,因此它能够较好理解文本段和代码段之间的关系,并将两者进行转换,从而通过代码回答问题。

自我编码的AI算法即将到来(解决数学难题的AI模型)(4)

▲图 | 用 Codex 回答和生成课程题目的自动工作流示例(来源:PNAS)

值得注意的是,有时在将数学问题转化为编程任务时需要添加上下文(背景知识)或一些基本的定义解释,比如,对于问题中的“网络”一词,需要向模型标注该词代表“神经网络”,并不是指“社会网络”。

另外,可能还需要让它知道具体该使用哪个编程包。只有这样神经网络才可以正确处理问题,并输出超过 80% 的正确答案。

同时,在模型创建新的数学问题方面,德罗里在 MIT 官网表示:“在用新模型生成某些方面的问题时,它的表现让我们感到惊讶。它并不是单纯通过替换已有问题中的值来生成新问题。比如,在一个水平线和垂直线的量子检测问题中,模型生成了对角线量子探测的新问题。”

此外,研究团队还分别把模型和人类出的数学题(各 5 道)让学生去判断,看他们是否可以区分两者。结果显示,学生无法确定哪个问题具体是由 AI 产生的。

最后,在借助机器学习解决越来越困难问题领域,该研究又向前走了一步。不过,尽管模型的准确率已经非常高,但它永远不会百分百准确,而且总会有人提出一个更难的问题,它不会取代人类。这项工作在高等教育方面或可起到重要作用。

该团队还计划继续扩展该工作以突破一些限制,比如,进一步用可视化组件解决问题和提高问题的难度。此外,还会让模型接受几百门课程的训练,通过大量数据让其性能加速增强,从而能够对课程设计提出更好的见解。

参考资料:https://news.mit.edu/2022/machine-learning-university-math-0803https://www.pnas.org/doi/10.1073/pnas.2123433119

自我编码的AI算法即将到来(解决数学难题的AI模型)(5)

  • 大连甘井子区体育新城和生态新城(辽宁大连甘井子区)
  • 2024-07-02辽宁大连甘井子区生态优势在甘井子区正转化为经济优势,一大批投资者看好这里的环境前来入驻本报记者苏大鹏摄地处大连甘井子区的夏家河子海滨岸清水洁这里是大连海洋生态环境保护的亮点地带本报记者苏大鹏摄作为“生态大市”中的“生。
  • 环境科学导论复习题(环境生态学练习题)
  • 2024-07-02环境生态学练习题一、名词解释生态幅:生物在其生存过程中,对每一种生态因子都有其耐受的上限和下限,上下限之间就是生物对这种生态因子的耐受范围,称作生态幅生态位:在生态因子变化范围内,能够被生态元实际和潜在占据、利用或适。
  • 宝宝发育几个阶段(宝宝发育的8个奇怪阶段)
  • 2024-07-02宝宝发育的8个奇怪阶段婴儿成长过程中,每个时期都充满了让人欣喜的时刻,比如你的孩子第一次微笑,第一次吃麦片粥,第一次翻身然而,在这些可爱的里程碑之间也有很多让人抓狂的事情,比如凌晨3点起床,当你把他交给别人照看时无休止的眼。
  • 6字游戏名字精选(6字游戏名字推荐)
  • 2024-07-026字游戏名字推荐乖一点就爱你十二月的奇迹扑进先生怀里起名真费劲儿我年轻我任性此情可待追忆森林里的麋鹿何必太在乎你小屁孩べ卟懂嗳想做你的礼物为将来而努力面纱下的苦涩天空破碎的心奶瓶,还我初吻茉莉花的清香っ滚出我的世界心。
  • 白夜追凶结局背景音乐(Netflix买白夜追凶版权)
  • 2024-07-02Netflix买白夜追凶版权这里是每天为您准点报时的「淘影日报」!海量国内外电影资讯精选,一天只看这篇就够了~|头条:☞《复联3》刚打造出来的沉重感,竟被灭霸一封信给毁了昨晚漫威放出了《复仇者联盟3》第一部官方预告片,众多英雄和。
  • 论语子路中的狂狷的狷是什么意思(论语子路的简介)
  • 2024-07-02论语子路的简介《论语·子路》中的狂狷的狷的意思是拘谨,有所不为原文节选:“不得中行而与之,必也狂狷乎!狂者进取,狷者有所不为也”《论语·子路》是出自《论语》的文章,共有30篇,有关于如何治理国家的政治主张,孔子的教。
  • 在四川丢失的孩子找到了吗(四川7地发布重要提醒)
  • 2024-07-02四川7地发布重要提醒今日(11月21日)四川7市发布重要提醒,自贡、南充(南部)、遂宁(船山)、宜宾(叙州、翠屏)、泸州(江阳、龙马潭)、眉山(东坡、仁寿)、乐山(市中区、五通桥、峨眉山市、马边县)紧急寻人!如有重叠速报。
  • 长期吃什么食物可以降血压(吃这些食物能降血压)
  • 2024-07-02吃这些食物能降血压这年头,作为一个食物要是没点特殊的本领都不好意思和别的食物打招呼……谁说不是捏!赶脚着就好像一说话不崩几个网络流行语就不是时尚现代人一样:太难了……这不,今天这几个食物,就被贴上了特殊的标签,而这个标。
  • 腾讯手游发布会节目表(新手游上线仅23天日活玩家就飙到4000万)
  • 2024-07-02新手游上线仅23天日活玩家就飙到4000万大家都知道《和平精英》每天有好几千万人在玩,是目前全世界最火的手游它究竟是怎么登上这个铁王座的呢?能让玩家们日复一日娱乐、努力在游戏里维护和平的,绝对是游戏的内容本身或者说,和游戏自身的高品质和频繁更。