自我编码的AI算法即将到来(解决数学难题的AI模型)
自我编码的AI算法即将到来(解决数学难题的AI模型)
2024-09-27 10:34:53  作者:荷尔蒙的美  网址:https://m.xinb2b.cn/tech/vdh112503.html


当前,机器学习模型在解决微分方程等高难度数学问题方面一直存在很大限制,一些最好的模型也只是勉强回答高中水平的数学题目。

但现在,麻省理工学院(MIT)领导的研究小组开发的一种神经网络模型,可轻松应对相当于大学数学课程难度的问题。


(来源:MIT)

8 月 2 日,相关论文以《一个通过程序合成和人类层面的小样本学习的神经网络来解决、解释和生成大学数学问题》(A neural network solves, explains, and generates university math problems by program synthesis and few-shot learning at human level)为题发表在 PNAS 上。

MIT 电气工程与计算机科学系讲师伊多·德罗里(Iddo Drori)担任第一作者兼通讯作者,他也是哥伦比亚大学计算机科学系的兼职副教授。

“我们的研究是第一个解决本科数学问题的工作,这填补了使用代码和程序合成的缺失部分,并使得准确率从 8% 提高到 80% 以上。”德罗里在 MIT 官网上说。

该研究将有助于改善高等教育现状,新模型对学生和老师都能有所帮助。它能建立问题和课程的图表,基于数据的角度,助力理解课程及其先决条件之间的关系。

除了解答数学问题,新模型还能作为“机器导师”,向学生展现题目解答所涉及的步骤,并且快速生成新问题。同时,它还可以对课程内容进行简化,这可在大型开放式网络课程领域发挥重要作用。

据了解,研究人员在这项工作上花费了近两年。他们最开始发现,模型只接受文本数据训练的话,它回答高中水平数学问题时的错误率基本都在 92% 以上。

而那些利用图神经网络的模型经过一段时间训练后,能更好地解决机器学习课程问题。

然后,德罗里决定尝试将 MIT 和哥伦比亚大学的数学课程转变为相应的编程任务,这一过程用到了程序合成和小样本学习技术。


▲图 | (A)麻省理工学院、哥伦比亚大学数学课程和(B)MATH 基准数据集的自动求解率比较(来源:PNAS)

把一个问题变成一个编程任务,类似于将“找到两点之间的距离”问题重写为“编写一个找到两点之间差异的程序”,或者提供一些问题-程序对作为示例。

值得一提的是,相较之前只接受文本训练的神经网络(如 GPT-3),这一次,研究人员使用了由 OpenAI 制作的名为 Codex 的模型,该神经网络除了在文本上训练,也在 GitHub 存储库中的上千兆字节代码上做了“微调”。“微调”本质上是另一个预训练步骤,可以提高模型的性能。

由于 Codex 的训练数据有着数百万个文本单词和数百万行代码,因此它能够较好理解文本段和代码段之间的关系,并将两者进行转换,从而通过代码回答问题。


▲图 | 用 Codex 回答和生成课程题目的自动工作流示例(来源:PNAS)

值得注意的是,有时在将数学问题转化为编程任务时需要添加上下文(背景知识)或一些基本的定义解释,比如,对于问题中的“网络”一词,需要向模型标注该词代表“神经网络”,并不是指“社会网络”。

另外,可能还需要让它知道具体该使用哪个编程包。只有这样神经网络才可以正确处理问题,并输出超过 80% 的正确答案。

同时,在模型创建新的数学问题方面,德罗里在 MIT 官网表示:“在用新模型生成某些方面的问题时,它的表现让我们感到惊讶。它并不是单纯通过替换已有问题中的值来生成新问题。比如,在一个水平线和垂直线的量子检测问题中,模型生成了对角线量子探测的新问题。”

此外,研究团队还分别把模型和人类出的数学题(各 5 道)让学生去判断,看他们是否可以区分两者。结果显示,学生无法确定哪个问题具体是由 AI 产生的。

最后,在借助机器学习解决越来越困难问题领域,该研究又向前走了一步。不过,尽管模型的准确率已经非常高,但它永远不会百分百准确,而且总会有人提出一个更难的问题,它不会取代人类。这项工作在高等教育方面或可起到重要作用。

该团队还计划继续扩展该工作以突破一些限制,比如,进一步用可视化组件解决问题和提高问题的难度。此外,还会让模型接受几百门课程的训练,通过大量数据让其性能加速增强,从而能够对课程设计提出更好的见解。

参考资料:https://news.mit.edu/2022/machine-learning-university-math-0803https://www.pnas.org/doi/10.1073/pnas.2123433119


  • 道德经24章感悟和心得体会(道德经第四十九章)
  • 2024-09-28道德经第四十九章有人问我:悟道有什么好处?其实,悟道是让你的思想有所觉悟、人活得明白比如哲学家经常提出一些终极问题:我是谁?我从哪里来?要到哪里去?如果读懂了《道德经》,您就会发现:答案已了然于胸!但有时很难讲清楚,。
  • 爆笑喜剧一张口就能让你笑喷(今年最搞笑喜剧)
  • 2024-09-28今年最搞笑喜剧“过了爱做梦的年纪,轰轰烈烈不如平静”——《没那么简单》前些日子与友人吃饭,席间聊到交女朋友的二三事朋友说,“已经过了爱做梦的年纪,哪还有当年无知的冲动”,“家里介绍了个女朋友,条件都不错不过还未见面。
  • 雅诗兰黛套装的使用步骤(雅诗兰黛套装怎么用)
  • 2024-09-28雅诗兰黛套装怎么用第一步:清洁首先清洁时相当重要的护肤步骤,是早晚都要有的挤出颗粒大小,加些微的水,在手上轻揉起泡,然后把泡沫涂抹到面部打圈,3分钟左右用清水冲洗干净即可第二步:爽肤水可以把爽肤水倒入化妆棉上,在用化妆。
  • 明朝多了多少姓朱的(明朝皇帝姓朱与)
  • 2024-09-28明朝皇帝姓朱与明朝皇帝的姓氏是朱,老百姓食肉是猪,两者之间是如何避讳的?在我国古代,规矩很多,特别是这一项规定,熟悉历史的朋友都不会陌生众所周知,古代皇帝的权力至高无比,为此臣子百姓的名字有和皇帝相同的,均要勒令修。
  • 如何开通海外短(看看国外网红怎么玩)
  • 2024-09-28看看国外网红怎么玩作者:言说三记得关注我们哦~本文共1137字,阅读时长约3分钟关键词:短视频、国外网红、策略你是否听说过在Facebook、Instagram上爆红的短视频作者ZachKing?他的魔术短视频可是风靡。
  • 小学教师编制分几种
  • 2024-09-28小学教师编制分几种小学教师编制分为以下几类:一、事业编制:含中小学及幼儿教师岗,指的是直接通过编制考核进入教师队伍的人;二、特岗教师:主要是义务段教师岗,特岗教师也是正规事业单位编制,考试难度比事业单位小一些,每年招录。
  • 知识传播与公众参与(公众如何参与科学传播)
  • 2024-09-28公众如何参与科学传播编者按:长期以来,科学知识的大众传播一直面临着诸多局限除去知识本身的复杂性外,科学界所青睐的“知识缺陷”模式,即将公众视作知识匮乏的群体、认为公众应该成为科学知识的被动接受者,也导致了传播上的不对称关。
  • 家里有这5种旧东西要及时扔掉 不管生活多节俭
  • 2024-09-28家里有这5种旧东西要及时扔掉 不管生活多节俭随着时代的进步,现在人们都过上了舒适的生活,你会发现有不少的好物出现在我们身边这些东西的发明让我们的生活更舒适了,还能够用它去替代旧的东西比如我们经常使用的洗衣机,最初的时候都是手洗,但现在有了洗衣机。
  • 无领大衣怎么搭
  • 2024-09-28无领大衣怎么搭其实不用担心,只要你懂的色调的配搭,就不成问题那么,如果你有一件无领大衣,怎么搭配好呢?    例如这款时尚A型毛毛质感大衣,整件大衣设计简约干练,没有过多花哨设计,有这欧美大牌味稍A的廓形包容性更强。
  • 二十四节气为何没有大满一说(在24节气中为何没有)
  • 2024-09-28在24节气中为何没有24节气是我国古代劳动人民,根据寒来暑往的季节变化和植物生长规律总结出来的,能够很好地指导人们从事农业生产和安排衣食住行,反映了我国古代劳动人民的高超智慧正因为24节气对于农业生产有着非常重要的作用,。
  • 1克拉的钻石等于多少(一克拉等于多少克)
  • 2024-09-28一克拉等于多少克很多人都听说过一克拉,但是很多人并不知道一克拉到底有多重?一克拉等于多少克呢?一克拉钻石有多大?为什么一克拉钻石的价格会那么贵?我们一起来了解一下吧  一克拉等于多少克  克拉是钻石的专有单位,一克拉。
  • 海苔什么颜色正常(海苔的正常颜色)
  • 2024-09-28海苔的正常颜色干燥后的紫菜是紫色的长期储存的紫菜会逐渐变成绿色,这是正常现象,可以放心吃紫菜一般生长在浅海岩礁上,颜色有紫红、绿紫及黑紫,但干燥后变成紫色紫菜之所以是紫色的,是因为紫菜中含有一种叫“藻红素”的特殊色。