自我编码的AI算法即将到来(解决数学难题的AI模型)
自我编码的AI算法即将到来(解决数学难题的AI模型)
2024-11-22 01:50:32  作者:荷尔蒙的美  网址:https://m.xinb2b.cn/life/vdh112503.html


当前,机器学习模型在解决微分方程等高难度数学问题方面一直存在很大限制,一些最好的模型也只是勉强回答高中水平的数学题目。

但现在,麻省理工学院(MIT)领导的研究小组开发的一种神经网络模型,可轻松应对相当于大学数学课程难度的问题。


(来源:MIT)

8 月 2 日,相关论文以《一个通过程序合成和人类层面的小样本学习的神经网络来解决、解释和生成大学数学问题》(A neural network solves, explains, and generates university math problems by program synthesis and few-shot learning at human level)为题发表在 PNAS 上。

MIT 电气工程与计算机科学系讲师伊多·德罗里(Iddo Drori)担任第一作者兼通讯作者,他也是哥伦比亚大学计算机科学系的兼职副教授。

“我们的研究是第一个解决本科数学问题的工作,这填补了使用代码和程序合成的缺失部分,并使得准确率从 8% 提高到 80% 以上。”德罗里在 MIT 官网上说。

该研究将有助于改善高等教育现状,新模型对学生和老师都能有所帮助。它能建立问题和课程的图表,基于数据的角度,助力理解课程及其先决条件之间的关系。

除了解答数学问题,新模型还能作为“机器导师”,向学生展现题目解答所涉及的步骤,并且快速生成新问题。同时,它还可以对课程内容进行简化,这可在大型开放式网络课程领域发挥重要作用。

据了解,研究人员在这项工作上花费了近两年。他们最开始发现,模型只接受文本数据训练的话,它回答高中水平数学问题时的错误率基本都在 92% 以上。

而那些利用图神经网络的模型经过一段时间训练后,能更好地解决机器学习课程问题。

然后,德罗里决定尝试将 MIT 和哥伦比亚大学的数学课程转变为相应的编程任务,这一过程用到了程序合成和小样本学习技术。


▲图 | (A)麻省理工学院、哥伦比亚大学数学课程和(B)MATH 基准数据集的自动求解率比较(来源:PNAS)

把一个问题变成一个编程任务,类似于将“找到两点之间的距离”问题重写为“编写一个找到两点之间差异的程序”,或者提供一些问题-程序对作为示例。

值得一提的是,相较之前只接受文本训练的神经网络(如 GPT-3),这一次,研究人员使用了由 OpenAI 制作的名为 Codex 的模型,该神经网络除了在文本上训练,也在 GitHub 存储库中的上千兆字节代码上做了“微调”。“微调”本质上是另一个预训练步骤,可以提高模型的性能。

由于 Codex 的训练数据有着数百万个文本单词和数百万行代码,因此它能够较好理解文本段和代码段之间的关系,并将两者进行转换,从而通过代码回答问题。


▲图 | 用 Codex 回答和生成课程题目的自动工作流示例(来源:PNAS)

值得注意的是,有时在将数学问题转化为编程任务时需要添加上下文(背景知识)或一些基本的定义解释,比如,对于问题中的“网络”一词,需要向模型标注该词代表“神经网络”,并不是指“社会网络”。

另外,可能还需要让它知道具体该使用哪个编程包。只有这样神经网络才可以正确处理问题,并输出超过 80% 的正确答案。

同时,在模型创建新的数学问题方面,德罗里在 MIT 官网表示:“在用新模型生成某些方面的问题时,它的表现让我们感到惊讶。它并不是单纯通过替换已有问题中的值来生成新问题。比如,在一个水平线和垂直线的量子检测问题中,模型生成了对角线量子探测的新问题。”

此外,研究团队还分别把模型和人类出的数学题(各 5 道)让学生去判断,看他们是否可以区分两者。结果显示,学生无法确定哪个问题具体是由 AI 产生的。

最后,在借助机器学习解决越来越困难问题领域,该研究又向前走了一步。不过,尽管模型的准确率已经非常高,但它永远不会百分百准确,而且总会有人提出一个更难的问题,它不会取代人类。这项工作在高等教育方面或可起到重要作用。

该团队还计划继续扩展该工作以突破一些限制,比如,进一步用可视化组件解决问题和提高问题的难度。此外,还会让模型接受几百门课程的训练,通过大量数据让其性能加速增强,从而能够对课程设计提出更好的见解。

参考资料:https://news.mit.edu/2022/machine-learning-university-math-0803https://www.pnas.org/doi/10.1073/pnas.2123433119


  • 到底该不该给孩子补充dha(DHA到底要不要给孩子补充)
  • 2024-11-22DHA到底要不要给孩子补充“dha要不要补充?婴儿从什么时候开始补充dha好呢?DHA吃多少?DHA选哪个?”我们的孩子是在不断长大的,DHA的摄入是跟整个膳食结构和饮食习惯相关联的,每个阶段恐怕妈妈们都会想要问同样的问题,不。
  • 肝不好不宜吃的零食(长假过后怎么护眼)
  • 2024-11-22长假过后怎么护眼放假期间,小伙伴们熬夜看电视、玩电脑、打牌、抢红包……睡眠不足和过度用眼会导致大家出现头痛、眼睛干涩、视物模糊等症状那么有什么好的方法可以重新让我们恢复水润的“明眸”呢?预防干眼小方法1.注意休息多眨。
  • vivoz1i有什么特别技术吗 vivoZ1i曝光骁龙636
  • 2024-11-22vivoz1i有什么特别技术吗 vivoZ1i曝光骁龙636近期vivo风头正盛,除了vivoNEX的广受关注和热销外,近日又有一款主打“性价比”的新机即将发布纵观目前vivo的产品线,vivoNEX稳坐行业一线高端旗舰行列,X系列是更多时尚年轻人的新选择,而。
  • 林浩抗日(9月3日我的特一营湖南卫视首播)
  • 2024-11-229月3日我的特一营湖南卫视首播《我的特一营》剧照(林浩饰小四川)《我的特一营》剧照(林浩饰小四川)《我的特一营》剧照(林浩饰小四川)《我的特一营》剧照(林浩饰小四川)昨日,记者从湖南卫视总编室了解到,湖南卫视已经确定9月3日播出反。
  • 我的世界怎么建学校跑道(具体方法教程)
  • 2024-11-22具体方法教程首先找到一片空地,空地的范围要比较大,而且地势比较平整如果有坑洼的地方,使用草方块填充即可,让整个草地形成一个平整的区域将区域调理平整之后,接着拿出草方块,将整个区域用草方块隔离开来,这相当于一道田埂。
  • 喝茶的一些感悟与茶相伴茶话人生(有没有对茶字寻根究底过)
  • 2024-11-22有没有对茶字寻根究底过茶叶起源于中国,种茶、饮茶、品茶、茶道在中国已经有几千年的历史了,其影响远播海外无论是老百姓的开门七件事“柴米油盐酱醋茶”,还是文人雅士的“琴棋书画诗酒茶”,都说明茶叶是中国人日常生活的一个重要部分,。
  • 热血街区第三季叫什么 热血街区3最终章11月上映
  • 2024-11-22热血街区第三季叫什么 热血街区3最终章11月上映《热血街区电影版2天空尽头》正在日本国内上映,CLAMP婶婶们从今年3月开始也有在讲谈社《周刊少年MAGAZINE》连载这个系列的漫画版,并时不时放出Q版图诱惑粉丝《热血街区3最终章》将于11月11日。
  • 正宗野山鸡怎么做好吃(正宗野山鸡的做法介绍)
  • 2024-11-22正宗野山鸡的做法介绍野山鸡热水泡半小时后洗净入水锅,水开煮10分钟,到掉水清洗干净再加水煮开10分钟(此步是为了把肉清洗干净)把鸡肉撕成一小条条,弃骨油热放姜、小红辣椒、一半蒜蓉炒出香味加入山鸡肉加料酒去腥,再加酱油翻炒。
  • 天亮下雪的歇后语是什么(常见的歇后语有哪些)
  • 2024-11-22常见的歇后语有哪些天亮下雪(歇后语):天亮下雪——明白常见歇后语如下:八级工拜师傅——精益求精八仙过海——各显神通八仙聚会——神聊八月十五蒸年糕——趁早斑马的脑袋——头头是道板上钉钉——跑不了半夜三更放大炮——一鸣惊人。
  • 藏红花可以美颜养生吗(藏红花的作用介绍)
  • 2024-11-22藏红花的作用介绍可以美颜养生藏红花因活血化瘀,养颜调经等功效闻名全世界,也因其神奇的调理功效和美容功效,被称之为“妇科第一花”“美容第一花”也是夏季养生的佳品,它性味温和,尤其是对于咱们女性朋友身体的调理有显着的效果。
  • 张国荣死前的8小时(张国荣在643)
  • 2024-11-22张国荣在643张国荣在“6:43”逝世,这准确的时间,哥哥只让她知道……相信张国荣是很多人心中的永远的男神,虽然在十几年前他已经逝去,但是他阳光的笑容还铭记在很多粉丝的心里,想起来还是悲痛万分大家肯定都知道哥哥在临。