自我编码的AI算法即将到来(解决数学难题的AI模型)
自我编码的AI算法即将到来(解决数学难题的AI模型)
2024-11-22 08:21:13  作者:荷尔蒙的美  网址:https://m.xinb2b.cn/tech/vdh112503.html


当前,机器学习模型在解决微分方程等高难度数学问题方面一直存在很大限制,一些最好的模型也只是勉强回答高中水平的数学题目。

但现在,麻省理工学院(MIT)领导的研究小组开发的一种神经网络模型,可轻松应对相当于大学数学课程难度的问题。


(来源:MIT)

8 月 2 日,相关论文以《一个通过程序合成和人类层面的小样本学习的神经网络来解决、解释和生成大学数学问题》(A neural network solves, explains, and generates university math problems by program synthesis and few-shot learning at human level)为题发表在 PNAS 上。

MIT 电气工程与计算机科学系讲师伊多·德罗里(Iddo Drori)担任第一作者兼通讯作者,他也是哥伦比亚大学计算机科学系的兼职副教授。

“我们的研究是第一个解决本科数学问题的工作,这填补了使用代码和程序合成的缺失部分,并使得准确率从 8% 提高到 80% 以上。”德罗里在 MIT 官网上说。

该研究将有助于改善高等教育现状,新模型对学生和老师都能有所帮助。它能建立问题和课程的图表,基于数据的角度,助力理解课程及其先决条件之间的关系。

除了解答数学问题,新模型还能作为“机器导师”,向学生展现题目解答所涉及的步骤,并且快速生成新问题。同时,它还可以对课程内容进行简化,这可在大型开放式网络课程领域发挥重要作用。

据了解,研究人员在这项工作上花费了近两年。他们最开始发现,模型只接受文本数据训练的话,它回答高中水平数学问题时的错误率基本都在 92% 以上。

而那些利用图神经网络的模型经过一段时间训练后,能更好地解决机器学习课程问题。

然后,德罗里决定尝试将 MIT 和哥伦比亚大学的数学课程转变为相应的编程任务,这一过程用到了程序合成和小样本学习技术。


▲图 | (A)麻省理工学院、哥伦比亚大学数学课程和(B)MATH 基准数据集的自动求解率比较(来源:PNAS)

把一个问题变成一个编程任务,类似于将“找到两点之间的距离”问题重写为“编写一个找到两点之间差异的程序”,或者提供一些问题-程序对作为示例。

值得一提的是,相较之前只接受文本训练的神经网络(如 GPT-3),这一次,研究人员使用了由 OpenAI 制作的名为 Codex 的模型,该神经网络除了在文本上训练,也在 GitHub 存储库中的上千兆字节代码上做了“微调”。“微调”本质上是另一个预训练步骤,可以提高模型的性能。

由于 Codex 的训练数据有着数百万个文本单词和数百万行代码,因此它能够较好理解文本段和代码段之间的关系,并将两者进行转换,从而通过代码回答问题。


▲图 | 用 Codex 回答和生成课程题目的自动工作流示例(来源:PNAS)

值得注意的是,有时在将数学问题转化为编程任务时需要添加上下文(背景知识)或一些基本的定义解释,比如,对于问题中的“网络”一词,需要向模型标注该词代表“神经网络”,并不是指“社会网络”。

另外,可能还需要让它知道具体该使用哪个编程包。只有这样神经网络才可以正确处理问题,并输出超过 80% 的正确答案。

同时,在模型创建新的数学问题方面,德罗里在 MIT 官网表示:“在用新模型生成某些方面的问题时,它的表现让我们感到惊讶。它并不是单纯通过替换已有问题中的值来生成新问题。比如,在一个水平线和垂直线的量子检测问题中,模型生成了对角线量子探测的新问题。”

此外,研究团队还分别把模型和人类出的数学题(各 5 道)让学生去判断,看他们是否可以区分两者。结果显示,学生无法确定哪个问题具体是由 AI 产生的。

最后,在借助机器学习解决越来越困难问题领域,该研究又向前走了一步。不过,尽管模型的准确率已经非常高,但它永远不会百分百准确,而且总会有人提出一个更难的问题,它不会取代人类。这项工作在高等教育方面或可起到重要作用。

该团队还计划继续扩展该工作以突破一些限制,比如,进一步用可视化组件解决问题和提高问题的难度。此外,还会让模型接受几百门课程的训练,通过大量数据让其性能加速增强,从而能够对课程设计提出更好的见解。

参考资料:https://news.mit.edu/2022/machine-learning-university-math-0803https://www.pnas.org/doi/10.1073/pnas.2123433119


  • 符号带字网名(符号带字网名大全)
  • 2024-11-22符号带字网名大全′夏沬↘▼△親親゛︶﹉余温ミ劇終离殇℡繁夏⊕GaмeOver倦ㄋ°邂逅ゝ痴人殇城づSunshine‵浅笑-墨尘ζ如夢空心しovё搁浅|▍夏殇青鸢、┈┾冷瞳づ叹菔ˊ╭ァ夨眠℅24K纯帅Smileぃ讉莣∠。
  • 最珍贵的玉如意(最吉祥之玉如意)
  • 2024-11-22最吉祥之玉如意  玉必有工,工必有意,意必吉祥几千年来,玉作为一种吉祥物,它被人们赋予了吉祥如意的美好寓意而在玉雕题材中,有一种玉器不仅寓意吉祥,就连它的名字都坦坦荡荡地展示着一种美好寓意它就是——玉如意  千百年。
  • 废纸节约方法(废纸再利用的小妙招)
  • 2024-11-22废纸再利用的小妙招十张为一组装订好做笔记本或草稿纸,也可以衍生为练钢笔字素描的稿纸保护桌面用,放烫的、容易弄脏桌面的活动时铺在桌子上收纳瓷器玻璃容器的时候包裹在外面防止磕碰揉做一团塞在鞋里防潮,要定期更换洗完鞋晾晒时覆。
  • 进入公司的目的及打算(进入公司的目的及打算怎么写)
  • 2024-11-22进入公司的目的及打算怎么写进入公司的目的:为工作而工作,这种人有抱负,对工作积极认真目的是为了求发展,实现自我价值,实现生活美好为了打发时间,这样的人工作懒散,没积极性,做事情多一事不如少一事,上班目的,为了生活不缺少工作这一。
  • 化妆品怎样辨别好坏(如何分辨化妆品的好坏)
  • 2024-11-22如何分辨化妆品的好坏甜蜜提示爱美之心人皆有之,女生通过化妆品的修饰变得美丽、自信但是如果因为使用了一些不合格的化妆产品导致“毁容”怎么办?所以在购买化妆品时要懂得如何分辨化妆品的好坏另外,多留意化妆品的生产公司,看看是不。
  • 赖氨葡锌成人可以吃吗(赖氨葡锌能用开水冲服吗)
  • 2024-11-22赖氨葡锌能用开水冲服吗赖氨葡锌颗粒是赖氨酸和葡萄糖酸锌的复方制剂赖氨酸和葡萄糖酸锌对湿、热较为稳定,故可以用开水冲泡,但是,一般用温开水冲泡即可注意餐后服用,可减少对胃肠道刺激性高氯血症、酸中毒及肾功能不全者慎用;与铝盐、。
  • 浙商保险浙江省分公司总经理(空缺近七年终迎新)
  • 2024-11-22空缺近七年终迎新每经记者:袁园每经编辑:廖丹浙商保险空悬近七年之久的总经理一职终于落定近日,浙商保险官网发布的临时信息披露报告,根据《中国银保监会浙江监管局关于蒋照辉任职资格的批复》(浙银保监复〔2022〕593号)。
  • 黄花风铃寓意(黄花风铃的花语)
  • 2024-11-22黄花风铃的花语#春日生活打卡季#黄风铃花的花语寓意为感谢,珍贵它通常都是在春季的3到4月份之间开放的,是人们春季最期待看到的花朵之一开花时花色艳丽,观赏性极强不过它的花期是非常短暂的,只能维持十天左右,因此比较珍贵。
  • 如何查询遂宁房产成交价(12月遂宁新房用户关注度大数据报告)
  • 2024-11-2212月遂宁新房用户关注度大数据报告据房天下大数据显示,楼盘所在的区县商圈、楼盘的户型和楼盘的面积是用户选择楼盘最为关注的三大因素12月,遂宁购房用户最关注度的区域为船山、射洪、大英;最关注的楼盘为船山的绿地·遂宁1958、船山的金科·。
  • 西游释厄传群魔乱舞各boss弱点(西游释厄传群魔乱舞攻略)
  • 2024-11-22西游释厄传群魔乱舞攻略一.特殊宝物宝珠(时间珠):将时间加至99秒龙珠(能量珠):瞬间气量表满档且卐字全满隐身术(密):一段时间内完全无敌八卦石(灭):破解魔王幻境放血器:可吸取同伴血量乾坤宝剑:类似三国战纪中的张凌剑,金。
  • 高一地理等压口诀
  • 2024-11-22高一地理等压口诀等压线的判定口诀:凸低为高,凸高为低口诀中的“凸高”是指等值线向数值更大的方向弯曲;“凸低”是指等值线向数值更小的方向弯曲;“为低”是指形成低值区,意思是弯曲处比两侧数值更低.“为高”是指形成高值。
  • 刺梅的养殖方法和注意事项(大家可以了解一下)
  • 2024-11-22大家可以了解一下土壤家庭养殖虎刺梅首先要注意的就是土壤,土壤相当于我们的家居环境,要想植物的生长的好,土壤是首要的,盆土最好选用沙质土壤,可选用腐叶土、沙土,混合少量的肥料配制而成浇水虎刺梅的叶片时肉质的,很耐干旱,。