本文作者:微软亚洲研究院副研究员 黄铂钧
今年是美国人工智能协会(AAAI – the Association for the Advance of Artificial Intelligence)组织首次在冬天举办旗帜性年会:AAAI 2015大会。大会总共收到超过2000篇投稿,最终收录了500余篇论文,又从中选取200余篇分为十余个方向在现场报告。会议期间,除了这些主流技术报告外,主办方还组织了一系列活动,包括各类AI竞赛,机器人展示,公众开放日,主题辩论,专题研讨会等等。这里我简单谈谈那些给我个人印象较深的部分。
人工智能研究的道德问题
与人工智能有关的职业和社会道德问题是主题演讲中最热门的话题。最近一段时间这个问题似乎确实受到了整个社会的广泛关注。一些为大众所熟知的科技明星,如Stephen Hawking和Elon Musk,表达了人工智能技术的突破会对人类自身构成威胁的担忧。
而加州大学伯克利分校计算机系教授Stuart Russell(目前最权威的人工智能专著的作者)则在他的主题演讲中表示:现有人工智能技术水平距离引发“机器人统治人类”之类的风险还为时尚早。不过,他也认为人工智能技术的研究和应用与核武器、生化技术、基因技术等其他影响巨大的技术一样,应该受到规范化约束。
“ACM通讯”杂志的主编Moshe Vardi教授做了一个关于人工智能技术进步引发的失业问题的主题演讲。他提到以往的几次技术革命在导致失业的同时也创造了大量新型工作。但人工智能技术的发展有可能从本质上对创造新工种贡献有限,从而在整体上对就业产生负面影响。
另外,大会还组织了一个关于自治武器的伦理问题的公开辩论也相当有趣。
个人觉得,对人工智能技术的这一波“担忧”浪潮实际上反映了外界对人工智能技术近年来进步的认可(我猜一些人工智能领域的学者在听到这些“质疑”时其实是欣慰远大于困扰吧)。也许与“机器是否会过于聪明”相比,“机器是否已经真如公众想象的那样聪明”才是更值得人工智能学界担心的问题。
从历史上看,人们对机器智能水平的理解似乎极易产生偏差,往往一开始过于高估,觉得它们无所不能,然而在发现机器能力达不到他们的想象之后又转向过于低估,觉得现有的技术什么都不是。这两种看法又经常在媒体的推波助澜下走向极端化,长期来看无论是哪种极端化看法都会对正常严谨的人工智能研究造成负面影响。
人工智能与机器人技术
“人工智能与机器人技术”是AAAI 2015大会的一个主题。从学科基础看,人工智能学科从“什么是智能”的哲学问题出发,从原理上研究在“智能行为机械化”过程中的一些根本限制和技术原则。另一方面机器人学科则从工程应用的角度出发,考虑如何实际制造满足特定“智能化”要求的机器。两个领域本应是相辅相成的关系,机器人领域为人工智能领域提供实验和实践的机会,而人工智能领域为机器人领域提供知识储备和技术工具。”
但事实上两个领域的研究在很大程度上是相互脱节独立发展的。所以现在人们开始考虑如何加强这两个领域的合作和相互渗透”,本次大会的学术委员会主席Sven Koenig教授在一次交谈中提到。事实上美国国家科学基金会(NSF-National Science Foundation)专门就这个问题在会议期间组织了一个专题研讨会(只有受邀的领域专家才能参加)。
在公开活动中,大会隆重举行了一个对机器人项目“Shakey, the robot”的纪念活动。上世纪60年代末到70年代中期,几个研究员为设计制造一个名为Shakey的机器人发明了一系列后来影响广泛的人工智能技术,包括启发式搜索中的A*算法,自动规划中的STRIP模型,计算机视觉中的霍夫变换,以及如今几乎已成为标准的机器人系统框架。
在纪念活动中领衔发言的是人工智能领域元老级人物Edward Feigenbaum教授,他以一篇极具感染力的演讲高度评价了Shakey项目的巨大影响。有趣的是,以他的名字命名的Feigenbaum奖也同时在纪念活动中颁发,而今年获奖者是微软雷德蒙研究院的院长Eric Horvitz。Feigenbaum奖是当今人工智能界的一个主要奖项,用来奖励对人工智能的实验方面研究做出突出贡献的个人和团体。
此外,会议期间还有一个Robocup参赛队的表演赛。下面是我在现场录的一小段机器人足球比赛的视频(视频见附件)。
从视频来看,现在参加Robocup的机器人在基本运动能力方面还比较有限。个人觉得,双足机器人应该先在竞技场景下“跑起来”,再考虑踢足球之类的复杂任务。因此,现阶段我们或许可以先考虑一些诸如“机器人田径”之类的比赛…
图灵测试的改进方案
去年关于Eugene Goostman通过图灵测试的新闻似乎让一些研究者们看到一个“推翻”图灵测试的好机会。他们先后组织了一个专题研讨会和一个正式会议,主题都叫“Beyond Turing Test”。会议期间,研究者们提出了一些新的机器智能的测试标准,试图代替图灵测试。其中有两个标准是比较有影响力的:
The Winogard Schema Challenge这是一个旨在取代“有缺陷的”图灵测试的测试方案。这个方案的基本思想是限制图灵测试中对话的内容。在标准的图灵测试中人类提问者可以问任意问题,但在Winogard Schema Challenge中所有问题都有关自然语言中的代词理解。
不过,在和这个挑战的主办方交流之后,我个人感觉这个方案真正的关键似乎在于他们只允许人类专家参与提问,而不像标准图灵测试中是普通人在提问。而代词理解,尽管被声称是“关键思想”,其实可以被看作只是对我们应该如何在图灵测试中提问的一种“建议”。但我个人并不觉得这个建议对人类专家是必要的。比如我——作为人工智能领域一个普通的研究员——很有自信可以在图灵测试中分辨出任何当下的聊天机器人,即使不使用这类代词理解问题。所以在我看来,真正的问题是要找“对”的人,而不是找“对”的问题。
从这个角度说,我并不认为目前有特别必要的理由真的要取代现有的图灵测试。也许我们应该做的是规范化图灵测试在执行层的一些细节,例如更好地挑选甚至培训参与图灵测试的人类提问者。
The Aristo Challenge这是另一个要求计算机通过我们在中小学里常见的期中或期末考试的测试方案。考试内容一般包括算术,几何,和一些常识问题等等。另外还有一些题目需要考生结合文字和图片内容进行理解和作答。现在的人工智能技术在这类考试中能达到大概小学4年级水平。
我个人觉得这个挑战更有趣一些。不过,如果站在“测试机器是否具有智能的方案”的高度,你仍然很难说如果真有计算机通过了所有中学考试是否它就一定具有智能。在我看来,和仔细设计的图灵测试相比,似乎还是这个方案更有可能被破解,就像国际象棋或者“危险边缘“竞赛那样。
自动游戏博弈的新突破
最近该领域的一个阶段性成果是,德州扑克的一个最基本的版本被近似完美解决了,具体就是说研究员们显式地找到一个博弈策略,其平均收益与(这个游戏的一个)纳什均衡策略的差距比连续玩这个游戏70年之后结果的随机波动还要小。这个结果发表在一月份的一期《科学》杂志上,而项目的主要负责人Michael Bowling教授在会议期间就这项成果做了一个主题演讲。
会议期间同时举行了General Game Playing比赛。这项比赛要求计算机在没有人类手工输入领域知识的情况下进行棋类游戏博弈。为了保证这一点,比赛组织方会维护一个包括各种不同游戏的列表,每项游戏的基本规则都用一套通用语言进行形式化表述,并且只在比赛当时才输入给计算机。另外组织者还进行了一场有趣的“碳硅大战“,也就是让人跟比赛中优胜的计算机在这个比赛规则下比赛,结果是机器取得胜利。
深度学习
深度学习的主将之一Jeff Hinton教授在会议期间做了一个主题演讲,题目就叫“深度学习”。这个演讲毫不意外地成为了整个会议参加人数最多的活动。Hinton的演讲内容主要是对到目前为止的深度学习运动的总结性回顾。值得一提的是,Hinton教授对微软研究院在整个深度学习运动中的先驱性贡献给予了很大肯定。确实,他的团队与微软研究院合作完成的基于深度学习的语音识别研究完全称得上是直接点燃深度学习热潮的第一批成功案例。
规划、决策、约束补偿、优化、与搜索算法
这些都是人工智能的传统领域。让我其实有一点意外的是,这次会上相当多这些领域里的论文是关于蒙特卡洛树搜索法(Monte Carlo Tree Search)的内容——一个从计算机围棋领域发展而来的技术。而我这次在会议中做的论文报告正是关于如何结合Monte Carlo Tree Search与传统的搜索算法,从而设计更为通用的人工智能算法。尽管论文主要讨论在假设最差情况下如何规划(adversarial planning),我相信论文的主要结果同样适用于更为一般的情况,例如基于概率的规划问题。
另外有些关于算法选择(Algorithm Selection)的论文,讨论如何通过增强学习等技术解决组合优化问题。基本思想是说,一般而言每一个单独的算法在解决这类问题时都有自己的“盲点”,也就是在最差情况下性能很差(所谓的“NP困难”问题)。但是不同的算法盲点往往不同,因此如果在实际应用中能通过学习技术了解正在面对的是“哪些”具体问题类型,也就有可能有的放矢地选择合适的算法。个人认为这是一个有趣的研究方向。
知识表示与推理
我一直认为找到“合适”的知识模型是实现人工智能的主要难点所在。个人对这个领域三方面的研究比较感兴趣:(1)致力于将抽象模糊的术语(如知识、本体、表达力)赋予具体和形式化语义的工作,例如Judea Pearl教授提出的“因果模型(causal model)“;(2)在学习、决策和规划等语境下讨论知识表示和推理的工作,例如Leslie Valiant教授提出的”知识灌输模型 (Knowledge Infusion)”;(3)从中立独立的角度对已有模型和理论的实验性或实践性研究。
机器学习及其应用
机器学习是这次会议中最重要的话题,总共占据了9个会议,同时还有大量论文安排在海报会议里。不过遗憾的是这次会议我不得不“策略性地”选择放弃了全部机器学习有关的内容,以换取时间和精力参加上面所列的所有其他话题的会议。