Shixin Gu作者Joshua Chou, Panda编辑

关于AI数学和科学标准化测试的综述

研究表明,图灵测试不能充分地衡量人工智能是否具有智能。实际上,已经有一些研究者声称已经开发出了能通过图灵测试的人工智能,比如聊天程序 Eugene Goostman,但这些程序的智能水平还远没达到人们的期望。为了更好地衡量人工智能,有研究者提出使用数学和科学标准化测验来考核人工智能。研究者 Arindam Bhattacharya 的论文《A Survey of Question Answering for Math and Science Problem》对这方面的研究进展进行了总结。机器之心技术分析师对该论文进行了解读,本文为解读的中文版。

论文:https://arxiv.org/abs/1705.04530

这篇论文非常有意思,因为它提供了一个思考人工智能的新角度。研究已经证明,图灵测试在衡量人工智能方面是不完备的,标准化的数学和科学测验现已被接受作为一种衡量人工智能的方法。这篇论文的目标是概述让机器智能足以通过标准化数学和科学测验的方法。

1 引言

这篇论文首先指出,对于人类而言,我们常常通过人们针对相关问题给出的答案评价他们。但我们却不能使用同样的标准来评价机器。阿兰·图灵在 1950 年提出的图灵测试 [1] 是通过机器能否表现出与人类不可区分的对话行为来评价机器。而现在,Clark 和 Etzioni [2] 已经提出使用数学和科学的标准化测验来作为评价机器智能的合适方法。这篇论文向我们简要介绍了训练机器求解数学和科学问题的方法。

专业用户独享

本文为机器之心深度精选内容,专业认证后即可阅读全文
开启专业认证
理论
1
暂无评论
暂无评论~