自从1974年一位匈牙利建筑师发明魔方以来,它已经让许多试图解决它的人皱起了眉头,但3D逻辑谜题并不能与加州大学欧文分校的研究人员创建的人工智能系统相提并论。
DeepCubeA是UCI计算机科学家和数学家编写的一种深度强化学习算法,它可以在一秒钟内找到解决方案,而不需要任何特定的领域知识或来自人类的游戏指导。这不是简单的任务,因为立方体有数十亿条完成路径,但只有一个目标状态-每六个侧面显示一个纯色-显然不能通过随机移动找到。
对于今天发表在“自然机器智能”上的一项研究,研究人员证明DeepCubeA解决了100%的所有测试配置,在大约60%的时间里找到了进入目标状态的最短路径。该算法还适用于其他组合游戏,如滑动瓷砖拼图,LightsOut和Sokoban。
UCI计算机科学杰出教授皮埃尔·巴尔迪(Pierre Baldi)说:“人工智能可以打败世界上最好的人类棋手和围棋选手,但一些比较困难的谜题,比如魔方,还没有被计算机解决,所以我们认为它们对AI方法是开放的。”“魔方的解决方案涉及到更多的符号化、数学化和抽象化思维,因此一台能够破解这样一个谜题的深度学习机器越来越接近成为一个能够思考、推理、计划和决策的系统。”
研究人员有兴趣了解人工智能是如何以及为什么要采取行动的,以及需要多长时间才能完善它的方法。他们首先对一个完整的谜题进行了计算机模拟,然后对立方体进行了置乱。一旦代码到位并运行,DeepCubeA就隔离训练了两天,解决了一系列越来越困难的组合。
巴尔迪指出:“它是自己学会的。
有一些人,特别是青少年,可以在匆忙中解决魔方,但即使是他们也需要50个左右的动作。
巴尔迪说:“我们的人工智能大约需要20个动作,大部分时间是以最小步数求解。“就在那里,你可以看到策略是不同的,所以我最好的猜测是人工智能的推理形式与人类的完全不同。”
这位资深计算机科学家说,像这种项目的最终目标是建立下一代人工智能系统。不管他们是否知道,人们每天都会通过Siri和Alexa等应用程序和推荐引擎在他们最喜欢的在线服务的幕后工作。
巴尔迪说:“但这些系统并不是真正的智能系统;它们很脆弱,你可以很容易地破解或愚弄它们。“我们如何创造更聪明、更健壮、有推理、理解和规划能力的先进人工智能?这项工作是朝着这一重大目标迈出的一步。”