黄博士首度说明AlphaGo为何退役

没有人会否认,过去一年来炒热全球AI的热源头,正是AlphaGo。很少人知道,AlphaGo里头九成的软件都是一个台湾工程师黄士杰负责。11月10日,衣锦还乡的黄士杰,首度在中研院人工智能年会,说清楚AlphaGo的过去与未来。

“这五年,我也没有想过会做出AlphaGo,团队的精神很强,有个远大的目标。”AlphaGo首席工程师黄士杰语说。

十一月十日,中研院人文馆“人工智能年会”大会议室已经挤满人。这天是全球人工智能AI象征“AlphaGo”幕后重要操盘手,黄士杰衣锦返乡的日子。他是DeepMind里头,除了两位创办人之外,唯一可对外代表公司发言的主管。这也是2012年加入DeepMind的黄士杰,第一次公开演讲。

回想起两个月前的最新突破,身为DeepMind第四十号员工的黄士杰,忍不住兴奋与激动。该公司投稿《自然》杂志上的论文,揭露AlphaGO的终极版“AlphaGo Zero”,不再靠人类围棋知识,就是让Zero只了解围棋最基本的规则,自己跟自己左右互奕,从彻底乱下开始,短短四十天,对上曾打败世界棋王柯洁的旧版Master,已经有超过九成的胜率,打败围棋软件累积十年的历程。

刚开始时,黄士杰认为Zero绝对赢不了Master。因为他再怎么想,都想不到如何让一个程序从零开始学,可以一夕之间赢得了花了十年研发的围棋软件?

但Zero进步神速,“三天就走过围棋几千年的历史”,让黄士杰大为吃惊。但更令人吃惊的在后头,Zero训练到21天时,就达到Master的水准,到第40天,就超越了Master。

身为业余六段棋士,把自己十几年在围棋上的研究拿掉,黄士杰自己有什么感觉?

“如果我阻碍了它,我应该被拿掉,AlphaGo知识中有99%是我做的,那是从师大的研究到现在,这是一个很好的收尾,”黄士杰坦言自己心情很复杂。

DeepMind创办人迪米斯已经和黄士杰说,AlphaGo完成任务了,“我们要往前看”。

黄士杰还记得2016年底西方同事们都准备要过年了。他刚回到台湾,迪米斯立刻要他低调地去申请网络帐号,开始上网下棋,匿名挑战全世界高手。这是AlphaGo Master诞生之始。

在演讲现场黄士杰秀出当时的照片,他当时就在自己的房间,桌上放一碗面,不断下棋,一天要下十盘。注意力要很集中,十分疲累。

刚开始因为黄士杰用的是新帐号,没有职业棋士愿意和这个无名小卒下棋,但没想到他一出手就所向披靡,第二天开始,变成许多人登门挑战。

“当时压力很大,很怕点错,或者网路断线,AlphaGo不能因为我输掉啊,”黄士杰说。当时Master每一盘都赢,下了六十盘,胜率高达95%,高到黄士杰和团队一度以为是bug。

用这个新版软件,今年5月和世界棋王柯洁九段在中国乌镇对奕。Master毫无意外的完胜。

“但这是一次人机共同探索,AI是人类的工具不是威胁,”黄士杰也强调,这套深期度学习加上强化学习的价值网络,就是AlphaGo Zero的理论。

这段AlphaGo旅程,对一名台湾土生土长,站上世界科学舞台的工程师而言,简直像“爱丽丝梦游仙境”。

然而,业界的人都等著看,围棋界已无对手的AlphaGo,接下来能否在其他产业大展身手?

AlphaGo母公司DeepMind创办人兼执行长德米斯也宣布,AlphaGo功成身退,不再比赛。

部份业者甚至持保留意见。例如,一位微软研发主管接受《天下》采访时,便酸溜溜的说,“微软做AI是拿来用的,谷歌做AlphaGo是拿来吹牛的。”他认为,当年IBM的超级电脑深蓝,打败西洋棋棋王后,因为找不到应用,团队最终解散。负责人许峰雄最后甚至离开了IBM。

而脸书人工智能实验室负责人、纽约大学终生教授Yann Lecun也曾质疑,AlphaGo可能很难应用到自驾车等热门领域。

“我们尊重他的看法,我们没有说它(AlphaGo)可以马上用到其他领域,但它可以逐渐用到其他领域,”一位听众转述Yann Lecun的质疑时,年轻的黄士杰回答得很小心翼翼。

“AlphaGo Zero主要目标就是证明不需要人类知识,也可以学习的很强。”黄士杰接下来自信的说,“我们要跟大家说,那是有可能的。”

AlphaGo Zero拿掉之前累积的人类智慧,让AlphaGo了解围棋最基本的规则。单靠机器的深度学习和强化学习。一切从零开始。

可说就是人类创造的智慧打败人类智慧与人类直觉。

“最差的状况也就不过就是IBM当年的状况,但我不认为AlphaGo会到最坏的状况,”清大电机系助理教授孙民说。

从应用的角度来看,孙民认为,只要在虚拟世界中可以虚拟的状况,AlphaGo Zero都可以做。譬如建筑设计可以虚拟设计就可以在虚拟环境中测试,硬件测试可以用这样的工具设计出好的芯片。

这和过去的虚拟3D设计有何不同? “不同就在以前都是人去测试,虚拟软体告诉你虚拟后的结果,但改model还是人,硬体设计还是人,”孙民分析, “AlphaGo Zero 不需要人,只要告诉我规则和你要的结果, 不需要一个专家或者建筑师力学高手, chip设计师, 就可以做出来,”他说。

当然这都还是在虚拟世界中的功能,孙民认为如果在一个环境会变异的实体世界,AlphaGo就还有很多问题需要课服。但可以期待未来的应用与发展。

“我每天上班,每天都在进步,非常愉快,我们团队的精神很强,有个远大的目标,”在DeepMind人称“Aja,阿杰”的黄士杰说。

迪米斯创立Deepmind时,想要做的是通用、强人工智能。AlphaGo还只是一个弱人工智能,还没有到达什么都能学的境界。

或许现在也才迈入人工智能启蒙期的结束,AlphaGo的退役,是另一个新的开始。

上一篇: 围棋因动漫《棋魂》闻名世界 欧美围棋人气剧增
下一篇: 围棋定能引领他走向美好的未来
文章来自: 本站原创
引用通告: 查看所有引用 | 我要引用此文章
Tags:
相关日志:
评论: 0 | 引用: 0 | 查看次数: -
发表评论
昵 称:
密 码: 游客发言不需要密码.
邮 箱: 邮件地址支持Gravatar头像,邮箱地址不会公开.
网 址: 输入网址便于回访.
内 容:
验证码:
选 项:
虽然发表评论不用注册,但是为了保护您的发言权,建议您注册帐号.
字数限制 200 字 | UBB代码 开启 | [img]标签 关闭