黄博士首度说明AlphaGo为何退役
作者:琴棋书画 日期:2017-11-18
没有人会否认,过去一年来炒热全球AI的热源头,正是AlphaGo。很少人知道,AlphaGo里头九成的软件都是一个台湾工程师黄士杰负责。11月10日,衣锦还乡的黄士杰,首度在中研院人工智能年会,说清楚AlphaGo的过去与未来。
“这五年,我也没有想过会做出AlphaGo,团队的精神很强,有个远大的目标。”AlphaGo首席工程师黄士杰语说。
十一月十日,中研院人文馆“人工智能年会”大会议室已经挤满人。这天是全球人工智能AI象征“AlphaGo”幕后重要操盘手,黄士杰衣锦返乡的日子。他是DeepMind里头,除了两位创办人之外,唯一可对外代表公司发言的主管。这也是2012年加入DeepMind的黄士杰,第一次公开演讲。
回想起两个月前的最新突破,身为DeepMind第四十号员工的黄士杰,忍不住兴奋与激动。该公司投稿《自然》杂志上的论文,揭露AlphaGO的终极版“AlphaGo Zero”,不再靠人类围棋知识,就是让Zero只了解围棋最基本的规则,自己跟自己左右互奕,从彻底乱下开始,短短四十天,对上曾打败世界棋王柯洁的旧版Master,已经有超过九成的胜率,打败围棋软件累积十年的历程。
刚开始时,黄士杰认为Zero绝对赢不了Master。因为他再怎么想,都想不到如何让一个程序从零开始学,可以一夕之间赢得了花了十年研发的围棋软件?
但Zero进步神速,“三天就走过围棋几千年的历史”,让黄士杰大为吃惊。但更令人吃惊的在后头,Zero训练到21天时,就达到Master的水准,到第40天,就超越了Master。
身为业余六段棋士,把自己十几年在围棋上的研究拿掉,黄士杰自己有什么感觉?
“如果我阻碍了它,我应该被拿掉,AlphaGo知识中有99%是我做的,那是从师大的研究到现在,这是一个很好的收尾,”黄士杰坦言自己心情很复杂。
DeepMind创办人迪米斯已经和黄士杰说,AlphaGo完成任务了,“我们要往前看”。
黄士杰还记得2016年底西方同事们都准备要过年了。他刚回到台湾,迪米斯立刻要他低调地去申请网络帐号,开始上网下棋,匿名挑战全世界高手。这是AlphaGo Master诞生之始。
在演讲现场黄士杰秀出当时的照片,他当时就在自己的房间,桌上放一碗面,不断下棋,一天要下十盘。注意力要很集中,十分疲累。
刚开始因为黄士杰用的是新帐号,没有职业棋士愿意和这个无名小卒下棋,但没想到他一出手就所向披靡,第二天开始,变成许多人登门挑战。
“当时压力很大,很怕点错,或者网路断线,AlphaGo不能因为我输掉啊,”黄士杰说。当时Master每一盘都赢,下了六十盘,胜率高达95%,高到黄士杰和团队一度以为是bug。
用这个新版软件,今年5月和世界棋王柯洁九段在中国乌镇对奕。Master毫无意外的完胜。
“但这是一次人机共同探索,AI是人类的工具不是威胁,”黄士杰也强调,这套深期度学习加上强化学习的价值网络,就是AlphaGo Zero的理论。
这段AlphaGo旅程,对一名台湾土生土长,站上世界科学舞台的工程师而言,简直像“爱丽丝梦游仙境”。
然而,业界的人都等著看,围棋界已无对手的AlphaGo,接下来能否在其他产业大展身手?
AlphaGo母公司DeepMind创办人兼执行长德米斯也宣布,AlphaGo功成身退,不再比赛。
部份业者甚至持保留意见。例如,一位微软研发主管接受《天下》采访时,便酸溜溜的说,“微软做AI是拿来用的,谷歌做AlphaGo是拿来吹牛的。”他认为,当年IBM的超级电脑深蓝,打败西洋棋棋王后,因为找不到应用,团队最终解散。负责人许峰雄最后甚至离开了IBM。
而脸书人工智能实验室负责人、纽约大学终生教授Yann Lecun也曾质疑,AlphaGo可能很难应用到自驾车等热门领域。
“我们尊重他的看法,我们没有说它(AlphaGo)可以马上用到其他领域,但它可以逐渐用到其他领域,”一位听众转述Yann Lecun的质疑时,年轻的黄士杰回答得很小心翼翼。
“AlphaGo Zero主要目标就是证明不需要人类知识,也可以学习的很强。”黄士杰接下来自信的说,“我们要跟大家说,那是有可能的。”
AlphaGo Zero拿掉之前累积的人类智慧,让AlphaGo了解围棋最基本的规则。单靠机器的深度学习和强化学习。一切从零开始。
可说就是人类创造的智慧打败人类智慧与人类直觉。
“最差的状况也就不过就是IBM当年的状况,但我不认为AlphaGo会到最坏的状况,”清大电机系助理教授孙民说。
从应用的角度来看,孙民认为,只要在虚拟世界中可以虚拟的状况,AlphaGo Zero都可以做。譬如建筑设计可以虚拟设计就可以在虚拟环境中测试,硬件测试可以用这样的工具设计出好的芯片。
这和过去的虚拟3D设计有何不同? “不同就在以前都是人去测试,虚拟软体告诉你虚拟后的结果,但改model还是人,硬体设计还是人,”孙民分析, “AlphaGo Zero 不需要人,只要告诉我规则和你要的结果, 不需要一个专家或者建筑师力学高手, chip设计师, 就可以做出来,”他说。
当然这都还是在虚拟世界中的功能,孙民认为如果在一个环境会变异的实体世界,AlphaGo就还有很多问题需要课服。但可以期待未来的应用与发展。
“我每天上班,每天都在进步,非常愉快,我们团队的精神很强,有个远大的目标,”在DeepMind人称“Aja,阿杰”的黄士杰说。
迪米斯创立Deepmind时,想要做的是通用、强人工智能。AlphaGo还只是一个弱人工智能,还没有到达什么都能学的境界。
或许现在也才迈入人工智能启蒙期的结束,AlphaGo的退役,是另一个新的开始。
“这五年,我也没有想过会做出AlphaGo,团队的精神很强,有个远大的目标。”AlphaGo首席工程师黄士杰语说。
十一月十日,中研院人文馆“人工智能年会”大会议室已经挤满人。这天是全球人工智能AI象征“AlphaGo”幕后重要操盘手,黄士杰衣锦返乡的日子。他是DeepMind里头,除了两位创办人之外,唯一可对外代表公司发言的主管。这也是2012年加入DeepMind的黄士杰,第一次公开演讲。
回想起两个月前的最新突破,身为DeepMind第四十号员工的黄士杰,忍不住兴奋与激动。该公司投稿《自然》杂志上的论文,揭露AlphaGO的终极版“AlphaGo Zero”,不再靠人类围棋知识,就是让Zero只了解围棋最基本的规则,自己跟自己左右互奕,从彻底乱下开始,短短四十天,对上曾打败世界棋王柯洁的旧版Master,已经有超过九成的胜率,打败围棋软件累积十年的历程。
刚开始时,黄士杰认为Zero绝对赢不了Master。因为他再怎么想,都想不到如何让一个程序从零开始学,可以一夕之间赢得了花了十年研发的围棋软件?
但Zero进步神速,“三天就走过围棋几千年的历史”,让黄士杰大为吃惊。但更令人吃惊的在后头,Zero训练到21天时,就达到Master的水准,到第40天,就超越了Master。
身为业余六段棋士,把自己十几年在围棋上的研究拿掉,黄士杰自己有什么感觉?
“如果我阻碍了它,我应该被拿掉,AlphaGo知识中有99%是我做的,那是从师大的研究到现在,这是一个很好的收尾,”黄士杰坦言自己心情很复杂。
DeepMind创办人迪米斯已经和黄士杰说,AlphaGo完成任务了,“我们要往前看”。
黄士杰还记得2016年底西方同事们都准备要过年了。他刚回到台湾,迪米斯立刻要他低调地去申请网络帐号,开始上网下棋,匿名挑战全世界高手。这是AlphaGo Master诞生之始。
在演讲现场黄士杰秀出当时的照片,他当时就在自己的房间,桌上放一碗面,不断下棋,一天要下十盘。注意力要很集中,十分疲累。
刚开始因为黄士杰用的是新帐号,没有职业棋士愿意和这个无名小卒下棋,但没想到他一出手就所向披靡,第二天开始,变成许多人登门挑战。
“当时压力很大,很怕点错,或者网路断线,AlphaGo不能因为我输掉啊,”黄士杰说。当时Master每一盘都赢,下了六十盘,胜率高达95%,高到黄士杰和团队一度以为是bug。
用这个新版软件,今年5月和世界棋王柯洁九段在中国乌镇对奕。Master毫无意外的完胜。
“但这是一次人机共同探索,AI是人类的工具不是威胁,”黄士杰也强调,这套深期度学习加上强化学习的价值网络,就是AlphaGo Zero的理论。
这段AlphaGo旅程,对一名台湾土生土长,站上世界科学舞台的工程师而言,简直像“爱丽丝梦游仙境”。
然而,业界的人都等著看,围棋界已无对手的AlphaGo,接下来能否在其他产业大展身手?
AlphaGo母公司DeepMind创办人兼执行长德米斯也宣布,AlphaGo功成身退,不再比赛。
部份业者甚至持保留意见。例如,一位微软研发主管接受《天下》采访时,便酸溜溜的说,“微软做AI是拿来用的,谷歌做AlphaGo是拿来吹牛的。”他认为,当年IBM的超级电脑深蓝,打败西洋棋棋王后,因为找不到应用,团队最终解散。负责人许峰雄最后甚至离开了IBM。
而脸书人工智能实验室负责人、纽约大学终生教授Yann Lecun也曾质疑,AlphaGo可能很难应用到自驾车等热门领域。
“我们尊重他的看法,我们没有说它(AlphaGo)可以马上用到其他领域,但它可以逐渐用到其他领域,”一位听众转述Yann Lecun的质疑时,年轻的黄士杰回答得很小心翼翼。
“AlphaGo Zero主要目标就是证明不需要人类知识,也可以学习的很强。”黄士杰接下来自信的说,“我们要跟大家说,那是有可能的。”
AlphaGo Zero拿掉之前累积的人类智慧,让AlphaGo了解围棋最基本的规则。单靠机器的深度学习和强化学习。一切从零开始。
可说就是人类创造的智慧打败人类智慧与人类直觉。
“最差的状况也就不过就是IBM当年的状况,但我不认为AlphaGo会到最坏的状况,”清大电机系助理教授孙民说。
从应用的角度来看,孙民认为,只要在虚拟世界中可以虚拟的状况,AlphaGo Zero都可以做。譬如建筑设计可以虚拟设计就可以在虚拟环境中测试,硬件测试可以用这样的工具设计出好的芯片。
这和过去的虚拟3D设计有何不同? “不同就在以前都是人去测试,虚拟软体告诉你虚拟后的结果,但改model还是人,硬体设计还是人,”孙民分析, “AlphaGo Zero 不需要人,只要告诉我规则和你要的结果, 不需要一个专家或者建筑师力学高手, chip设计师, 就可以做出来,”他说。
当然这都还是在虚拟世界中的功能,孙民认为如果在一个环境会变异的实体世界,AlphaGo就还有很多问题需要课服。但可以期待未来的应用与发展。
“我每天上班,每天都在进步,非常愉快,我们团队的精神很强,有个远大的目标,”在DeepMind人称“Aja,阿杰”的黄士杰说。
迪米斯创立Deepmind时,想要做的是通用、强人工智能。AlphaGo还只是一个弱人工智能,还没有到达什么都能学的境界。
或许现在也才迈入人工智能启蒙期的结束,AlphaGo的退役,是另一个新的开始。
评论: 0 | 引用: 0 | 查看次数: -
发表评论