日 报
周 报杂 志往期回顾
分类检索 返回目录
阿尔法狗之父,低调的天才 在赢得“事关人类命运”的一战后,哈萨比斯说:“我们只爬上了人工智能梯子的第一级”
□ 本刊驻英国特约记者 杨扬 《 环球人物 》()
3月15日,在全世界媒体的聚光灯下,机器人阿尔法狗(即AlphaGo)的创造者戴密斯·哈萨比斯,与韩国围棋九段李世石微笑握手,留下人类历史上颇具意义的一个瞬间。
过去20年间,计算机已战胜过中国象棋和国际象棋的顶尖高手,围棋被视为人类最后的智力自留地。从计算量上来说,围棋的难度平均是国际象棋的1亿倍。
当阿尔法狗以4:1赢得这场“事关人类命运”的一战,全世界的情绪都被搅动了起来:有人为人工智能的飞速进步欢欣鼓舞,也有人担忧未来地球将被机器人控制。而这一切背后的那个人——哈萨比斯,仍然低调地沉溺于他自己的世界。他说: “看到人工智能这个深奥难懂的事情成为人人都关注的话题,这很有趣。”
阿尔法狗如何做到像人一样“聪明”
对这场比赛,哈萨比斯超级期待,他甚至在正式比赛开始前,和谷歌前CEO埃里克·施密特分别坐在阿尔法狗和李世石的座位上下了一局。
3月9日,在首尔四季酒店,大战终于开幕。第一局中,阿尔法狗一度不断吃亏,直到150手深入李世石的领地,宣告了棋局的胜利。对此,李世石十分意外。哈萨比斯也为阿尔法狗的侵略性和大胆感到意外。“李世石以好战闻名,比赛一开始,他就在整个棋盘上求战,但是没有一处是真的;而阿尔法狗也戏耍了李世石。传统的围棋程序在局域计算中并不差,但是在需要通盘视野的时候会很无力。”
每天赛况一出,哈萨比斯都会在推特上发表感想。他一边为自己的团队感到骄傲,一边为顽强的李世石喝彩。当李世石在第四局中赢了阿尔法狗之后,他发文说:“祝贺!今天他的表现太精彩了,把阿尔法狗逼入死地。”当第五局结束之后,哈萨比斯评论说:“世界上最不可置信的游戏结束了,这必将进入历史!”
阿尔法狗是如何做到像人一样“聪明”的?首先,它的核心系统是,机器学习与神经系统科学这两个领域结合起来开发的学习算法;其次,它在谷歌强大的云计算系统中,通过大量数据分析学习了3000多万步的职业棋手棋谱,再通过增强学习的方法自我博弈,寻找比基础棋谱更好的棋路。这让它有了类似人脑的功能:庞大数据库;自我学习,找到更好的解决方法;局面判断准确率接近80%。
从资深游戏迷到远离游戏
走出聚光灯的哈萨比斯,是个再普通不过的上班族。每晚他从伦敦国王十字车站搭地铁回家,那是位于海格特、背靠山顶公园的一处房子。小小的玻璃门廊、粗糙质感的白墙,门前的街道很幽静。无论多忙,他都会与家人共进晚餐,他的妻子是一名来自意大利的分子生物学家,两个儿子一个7岁,一个9岁。晚饭后,他陪着儿子玩耍、读书,哄他们上床睡觉。
这里离哈萨比斯儿时的住处也不远,在那里有很多美好的回忆。他从小就天赋异禀:4岁迷上国际象棋,两周后就赢了爸爸;6岁获得伦敦8岁以下锦标赛冠军;9岁成为英国11岁以下国家象棋队队长;13岁取得了“国际象棋大师”头衔。
1984年,8岁的哈萨比斯用自己赢得的奖金买了台计算机,“这种机器是我们脑力的延伸。通过它们,我可以创造出比按部就班的日常生活更令人兴奋的东西。”哈萨比斯开始自学编程,因为没什么零用钱,有一个夏天,他一直流连在报刊亭,翻阅买不起的计算机类杂志。
哈萨比斯的父亲是希腊裔塞浦路斯人,母亲则是华裔新加坡人,两人都是教师,而且都是“现代技术恐惧者”。但对于这个整日沉迷于游戏的孩子,他们一点也不担心,还兴致勃勃地听他分享心得。
高中毕业后,哈萨比斯就被视频游戏公司“牛蛙”的老板看中,去做游戏开发。1994年,他开发的《主题公园》——最早包含人工智能元素的游戏之一,一发布就销售了数百万份。但到了1997年,他开发的《共和:革命》《邪恶天才》市场表现却很一般。这让哈萨比斯开始反思,“90年代,游戏很有趣,也有创新性。但到了新世纪,游戏注重图像和内容,想通过游戏这扇‘后门’去展开人工智能研究已经非常困难,这违背了我做游戏的初衷。”
从此,哈萨比斯这个资深游戏迷远离了游戏,甚至对现在大型多人游戏感觉失望。“我从来都无法真正融入游戏,因为虚拟人物看起来傻傻的。他们没有记忆,不会改变,也与环境无关。如果有学习型人工智能,游戏质量就能提升到新水平。”
21世纪的“阿波罗工程”
雄心勃勃的哈萨比斯想创造一个通用人工智能系统。在他看来,从智能语音助手Siri到人脸识别系统,这些预设好程序的软件只能掌握某项特定技能,属于弱人工智能。而通用人工智能系统与以往技术最大区别在于自学能力,它可以从零学起,掌握任何技能,“就好像和人类做得一样”,他称之为21世纪的“阿波罗工程”。
2005年,哈萨比斯重返校园,到伦敦大学攻读认知神经科学博士学位。“在游戏行业,我做了能做的所有一切,在成立‘深度思维’之前我需要收集好必要的信息,这就是神经科学——我希望从大脑解决问题的方式中获得灵感。”他选择研究海马体,海马体是人脑中主要负责记忆和学习的部位,短期记忆都储存其中。
哈萨比斯说,当时自己“对大脑的唯一了解就是它是个壳”。仅仅两年后,他就开创性地发现海马体和情景记忆间的联系。他证明了因为海马体受伤而患上健忘症的人,在畅想未来的时候也有障碍,因此提出:大脑中与过去的记忆有关的部分,在规划未来的时候也同样至关重要。这项研究结果被《科学》杂志列入“年度十大突破”。
2010年,哈萨比斯与发小穆斯塔法·苏莱曼、人工智能专家谢恩·莱格一起创办了“深度思维”公司。公司一创立就引起了许多大佬注意,包括特斯拉创始人伊隆·马斯克,2012年他投资了650万美元。除了通用人工智能这个大方向,“深度思维”到底在干什么,大家都不清楚。
2013年12月,“深度思维”的第一次公开亮相震惊了众人。在美国加州和内华达州交界的太浩湖畔,“深度思维”向公众展示了一款软件。这款软件并没有被编入“如何玩游戏”的指令,但通过控制键盘,观察显示器分数,经过反复试错之后,成为了一个专业级游戏高手。这证明软件可以通过神经模拟网络处理数据,像人脑一样“本能地”学习。加州大学伯克利分校人工智能专家斯图尔特·罗素感叹道:“人们根本没有想到当今的技术能达到这种水平。” 谷歌CEO拉里·佩奇也不吝赞美,这是“我多年以来见过的最惊人技术之一”。
谷歌花4亿英镑买下“深度思维”
一向对于人工智能嗅觉灵敏的谷歌,看到“深度思维”这匹黑马如何能不动心?2014年1月,谷歌完成了在欧洲最大的一笔收购,以4亿英镑(1英镑约合9.3元人民币)将“深度思维”纳入麾下,尽管当时后者尚未实现商业盈利。之后,谷歌应哈萨比斯的要求设立了道德监察委员会,制定一系列限制条款,以确保人工智能技术不会被滥用。被收购后,哈萨比斯说:“这是20年精心计划的结果。我教育经历中的每一步,我为团队雇佣的每一个人,都是为了这一天的到来。”这听起来有点像一场漫长对弈中走出的一招妙棋。
在哈萨比斯的坚持下,“深度思维”依旧留在了伦敦,而不是搬到加州山景城的谷歌总部或者其他地方。“我在北伦敦出生并长大,我非常喜欢这座城市。” 他依旧是个超级工作狂。每天,他都要工作到夜里11点多;当午夜时分到来时,他开始了所谓的“第二天”,与美国的同事进行电话会议,一直到1点多;这之后才是他自己的思考时间,通常会持续到凌晨三四点。
“深度思维”原来有50名员工,现在有来自全球45个国家的近200人,占据了伦敦国王十字车站附近一栋6层大楼。每间办公室都以天才来命名:特斯拉、拉马努詹、柏拉图、费曼、亚里士多德、居里夫人。一楼有咖啡厅和会客室,桌上足球游戏机、懒人沙发等更是一应俱全。楼顶还有露台,可以观赏伦敦风景,每周五晚的楼顶聚会已成惯例。公司还有跑步协会、足球队、棋类协会。虽然互联网行业人员流动很大,对手公司也试图来挖墙脚,但“深度思维”从创建起离职率一直为零。看来,哈萨比斯把自己对人脑的理解,不但用到了开发人工智能上,也完美地用到了企业管理上。
继人工智能开发、企业发展之后,哈萨比斯还要回答第三个问题:人工智能的安全性。在阿尔法狗战胜李世石后,人们尤为关注这个问题。“人工智能距离人脑的水平仍有几十年的差距,我们才爬上了梯子的第一级。技术本身是中立的,但会受到设计者价值观的影响,因此我们要非常谨慎地思考价值观问题。”在哈萨比斯看来,说到底,这还是人类自身的问题。
人工智能关键词
图灵测试
1950年,阿兰·图灵发表论文《机器能思考吗》,设计了图灵测试,若超过30%的人无法在5分钟内分辨出交谈对象是人或机器,则认为该机器具有“思考”的能力。这一标准沿用至今。
“人工智能”诞生
1956年,美国达特茅斯电脑大会上,麦卡锡首次提出“人工智能”这个术语,学者们就其基础问题展开讨论,标志着人工智能这门新兴学科的诞生。会后,美国形成了3个人工智能研究中心,卡内基—梅隆大学、麻省理工学院、IBM公司。
商业化
1983年“思考机器”公司诞生后,人工智能开始向商业化进发。90年代,人工智能技术在教育、游戏软件等方面有了长足发展。2011年以来,人工智能领域获得数十亿美元风投。谷歌不惜重金,研发出智能眼镜、自动驾驶汽车等。
奇点理论
2005年,美国未来学家雷·库兹韦尔提出:2045年奇点来临,人工智能将完全超越人类智能,引发了人们对于人工智能安全性的思考。
人机大战
1997年,电脑“深蓝”击败了国际象棋冠军卡斯帕罗夫。2016年3月,阿尔法狗战胜李世石。
专家点评
人类的胜利
□ 吴军
在同世界著名选手李世石的对局中,阿尔法狗以4:1取胜,成为第一个战胜围棋世界冠军的机器人,这是继1997年IBM深蓝战胜卡斯帕罗夫后,人类在机器智能领域取得的又一个里程碑式胜利。
从计算机发展的角度看,智能机器在所有棋类战胜人类其实只是一个时间问题,因为机器运算能力的提升是指数增长的,而人类智力能线性增长就不错了。因此一定存在一个时间点——智能机器战胜人类智力,只是这个时间点比预期中早了10年。
计算机之所以能战胜人类,是因为机器获得智能的方式和人类不同,它不是靠逻辑推理,而是靠计算。这里面有两个关键的技术,首先是一整套把棋盘上当前的状态变成一个获胜概率的数学模型,当然,这件事没有大数据是做不到的。阿尔法狗在短短的时间里学习了几十万盘人类对弈,才训练出非常有效的数学模型。我的一位同事打开下棋的程序,想看看能否通过研究那些程序提高棋艺,完全没可能,里面是一堆莫名其妙的、被仔细调整的参数。
第二个关键技术是启发式搜索算法Beam Search(集束搜索),它能精准搜索最佳走法。国际象棋在每种状态下有5到10种合理走法,如果计算机往前考虑10步,这个搜索空间是100亿,因此计算机不能穷举所有的可能性,而要根据从以往对弈中学来的知识,比较准确地聚焦在一个宽度有限的空间,这就像光束一样,因此叫做Beam Search。围棋的走法每一步都多出大约一个数量级,如果往后看个十几步,那将是指数爆炸式增长。尽管今天的计算机比20年前能力提升了上万倍,而且谷歌数据中心的服务器数量远比当年IBM深蓝里的处理器多得多,但是如果没有好的搜索算法,根本无法在很短的时间里算出最佳行棋步骤。因此,下围棋既可以说是一个机器智能的问题,也可以说是一个大数据和算法的问题。
按照阿尔法狗在过去几个月里的进步速度,只要谷歌愿意继续投入,估计一年内任何人类的围棋高手都无法和它过招了——计算机在一个新的领域全面超越人类。在这个过程中,很多计算机科学家和工程师为此做出了巨大的贡献,他们是我们文明的缔造者。因此阿尔法狗的胜利,实际上是计算机科学家的胜利,也是人类的胜利。
阿尔法狗无论是在训练模型时,还是在下棋事所采用的算法,都是几十年前大家就已经知道的机器学习和博弈树搜索算法。谷歌所做的工作是让这些算法能够在上万台甚至上百万台服务器上并行运行,这就使得计算机解决智能问题的能力有了本质的提高。这些算法并非是专门针对下棋而设计的,很多已经在其他智能应用的领域(比如语音识别、机器翻译、图像识别和大数据医疗)获得了成功。阿尔法狗成功的意义不仅在于它标志着机器智能的水平达到了一个新的台阶,还在于计算机可以解决更多的智能问题。
今天,计算机已经开始完成很多过去必须用人的智力才能够完成的任务,比如医疗诊断,阅读和处理文件,自动回答问题,书写新闻稿和驾驶汽车等等。
阿尔法狗的获胜让一些不了解机器智能的人开始杞人忧天,担心机器在未来能够控制人类。这种担心是不必要的,因为阿尔法狗的灵魂是计算机科学家为它编写的程序。
机器不会控制人类,但是制造智能机器的人可以。而科技在人类进步中总是扮演着最活跃最革命的角色,它的发展是无法阻止的,我们能做的是面对现实,抓住智能革命的机遇,而不是回避它、否定它和阻止它。未来的社会,属于那些具有创意的人,包括计算机科学家,而不属于掌握某种技能做重复性工作的人。
(作者为著名语言处理和搜索专家,硅谷风险投资人,著有《数学之美》《浪潮之巅》《文明之光》《大学之路》。)
返回目录 下一篇
3月15日,在全世界媒体的聚光灯下,机器人阿尔法狗(即AlphaGo)的创造者戴密斯·哈萨比斯,与韩国围棋九段李世石微笑握手,留下人类历史上颇具意义的一个瞬间。
过去20年间,计算机已战胜过中国象棋和国际象棋的顶尖高手,围棋被视为人类最后的智力自留地。从计算量上来说,围棋的难度平均是国际象棋的1亿倍。
当阿尔法狗以4:1赢得这场“事关人类命运”的一战,全世界的情绪都被搅动了起来:有人为人工智能的飞速进步欢欣鼓舞,也有人担忧未来地球将被机器人控制。而这一切背后的那个人——哈萨比斯,仍然低调地沉溺于他自己的世界。他说: “看到人工智能这个深奥难懂的事情成为人人都关注的话题,这很有趣。”
阿尔法狗如何做到像人一样“聪明”
对这场比赛,哈萨比斯超级期待,他甚至在正式比赛开始前,和谷歌前CEO埃里克·施密特分别坐在阿尔法狗和李世石的座位上下了一局。
3月9日,在首尔四季酒店,大战终于开幕。第一局中,阿尔法狗一度不断吃亏,直到150手深入李世石的领地,宣告了棋局的胜利。对此,李世石十分意外。哈萨比斯也为阿尔法狗的侵略性和大胆感到意外。“李世石以好战闻名,比赛一开始,他就在整个棋盘上求战,但是没有一处是真的;而阿尔法狗也戏耍了李世石。传统的围棋程序在局域计算中并不差,但是在需要通盘视野的时候会很无力。”
每天赛况一出,哈萨比斯都会在推特上发表感想。他一边为自己的团队感到骄傲,一边为顽强的李世石喝彩。当李世石在第四局中赢了阿尔法狗之后,他发文说:“祝贺!今天他的表现太精彩了,把阿尔法狗逼入死地。”当第五局结束之后,哈萨比斯评论说:“世界上最不可置信的游戏结束了,这必将进入历史!”
阿尔法狗是如何做到像人一样“聪明”的?首先,它的核心系统是,机器学习与神经系统科学这两个领域结合起来开发的学习算法;其次,它在谷歌强大的云计算系统中,通过大量数据分析学习了3000多万步的职业棋手棋谱,再通过增强学习的方法自我博弈,寻找比基础棋谱更好的棋路。这让它有了类似人脑的功能:庞大数据库;自我学习,找到更好的解决方法;局面判断准确率接近80%。
从资深游戏迷到远离游戏
走出聚光灯的哈萨比斯,是个再普通不过的上班族。每晚他从伦敦国王十字车站搭地铁回家,那是位于海格特、背靠山顶公园的一处房子。小小的玻璃门廊、粗糙质感的白墙,门前的街道很幽静。无论多忙,他都会与家人共进晚餐,他的妻子是一名来自意大利的分子生物学家,两个儿子一个7岁,一个9岁。晚饭后,他陪着儿子玩耍、读书,哄他们上床睡觉。
这里离哈萨比斯儿时的住处也不远,在那里有很多美好的回忆。他从小就天赋异禀:4岁迷上国际象棋,两周后就赢了爸爸;6岁获得伦敦8岁以下锦标赛冠军;9岁成为英国11岁以下国家象棋队队长;13岁取得了“国际象棋大师”头衔。
1984年,8岁的哈萨比斯用自己赢得的奖金买了台计算机,“这种机器是我们脑力的延伸。通过它们,我可以创造出比按部就班的日常生活更令人兴奋的东西。”哈萨比斯开始自学编程,因为没什么零用钱,有一个夏天,他一直流连在报刊亭,翻阅买不起的计算机类杂志。
哈萨比斯的父亲是希腊裔塞浦路斯人,母亲则是华裔新加坡人,两人都是教师,而且都是“现代技术恐惧者”。但对于这个整日沉迷于游戏的孩子,他们一点也不担心,还兴致勃勃地听他分享心得。
高中毕业后,哈萨比斯就被视频游戏公司“牛蛙”的老板看中,去做游戏开发。1994年,他开发的《主题公园》——最早包含人工智能元素的游戏之一,一发布就销售了数百万份。但到了1997年,他开发的《共和:革命》《邪恶天才》市场表现却很一般。这让哈萨比斯开始反思,“90年代,游戏很有趣,也有创新性。但到了新世纪,游戏注重图像和内容,想通过游戏这扇‘后门’去展开人工智能研究已经非常困难,这违背了我做游戏的初衷。”
从此,哈萨比斯这个资深游戏迷远离了游戏,甚至对现在大型多人游戏感觉失望。“我从来都无法真正融入游戏,因为虚拟人物看起来傻傻的。他们没有记忆,不会改变,也与环境无关。如果有学习型人工智能,游戏质量就能提升到新水平。”
21世纪的“阿波罗工程”
雄心勃勃的哈萨比斯想创造一个通用人工智能系统。在他看来,从智能语音助手Siri到人脸识别系统,这些预设好程序的软件只能掌握某项特定技能,属于弱人工智能。而通用人工智能系统与以往技术最大区别在于自学能力,它可以从零学起,掌握任何技能,“就好像和人类做得一样”,他称之为21世纪的“阿波罗工程”。
2005年,哈萨比斯重返校园,到伦敦大学攻读认知神经科学博士学位。“在游戏行业,我做了能做的所有一切,在成立‘深度思维’之前我需要收集好必要的信息,这就是神经科学——我希望从大脑解决问题的方式中获得灵感。”他选择研究海马体,海马体是人脑中主要负责记忆和学习的部位,短期记忆都储存其中。
哈萨比斯说,当时自己“对大脑的唯一了解就是它是个壳”。仅仅两年后,他就开创性地发现海马体和情景记忆间的联系。他证明了因为海马体受伤而患上健忘症的人,在畅想未来的时候也有障碍,因此提出:大脑中与过去的记忆有关的部分,在规划未来的时候也同样至关重要。这项研究结果被《科学》杂志列入“年度十大突破”。
2010年,哈萨比斯与发小穆斯塔法·苏莱曼、人工智能专家谢恩·莱格一起创办了“深度思维”公司。公司一创立就引起了许多大佬注意,包括特斯拉创始人伊隆·马斯克,2012年他投资了650万美元。除了通用人工智能这个大方向,“深度思维”到底在干什么,大家都不清楚。
2013年12月,“深度思维”的第一次公开亮相震惊了众人。在美国加州和内华达州交界的太浩湖畔,“深度思维”向公众展示了一款软件。这款软件并没有被编入“如何玩游戏”的指令,但通过控制键盘,观察显示器分数,经过反复试错之后,成为了一个专业级游戏高手。这证明软件可以通过神经模拟网络处理数据,像人脑一样“本能地”学习。加州大学伯克利分校人工智能专家斯图尔特·罗素感叹道:“人们根本没有想到当今的技术能达到这种水平。” 谷歌CEO拉里·佩奇也不吝赞美,这是“我多年以来见过的最惊人技术之一”。
谷歌花4亿英镑买下“深度思维”
一向对于人工智能嗅觉灵敏的谷歌,看到“深度思维”这匹黑马如何能不动心?2014年1月,谷歌完成了在欧洲最大的一笔收购,以4亿英镑(1英镑约合9.3元人民币)将“深度思维”纳入麾下,尽管当时后者尚未实现商业盈利。之后,谷歌应哈萨比斯的要求设立了道德监察委员会,制定一系列限制条款,以确保人工智能技术不会被滥用。被收购后,哈萨比斯说:“这是20年精心计划的结果。我教育经历中的每一步,我为团队雇佣的每一个人,都是为了这一天的到来。”这听起来有点像一场漫长对弈中走出的一招妙棋。
在哈萨比斯的坚持下,“深度思维”依旧留在了伦敦,而不是搬到加州山景城的谷歌总部或者其他地方。“我在北伦敦出生并长大,我非常喜欢这座城市。” 他依旧是个超级工作狂。每天,他都要工作到夜里11点多;当午夜时分到来时,他开始了所谓的“第二天”,与美国的同事进行电话会议,一直到1点多;这之后才是他自己的思考时间,通常会持续到凌晨三四点。
“深度思维”原来有50名员工,现在有来自全球45个国家的近200人,占据了伦敦国王十字车站附近一栋6层大楼。每间办公室都以天才来命名:特斯拉、拉马努詹、柏拉图、费曼、亚里士多德、居里夫人。一楼有咖啡厅和会客室,桌上足球游戏机、懒人沙发等更是一应俱全。楼顶还有露台,可以观赏伦敦风景,每周五晚的楼顶聚会已成惯例。公司还有跑步协会、足球队、棋类协会。虽然互联网行业人员流动很大,对手公司也试图来挖墙脚,但“深度思维”从创建起离职率一直为零。看来,哈萨比斯把自己对人脑的理解,不但用到了开发人工智能上,也完美地用到了企业管理上。
继人工智能开发、企业发展之后,哈萨比斯还要回答第三个问题:人工智能的安全性。在阿尔法狗战胜李世石后,人们尤为关注这个问题。“人工智能距离人脑的水平仍有几十年的差距,我们才爬上了梯子的第一级。技术本身是中立的,但会受到设计者价值观的影响,因此我们要非常谨慎地思考价值观问题。”在哈萨比斯看来,说到底,这还是人类自身的问题。
人工智能关键词
图灵测试
1950年,阿兰·图灵发表论文《机器能思考吗》,设计了图灵测试,若超过30%的人无法在5分钟内分辨出交谈对象是人或机器,则认为该机器具有“思考”的能力。这一标准沿用至今。
“人工智能”诞生
1956年,美国达特茅斯电脑大会上,麦卡锡首次提出“人工智能”这个术语,学者们就其基础问题展开讨论,标志着人工智能这门新兴学科的诞生。会后,美国形成了3个人工智能研究中心,卡内基—梅隆大学、麻省理工学院、IBM公司。
商业化
1983年“思考机器”公司诞生后,人工智能开始向商业化进发。90年代,人工智能技术在教育、游戏软件等方面有了长足发展。2011年以来,人工智能领域获得数十亿美元风投。谷歌不惜重金,研发出智能眼镜、自动驾驶汽车等。
奇点理论
2005年,美国未来学家雷·库兹韦尔提出:2045年奇点来临,人工智能将完全超越人类智能,引发了人们对于人工智能安全性的思考。
人机大战
1997年,电脑“深蓝”击败了国际象棋冠军卡斯帕罗夫。2016年3月,阿尔法狗战胜李世石。
专家点评
人类的胜利
□ 吴军
在同世界著名选手李世石的对局中,阿尔法狗以4:1取胜,成为第一个战胜围棋世界冠军的机器人,这是继1997年IBM深蓝战胜卡斯帕罗夫后,人类在机器智能领域取得的又一个里程碑式胜利。
从计算机发展的角度看,智能机器在所有棋类战胜人类其实只是一个时间问题,因为机器运算能力的提升是指数增长的,而人类智力能线性增长就不错了。因此一定存在一个时间点——智能机器战胜人类智力,只是这个时间点比预期中早了10年。
计算机之所以能战胜人类,是因为机器获得智能的方式和人类不同,它不是靠逻辑推理,而是靠计算。这里面有两个关键的技术,首先是一整套把棋盘上当前的状态变成一个获胜概率的数学模型,当然,这件事没有大数据是做不到的。阿尔法狗在短短的时间里学习了几十万盘人类对弈,才训练出非常有效的数学模型。我的一位同事打开下棋的程序,想看看能否通过研究那些程序提高棋艺,完全没可能,里面是一堆莫名其妙的、被仔细调整的参数。
第二个关键技术是启发式搜索算法Beam Search(集束搜索),它能精准搜索最佳走法。国际象棋在每种状态下有5到10种合理走法,如果计算机往前考虑10步,这个搜索空间是100亿,因此计算机不能穷举所有的可能性,而要根据从以往对弈中学来的知识,比较准确地聚焦在一个宽度有限的空间,这就像光束一样,因此叫做Beam Search。围棋的走法每一步都多出大约一个数量级,如果往后看个十几步,那将是指数爆炸式增长。尽管今天的计算机比20年前能力提升了上万倍,而且谷歌数据中心的服务器数量远比当年IBM深蓝里的处理器多得多,但是如果没有好的搜索算法,根本无法在很短的时间里算出最佳行棋步骤。因此,下围棋既可以说是一个机器智能的问题,也可以说是一个大数据和算法的问题。
按照阿尔法狗在过去几个月里的进步速度,只要谷歌愿意继续投入,估计一年内任何人类的围棋高手都无法和它过招了——计算机在一个新的领域全面超越人类。在这个过程中,很多计算机科学家和工程师为此做出了巨大的贡献,他们是我们文明的缔造者。因此阿尔法狗的胜利,实际上是计算机科学家的胜利,也是人类的胜利。
阿尔法狗无论是在训练模型时,还是在下棋事所采用的算法,都是几十年前大家就已经知道的机器学习和博弈树搜索算法。谷歌所做的工作是让这些算法能够在上万台甚至上百万台服务器上并行运行,这就使得计算机解决智能问题的能力有了本质的提高。这些算法并非是专门针对下棋而设计的,很多已经在其他智能应用的领域(比如语音识别、机器翻译、图像识别和大数据医疗)获得了成功。阿尔法狗成功的意义不仅在于它标志着机器智能的水平达到了一个新的台阶,还在于计算机可以解决更多的智能问题。
今天,计算机已经开始完成很多过去必须用人的智力才能够完成的任务,比如医疗诊断,阅读和处理文件,自动回答问题,书写新闻稿和驾驶汽车等等。
阿尔法狗的获胜让一些不了解机器智能的人开始杞人忧天,担心机器在未来能够控制人类。这种担心是不必要的,因为阿尔法狗的灵魂是计算机科学家为它编写的程序。
机器不会控制人类,但是制造智能机器的人可以。而科技在人类进步中总是扮演着最活跃最革命的角色,它的发展是无法阻止的,我们能做的是面对现实,抓住智能革命的机遇,而不是回避它、否定它和阻止它。未来的社会,属于那些具有创意的人,包括计算机科学家,而不属于掌握某种技能做重复性工作的人。