您当前的位置: 首页 > 科技网络

最强起底“阿尔法狗”前世今生 后世的创业狗们加油

2017-07-22 14:36:47

  摘要:伦敦国王10字车站后的1座6层大楼里,就是精英会聚的DeepMind总部,人们安静地进行计算,朝着DeepMind的210年发展大计前进。

DeepMind伦敦总部。

  DeepMind伦敦总部。

  钛媒体注:在周24:1击败李世石以后,韩国棋院给AlphaGo(阿尔法狗)颁发了1张名誉9段证书,并且给出了1个让人瞠目的世界排名——世界第2,仅次于柯洁,积分也仅比柯洁的3621分少了35分而已。

  20年前,1997年5月11日,IBM的电脑“深蓝”在6轮比赛中以2胜1负3平的成绩打败了当时的国际象棋冠军卡斯帕罗夫,这1新闻席卷了当时的各大报纸头条。许多人工智能专家预言,电脑在围棋比赛中也能够打败人类,但最少得等到几10年以后。

  而今恍如历史重演,AlphaGo(下文均称阿尔法狗)打败世界围棋冠军李世石的报导又遮天蔽日而来,但这次明显更让人们震惊,由于才过去短短20年,阿尔法狗就在人们公认的最复杂的棋类游戏中以4:1的成绩克服了韩国围棋第1人。(你说还有我朝国粹麻将?亲爱的你真是钛弄了。)

  不管下1战结果如何,阿尔法狗也都已写入传奇。它究竟是谁,它是如何诞生的,如何长大的,它有缺点吗,它的缔造者又是谁,后阿尔法狗时期,它又将给创业狗们带来多少机会,钛媒体英文团队用时多日,深度发掘,起底这只让人类惶惶不安的“阿尔法狗”。

  1家人材会聚的公司

  在伦敦国王10字车站后的1座6层大楼里,几个房间以阿兰·图灵、达芬奇和尼古拉·特斯拉等大师命名,这里就是精英会聚的DeepMind总部,人们安静地进行计算,朝着DeepMind的210年发展大计前进。

  DeepMind的联合开创人兼CEO德米斯·哈萨比斯(Demis Hassabis)向来把DeepMind视为1项人工智能领域的阿波罗登月计划,乃至是研发原子弹的曼哈顿计划,“100名科学家,来自40个国家,1起尽量快地实现1项具有远见卓识的事业。”

  “在其他1般的创业公司里,我们的1名高级研究员就可以撑起(他们的)1家公司。”

  这并不是大放厥词,DeepMind内部人才辈出的程度可能远超你的想象。这家人工智能先驱公司的成绩并不是仅凭哈萨比斯1人之才撑起来的。大卫·希尔文(David Silver)的个人网站上列出了29篇已发表的研究文章;艾利克斯·格雷福斯(Alex Graves)曾跟谷歌的AI专家吉奥夫·辛顿(Geoff Hinton)1起研究神经网络;瓦拉德·尼(Vlad Minh)也在辛顿的指点下完成了机器学习的PhD学位。阿尔法狗的成功乃至DeepMind的发展,离不开这些籍籍无名的幕后元勋。

  其他年轻创业公司大多雇佣210多岁的年轻人,而DeepMind不同的地方在于,这里的员工平均年龄为310多岁,绝大部份成员都有1个乃至多个博士学位。根据哈萨比斯的说法,DeepMind的伦敦办公室比谷歌“略微更复杂老到1些”。这里没有倒在座垫上睡觉的程序员,只有“严肃的沙发供(大家)严肃地思考。”

  全能的超人CEO

  固然,身为CEO的哈萨比斯自有其过人的地方,他在少年时期就是神童。跟他们办公室以之命名的达芬奇1样,哈萨比斯也是这样1位全能型人材。他在13岁的时候就成了国际象棋大师,屡次参与Mind Sports奥林匹克比赛,主办方形容他“也许是史上最优秀的选手”。5次拿到Pentamind国际象棋锦标赛冠军、玩腻了西洋棋以后,他开始自己开发游戏,和游戏开发公司牛蛙公司(Bullfrog)和狮头公司(Lionhead)1同开发了《主题公园》(Theme Park)和《黑与白》(Black&White)等几款具有强烈AI色采的游戏。棋赛经历为往后的职业生涯定下了两个让他始终魂牵梦萦的问题:

  大脑是如何学会掌握复杂任务的?

  电脑也能做到一样的程度吗?

  1994年,他到剑桥攻读计算机科学,但很不满意1些老师所教的狭义人工智能,也就是让程序员给数据“贴标签”,计算机才能理解信息,乃至有1次当面离开老师的讲堂。就在那个时期,哈萨比斯决定创建DeepMind这样的机构,当时将其模糊地定位为研究项目与科技创业的融会体。

  “事实上我的全部职业生涯,包括我开发游戏的时候,都是为了终究成立AI公司。少年的时候我就决定,AI会是最有趣和最重要的事业。”

  ——2015年1月,《连线》主编Steven Levy专访哈萨比斯

  哈萨比斯曾说,他当时就知道这会是1项长达210年的计划。首先,他需要得到足够的经验才能成立1个理想团队,因此在1998年先成立了游戏工作室Elixir,开始在商界摸爬滚打。2005年,28岁的他重返校园,在UCL拿到了认知神经科学的PhD学位。2011年,他终究跟谢恩·雷格(Shane Legg)和穆斯塔法·苏雷曼(Mustafa Suleyman)共同创建了DeepMind,并在尔后的2014年1月接受谷歌出价4亿英镑的收购,至今还是谷歌在欧洲最大的1起收购案。

  “我开始思考DeepMind——那是2004年——但我认识到,我们还没有足够的资源来快速前进。(当时)深度学习还没出现,计算能力还不够强大。所以我就去看我的PhD应当研究甚么,然后觉得研究神经科学比AI好,由于我想学习全新的1套观点,而我已认识世界1流的AI人材了。”

  ——2015年1月,《连线》主编Steven Levy专访哈萨比斯

  在接受谷歌收购的时候,DeepMind在1点上绝不让步——总部要继续留在伦敦。哈萨比斯认为,“如果你从剑桥拿到PhD毕业,想干点改变世界的科技,(除伦敦)没啥别的选择,而硅谷的机会遍地都是。但是如果你关注的是长时间目标,硅谷可能就是泡沫——人们总是希望下1秒创造出另外一个Snapchat,全部体系里有很多噪音。”

  哈萨比斯决定接受谷歌邀约的缘由也很简单:为了更好地弄研究。投资了DeepMind的马斯克向谷歌CEO拉里·佩奇(Larry Page)介绍了这家决定专攻AGI的公司,几个月后,当时的谷歌高级副总裁阿兰·尤斯塔斯(Alan Eustace)就给哈萨比斯发了邮件,约请他与佩奇会面。

  “我们协商了1年。选择谷歌的缘由,1个是文化上双方很投机,另外一方面在于佩奇自己也非常热中于AI。”哈萨比斯说。1开始,他就希望把DeepMind建立成人工智能界的谷歌。但是创业3年,他花了大量时间召募资金,只有10%的时间能够投入研究。他意想到,这样下去即便花费1生的时间也建不成谷歌,别说解决AI问题了。这时候候佩奇告知他:“我花了15年建立谷歌——你为何不直接来利用我们现有的机会呢?”

  “谁都不会谢绝谷歌的邀约。”

  他们到底想干甚么?

  DeepMind网站上挂出的公司的愿景很简单,“解决智能问题(solve intelligence)”。根据哈萨比斯的描写,他们真正要攻破的是通用人工智能(AGI,artificial general intelligence)。他的目标不在于让机器理解语言、辨认人脸或是声音,而是通过机器学习和系统神经科学让网络学会自己决策,就像人类1样。

  “AI的梦想是让机器变得聪明。今天的大部份AI都是关于给机器编程的。我们的方法是给它程序,让它能够自己学习。这要远为强大;这就是生物学习的机理。”

  另外一名联合开创人、现利用人工智能主管苏雷曼曾在去年6月的伦敦机器学习大会上就曾公然介绍DeepMind。“我们的系统是自主学习的,没有预先的编程,也没有手动操作。我们给算法提供尽量大量的原始信息,让系统自己学习,学会采取行动、分类或预测。”

  “我们设计的系统本质上是通用的。也就是说,一样的系统能够用来完成大量不同的任务。”

  

最强起底“阿尔法狗”前世今生,后世的创业狗们加油

  DeepMind联合开创人穆斯塔法·苏雷曼。图片来自Wired UK。

  DeepMind专攻的是深度学习和强化学习研究,这些技术能让机器自己进行大量学习。被谷歌收购之前,DeepMind团队已搭建了1些会玩经典雅达利视频游戏(比如,Pong,Breakout和Space Invaders)的系统。人工智能之父马文·明斯基曾提出1个假定:人类与机器之间并没有真实的区分。人类实际上也是1种机器,大脑由许多半自治但很笨拙的“代理”(agent)组成,而“不同的任务需要完全不同的机制。”根据苏雷曼的描写,DeepMind的测试机制也是让系统中的“代理”从原始数据中学习并找出最优方法、得到最大产出。

  强化学习将系统能做的事情向前推动1步。1旦搭建起1个很善于玩游戏的神经网络,你就可以让它和自己对战。随着两个版本的神经网络彼此对阵数以千计次后,系统就可以清查出哪些招数回报最高——也就是说,得分最高——并以这类方式学会以更高的水平玩游戏。再次重申,这类原理一样适用于其他决策。

  阿尔法狗的开发使用了这1切成果,而且还远不止此。Hassabis和他团队添加了1个2级“深度强化学习”,预测每步的长效成果。他们还采取了过去驱动围棋游戏人工智能系统的传统人工智能技术,包括蒙特卡洛树搜索。鉴戒新旧技术,他们搭建起能够击败顶级职业选手的系统。

  AI的利用前景有多广?

  哈萨比斯表示,5年之内,DeepMind能够让我们的平常工具更聪明、适应能力更强,“更好地搜索,更好地理解你的意图——你大可以含糊其辞,它也能够明白你到底想干甚么。”而在210年以内,“科学界固然会获益,不管是药品研发回是蛋白质折叠,任何需要大量探索的领域都可以……可能就有AI科学家在《Nature》上发表文章了。”

  “气候,疾病……有了AI的协助,科学就可以够加快发现新知的进程。”

  人工智能潜伏的利用领域非常广泛,包括医疗健康、智能手机助手和机器人技术等。围棋大赛几周前,DeepMind已和英国全民医疗服务(NHS)达成火伴关系,准备开始建立可以应用机器学习的平台。医疗方面的人工智能通常利用于医疗诊断图象、生命特点的长时间纵向追踪、自我量化及帮助人们建立更健康的生活方式,而阿尔法狗的强化学习能力恰好非常合适利用于这些方面。

  赢了李世石不过是通往下1个里程碑的开始。DeepMind团队已把眼光继续放在游戏上,而星际争霸可能就是他们投入利用的第1个游戏。不过,星际争霸跟围棋是截然不同的两回事,要求玩家基于有限的信息做出决策。一样的道理,智能手机和围棋游戏需要学习的东西完全不同,DeepMind公司在接下来的几个月里要尝试开发阿尔法狗的算法,让程序在无人预定学习出发点的情况下完全进行自主学习,也就是从零学起。这将成为1种“纯学习”模式,完全脱离人类的监控。

  相比佩奇对DeepMind、对AI的浓厚兴趣,哈萨比斯认为一样在开发AI的Facebook更多地把它作为工具;毕竟,Facebook的目标是连接世界,而DeepMind的目标就是AI本身。话虽如此,哈萨比斯还是预计,在未来2至3年内,人们就可以开始看到在智能手机助手方面的变化,比如可以用来改进语音搜索、定义Youtube的视频推荐、控制谷歌的无人驾驶汽车等。现在,DeepMind已将核心系统利用在谷歌的语音辨认中,“Tool AI”(深度学习网络)利用于讹诈检测、图片搜索、街景辨认、谷歌翻译等。

  AI是福还是祸?

  不过,“我认为人工智能就跟其他强大的新科技1样……不负责任地利用便可能带来害处。”哈萨比斯接受BBC采访时表示。他也10分关注其他业内人士对AI的耽忧,比如投资了DeepMind的马斯克,比如认为AI可能“终结人类”的霍金。

  因此,DeepMind内部成立了道德与咨询委员会,成员均为科学和哲学领域的顶尖人物,他们会对DeepMind的研发成果进行监管,不过跟马斯克不同的观点在于,哈萨比斯要求现阶段保持隐私、不对外公然,由于“不想由于人们在Twitter等社交媒体上的意见而选择让步”、“此前从未有这方面的尝试,因此在被强加上公共监督的桎梏之前,我们还有许多探索性的工作要进行。”

  苏雷曼的态度则更加乐观。他认为,过分悲观乃至恐惧的态度对AI的发展毫无助益,从前人们担心的是AI研究会不会失败,现在却反而担心AI太成功会给人类带来恶果。

  “研发AI是用来加能人类能力,而不是毁灭我们自己。”

  现在,有1点最少可以放心,就是DeepMind坚持所有成果不会用于军事或情报搜集用处。

  但是,明显研究AI的不只谷歌1家。事实上,相当多的互联网巨头都开始大量投资人工智能领域并争取人材。

  前文提到的Facebook,其实在谷歌向DeepMind抛出橄榄枝时就对后者产生兴趣。现在,在纽约大学毕生教授、“深度学习”专家Yann LeCun的带领下,Facebook人工智能实验室正蓬勃发展。

  微软研究院大概是商业公司内少数纯以学术为目的的研究机构了,在旧金山的Build 2015开发者大会上,微软提出1组称为“Project Oxford“的技术,让开发人员通过微软云计算平台Azure开发并实现图象理解、人脸辨认、语音辨认与合成等功能。

  代表IBM在认知计算领域最核心的技术Watson也是1个强大的AI平台。2011年2月,Watson在美国问答节目《Jeopardy!》上克服两位冠军选手,被认为和“深蓝“克服卡斯帕罗夫1样,是人工智能历史的1个里程碑。随着IBM转型为认知解决方案与云平台公司,Watson的商业化价值日趋显现。

  除自家的公司,扎克伯格和投了DeepMind的马斯克1样,都跟投了宣称要“复制大脑皮层“的人工智能公司Vicarious。百度也并不是像大家吐槽的那样只做外卖,它的超级计算机Minwa有着全球1流的图象辨认能力。

  后阿尔法狗时期,创业狗该怎样走?

  毫无疑问,在这场全球大秀以后,人工智能又将成为下1个创业风口。但是创业向来是“行百里者半910”,大浪淘沙以后,怎样的人材能留在历史舞台?

  去年2月份,哈萨比斯回到剑桥大学做了1个演讲,分享公司的成立故事和他对深度学习算法的研究、对人工智能的看法、和身为创业者的经验。

  

最强起底“阿尔法狗”前世今生,后世的创业狗们加油

  在剑桥演讲的哈萨比斯。图片来自cutec.org。

  1. 你不需要比世界领先太多,5年就够了

  创业需要新颖和智慧,延续学习和改进能够帮助你找到本身的优势所在。另外,在主科以外进行跨界能够打开视野,让你脱颖而出,就像哈萨比斯结合计算机和认知神经科学1样。不过,比1般人领先5年左右就行了,由于你需要让他们理解你的技术与愿景。

  2. 充满热忱,酷爱你的目标

  开始创建新事业,特别是1些乍1看遥不可及的目标时,你必须充满热忱、延续前进、保持领先,由于1旦势头停下来,你就很难继续鼓励你的团队乃至你自己,也就更难募资了。

  3. 要在短时间内多拿1些投资

  在DeepMind之前的创业项目中,哈萨比斯也跟普通人1样,经历了几轮融资。但是到了DeepMind,他采取了完全不同的策略,就是不断寻觅更多的投资,而不满足于某1轮融到多少钱,因而很短时间内就确保拿到6千万投资。这不但能加快实现目标的进程,也是在给团队打鸡血,保证前进的势头。

  4. 从懂你的人那里拿钱

  许多投资人和VC都希望几年内拿到10几倍的回报,但哈萨比斯知道DeepMind不能做出这样的许诺,他们注定是需要长时间投入的研究团队。因此,哈萨比斯找的都是彼得·蒂尔、马斯克、李嘉诚这样的投资人,由于他们晓得DeepMind的使命,深知这场技术革命的巨大影响及其潜伏的财务回报。

  他们注定要仰望星空,然后脚踏实地。

  2015年初,哈萨比斯接受了金融时报记者的午饭采访。当时的他形容自己希望留下1些遗产,“当你问我,下棋的时候赢得比赛对我来讲重要吗?非常重要,从实现个人潜力的角度来讲的话。而遗产的重要性在于,终有1天,我希望我的人生能完成1些足够重大的事情,通过技术,我能够给社会带来1些良好、深入的改变。”

推荐阅读
图文聚焦