北京时间3月9日,整个12:00,世界瞩目的“围棋人机对抗战”在韩国首尔的第一场战斗中开始,参赛双方分别是围棋世界冠军韩国名李世石、谷歌开发的人工智能计划阿尔法狗(国内网民亲切地称之为“阿尔法狗”)。
李世乭执黑子,阿尔法狗执白子,在激战3个半小时之久后,李世乭投子认输,世人沸腾。对于这场世纪大战,李世乭此前曾表示自己有信心获胜。“我听说谷歌DeepMind的人工智能技术很强,而且还在提升,但我还是有信心的,我觉得至少这次可以赢。”而就在昨天,对弈“双方”在首尔举行了赛前最后一场记者见面会。李世乭在记者会上表示,他认为到目前为止还是人类比人工智能强,“不过听到人工智能具有了类似人类的直觉判断能力,我倒感到有些紧张, 恐怕我以5比0战胜它有点儿够呛,因为人类下棋时会有失误。” 世界围棋第一人柯洁在赛后也承认阿尔法狗和去年10月份大不一样,但他认为如果他与阿尔法狗对战胜率能达到6成。他在赛后发微博也说:“就算阿尔法狗战胜了李世石,但它赢不了我。” 围棋职业八段刘菁对此次比赛结果作出点评:“还来不及反应,一切来的似乎是太快了!面对毫无表情,连厕所都不上的阿尔法狗,4000年围棋的终结者今天就来了吗?空气中弥漫着机器的味道。”
那么,能把围棋王子李世乭逼到认输的,究竟是怎样一个AI,阿尔法狗到底有多厉害?
研究出AlphaGo的(Deepmind)创始人 杰米斯•哈萨比斯(Demis Hassabis)是棋类的狂热爱好者,哈萨比斯四岁开始接触国际象棋,并很快进化成神童级人物。正是在博弈游戏上的兴趣让哈萨比斯开始思考两个重要问题:人脑是怎样处理复杂信息的?更重要的,电脑也可以像人类一样吗?博士期间的哈萨比斯选择了学习认知神经科学和计算机神经科学。今天,38岁的哈萨比斯带着他的AlphaGo,向人类最顶级的博弈游戏之一——围棋发起进攻。
AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里——本质上,这和人类棋手所做的一样。
其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。
AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。
实际上,AlphaGo是在以预测的方式模拟人类的直觉,试图以人类的思维去学习围棋。某种程度上讲,AlphaGo的棋艺不是开发者教给他的,而是自学成才。目前,AlphaGo模仿人类的直觉判断程度约为80%,但李世乭表示由于它的运算速度要优于自己,所以要格外小心。
围棋被称为“人类智慧最后的堡垒”,正因如此,在人类首战失利这一结果尘埃落定之后,全世界人类都进入了高度警惕状态,紧接着的3月10日、3月12日、3月13日、3月15日里,每日还将进行一场比赛,Youtube将对本次赛事进行全程直播,国内棋迷也可通过B站、新浪、网易等渠道观看,后面的4局对战,让我们拭目以待。