别让AlphaGo给忽悠了,强人工智能才是未来

界面新闻   2016-03-12 11:35
作者:我是土妖 ·

人工智能从来没有获得这么高的关注度,也从来没神话到如此的地步。

这两天,有关谷歌AlphaGo战胜世界围棋冠军李世石的消息,每一局的对抗都频频刷爆朋友圈。AlphaGo连胜两局的战果,让本身并不清楚人工智能为何物的中国大众,开启了更大胆的想象空间。一时间,AlphaGo就像科幻电影里具有人的思维、情感甚至还能谈恋爱的机器人一样,被极大地神话了。实际上,无论是上次的引力波发现,还是这次人工智能AlphaGo,中国公众的沸腾都远远超出全球。而造成这样一种奇怪的现象,原因是中国除了崇拜科学外,还容易陷入集体躁动的状态。而这,并不利于我们更准确地认识和理解人工智能。

事实上,AlphaGo仅仅是一台机器

这里就专业的角度来帮你剖析一下,AlphaGo到底是个什么东东?人工智能这个领域在全世界已经孕育了上百年的历史,人们对人工智能的探索和联想始终就没有断过。人工智能的雏形其实就是计算机对人类智能的模仿,让机器“学会”人类在某一领域的专业技能。一个会下围棋的人工智能程序,就属于这个范畴,不过它更像是冰冷的机器,没有情感,更不会“调戏”和随机应变,只是按程序行事。

但门槛更高的人工智能应该是具备人脑的感知、思维、逻辑判断、情感、对话、交流等能力的,这才是在科幻片中的场景,渗透人们生活,混在人群中,难以区别机器与人类。当然,AlphaGo确实值得欢呼,谷歌也因为这样一场秀,不仅赚眼球,还在技术形象上加分,但它并未像外界所期待的超越人类智能那样有划时代意义,这里就科普一下AI。

人工智能领域,分为三个段位,一个是弱人工智能,也就是AlphaGo所在的领域,属于在单个领域有较强智力的程序或机器人。它的智能程度取决于两点,一点是围棋棋谱和经验的植入,据说AlphaGo输入了3000万步的人类围棋大师的走法、棋谱,这属于经验和技巧的掌握,是范式化的教授,就像中国武术最机械的招式对抗一样,但模仿永远不是精髓所在;另一点是AlphaGo也改变了单纯的模仿套路,有自我学习的能力,在不断对弈中能提升智能水平,这一点最接近人的大脑。据说,AlphaGo自我对弈了3000万局,积累下的经验就能不断提升智力水平。理论上,与围棋大师对垒次数越多,经验值涨的越多。

可以说,这两点构成了AlphaGo人工智能的核心。有人说,围棋比象棋的人工智能程度要高很多,理由是围棋棋局之复杂远超国际象棋,标准的19×19棋盘内,共有361个点,大概有10170种下法,还跟宇宙中的原子去做对比。这一点逻辑上有一些混淆,对机器人来说,复杂度考验的更是计算能力,算法上的规则不同,进行优化即可,智力上的提升仅仅是线性的。一个最简单的事实是,半年前AlphaGo就击败了欧洲围棋冠军,当时给出的判断是专业中的入门选手,过了半年就能打败世界冠军,如果真归结于人工智能,这智力水平进步也太快了。

因此,就像所有弱人工智能的弊端一样,AlphaGo即使在接下来与世界围棋冠军李世石的对垒中最终5局全胜,也仅仅是围棋领域人工智能程序的冠军,就如第二局中,AlphaGo能估算的步数显然比人脑计算快得多,以至于在某一时刻将李世石拖得超时,但你不能说AlphaGo智力水平高出人脑。人工智能领域门槛最高的其实是强人工智能和超人工智能,具备人脑一样处理各种问题的能力,还有自我学习、理解和沟通能力,在强人工智能、超人工智能上,世界范围内都仅仅处于初级阶段。而超人工智能是指获得人类的自我意识,不断进化超出人类的智力水平,这一块几乎连头绪都还没理清楚。

百度人工智能则是另一维度上的探索

所以,搞清楚了AlphaGo的身份和背景,弄明白人工智能,才不至于在一场人机大战的喧嚣中迷失自我,更不会过度地神化AlphaGo,担忧世界会被人工智能所接管。很简单的道理,如果让AlphaGo去干一件不擅长的事,几乎是寸步难行。相比,全球范围内,在强人工智能领域,也有一些公司和研究机构在探索,例如IBM的沃森及认知计算技术,百度大脑背后的图像识别、语音交互和深度学习、无人驾驶等技术,都属此类。

语音搜索的复杂度要高得多。因为它不仅要在多环境下有高的识别率,还要能理解人的语言,并给出匹配的服务响应。在语音识别方面,深度学习技术早已融入,百度研发出了基于多层单向LSTM(长短时记忆模型)的汉语声韵母整体建模技术,并成功把连接时序分类(CTC)训练技术嵌入到传统的语音识别建模框架中,训练语料量可能会突破100万小时,识别率接近97%。

除了能够“听清”,百度语音搜索突破之处还在于它能够“听懂”,能够根据语义和语境,与用户实现多轮对话。例如,当你向它询问“姚明是哪里人”,它会回答“姚明的出生地是上海徐汇区”。

 

而当你紧随着这个问题继续询问“他老婆是谁”,百度语音搜索便可以根据对话语境,理解“他”指的是上一句话中的“姚明”,回答你“姚明的妻子是叶莉”。

接着,你还可以继续这段对话发问“他老婆有多高”,百度语音搜索会自动理解此处的“他老婆”指代上一句话中的叶莉,然后回答“叶莉的身高是190厘米”。而在这项技术实现之前,你只能机械地、重复地询问“姚明是哪里人”、“姚明老婆是谁”、“叶莉有多高”。

多轮交互技术的实现和日臻完善带给我们很多想象空间。可以想见,未来,语音搜索将如同最贴心的秘书一般陪伴在我们身边,我们可以像和人类交流一样与之进行对话。而作为交互方式,语音识别一旦在物联网、智能硬件、自动驾驶等领域商用,都将发挥出重大价值,颠覆我们的生活体验。

除此之外,在视觉搜索上,人工智能的含金量更高,人脸、花卉、植物、动物、服装等柔性物体的难度更大。百度应用了最新的卷积神经网络技术,先建立一层人工神经元,用来探知物体的边缘形状,第二层神经元将第一层感知到的物体边缘形状拼凑起来,认知形状,第三层进一步拼接信息从而得出物体整体形态。这些过程完全由机器自主学习并完成的,这一技术让“即拍即得”成为可能。

拿去年百度世界大会上备受关注的“度秘”机器人来说,它能够让人们更便捷、智能地获取服务,比如叫咖啡、找餐馆、订电影票,你随便丢一句话,度秘都能理解,还具备学习和思考的能力,跟你开个玩笑,几乎适用于任何一个场景,而且还具备极强的适应性,使用的人越多,社会化活动越多,就越聪明,群体性的智慧都能不断输入。这个过程就像小孩在慢慢长大一样。

这背后的人工智能复杂度比下围棋、象棋高得多,远不是机械程式化的反馈动作。度秘涉及到自然语言处理,负责理解人的意图、沟通的顺畅,还应用了语音识别、图像识别,在交互中感知命令。当然,深度神经网络学习也是技术的核心,建立更类似人脑的神经元网络和组织,通过算法和训练模型,不断学习和提升智力水平。

再者,无人驾驶汽车是近年来人工智能领域最热的话题,但至今,谷歌自动驾驶技术还难以商用。去年底,百度无人驾驶汽车在国内首次实现了城市、环路及高速道路混合路况下的全自动驾驶。面对复杂的路况和环境场景,这个大脑需要看得见、听得清,还要在路上思考,判断并决策,其中所应用的深度学习、神经网络、隐层的学习模型和海量训练数据,远比安排一次围棋大战,更接近现实的世界,更趋同于人脑的神经元组织。

其实,度秘和无人驾驶汽车在人工智能技术上覆盖的广度和精度都很高,一个更接近人脑的组织,具备感知、分析和思考、判断决策的能力,能应对各个使用场景。这样的人工智能的复杂程度远超过AlphaGo这样的单腿巨人。这恰恰是强人工智能的范畴。相比弱人工智能的学习和进步速度,强人工智能进化的周期要长得多,更接近人类。

人工智能还有很远的路要走

当前,大众对人工智能的专业理解,存在信息不对称的问题,因此当把人工智能放到围棋游戏上时,连世界冠军都甘拜下风,便很容易让人产生错误的想象,仿佛机器的智力水平超越了人类。这里存在很大误区,是不是具备人类的智力水平,要看放到更多的社会、生活场景下,能否聪明应对各个层次的问题,甚至还具备跟人类一样的思考、情绪、学习能力。

这与AlphaGo完全是两个不同的方向。很简单的比喻,人脑的计算水平再快,也赶不上机器的算力,但机器再聪明,也不可能跟人脑一样复杂多变。拿AlphaGo来说,仅仅是识别、根据经验和自我学习的能力,去给出下一步棋子的行为,但人所在的世界要比这复杂的多,仅仅是感知就有语音(听觉)、图像(视觉)、传感器(触觉)等方面,这么看的话,百度虽然在度秘、无人驾驶等领域有一些成果,但也仅仅是小儿科,李彦宏自己也承认也就2-3岁儿童的水平。

所以说,人工智能确实有很大的想象力,也会给人们的生活带来巨大的便利,这从百度的语音搜索、度秘机器人、无人驾驶的应用场景中,能深刻地体会到,但离科幻片里的情景还有很远的路走,我们可以去接近,但不能神化,也不能犯认知上的错误。AlphaGo打败世界围棋冠军,远不是大家所渲染的那样有阿波罗的意义,超越人类智能是个奇点。而且,相比人工智能的围棋冠军,我们更期待看到具备情感、思维的人工智能的成熟。