中国仿人机器人亮相CES!独家对话优必选CTO熊友军

端茶倒水、弹琴作画、“谈笑风生”,优必选Walker重燃了人们对大型人形机器人的热情与期待。

文|智东西记者 Kiva

智东西1月9日美国CES 2019现场报道,一年一度的美国消费电子展(CES)已经成为了科技企业对外秀肌肉、展示公司新品和重大进展的最佳场合之一。

2018年初,国内人工智能独角兽、服务机器人企业优必选曾在CES2018上首次展示了其研发的双足机器人Walker,并秀出了下楼梯、踢足球等技能,吸引了海内外众媒体的热烈关注,智东西也在第一时间进行了现场报道(对话吴牟雄:解读优必选首款双足机器人研发背后的难点)。

优必选创始人兼CEO周剑曾当场立下Flag:将在CES2019上展示带有双臂、更成熟、更类人的Walker。在CES 2019的第一天,智东西赴美小分队专程来到了优必选的展台,一探优必选大型仿人服务机器人Walker这一年来的进展。

▲左为第一代Walker,右为Walker新一代

今年,优必选将Walker升级为“Walker新一代”。在一年的时间里,Walker从硬件、软件到AI能力都获得了突飞猛进的进展,也代表了中国机器人公司在大型仿人机器人方面取得的突破。

从外观上看,Walker新一代已经具备了人形机器人的基本形态,它有手能抓取、有腿能走动、有脑能交流,而表情等多模态交互方式也让Walker新一代更具亲近感。周剑曾说过,优必选的梦想是“让人形机器人走进千家万户”,Walker作为优必选大型仿人机器人领域的全新尝试,也从这一场景出发,开发出了诸多家庭必备技能,如端茶倒水、开门关灯、弹琴作画等。

看到Walker第一代,也许有人会想起本田的人形机器人ASIMO。虽然从外形上看,Walker新一代与ASIMO有些类似,但Walker新一代做了更多优化的设计,Walker新一代的电池并没有像ASIMO那样背在背部,而是采用了隐藏设计;它还增加了类似于《机器人总动员》中Eve一样的双眼,看上去十分乖萌;金色/灰色的条纹配色也让Walker新一代看上去更具设计感。

“光说不练是假把式。”在CES2019现场,Walker新一代就大秀了一番。

Walker新一代为何会在仅仅一年的时间内进步得如此神速?它离正真进入家庭和人类一起生活还有多远?

▲优必选CTO熊友军

带着这些疑问,在CES 2019期间,智东西还与优必选CTO熊友军进行了一次深度对话,就Walker新一代背后研发的难点、优必选的心路历程以及双足机器人商业化的进展问题进行了深入交流。

弹琴、抓取、“推不倒”——硬件性能全面提升

做人形机器人一直是优必选的梦想,2015年优必选正式立项开始尝试研发大型人形机器人。

“Walker采用的是模块化的设计,双腿和双臂的研发分属两个项目。在第一代上,我们先把机器人的双腿做出来,解决行走问题”,熊友军说到。

在CES 2018上,优必选首次在全球亮相了双足机器人Walker第一代。为了体现Walker双足的移动能力,优必选弱化了躯干部分的占比,当时也有人戏称Walker“胸以下都是腿”。第一代Walker的成功不仅激励了优必选的信心,也让优必选向着研发出大型人形机器人迈出了非常重要的一步。

“做出双腿之后,我们又开始做双臂的研发,然后将两个部分组合在一起,继续做算法调试”,熊友军介绍说。

仅仅一年之后,优必选将Walker进行了全面的升级。仅从外形上,Walker新一代的改变就已颠覆了第一代产品。它不仅拥有了双臂和灵巧的双手,整个躯体的比例也更加协调,身高达145cm,与10岁左右的儿童身高相当。

由于加入了双臂,优必选将Walker的各硬件进行全新的设计,尤其是优必选自研的大扭矩新舵机的加入,让Walker具有了灵活运动的可能。

除现场演示的几项功能外,Walker还具有更多的技能,详情请下戳视频(Walker全功能介绍):

1、灵巧双手——弹琴、作画不在话下

今年,Walker新一代外观上最突出的亮点是增加了一对7自由度的双臂。据熊友军介绍,Walker新一代的单臂伸展时可承受1.5kg的重物(相当于3瓶500ml的矿泉水的重量),双臂合作下最大可以举重10kg(相当于20瓶500ml矿泉水的重量)。

除了承重外,Walker新一代的手指也非常灵活,除了现场演示的抓取物品外,智东西还了解到Walker新一代还可以弹琴、作画。

也许你曾听说过全球知名的弹钢琴的机器人TEO,它弹奏钢琴的能力甚至让郎朗都深感佩服。不过,TEO实际上拥有53根手指,这些手指分别搭载在琴键上才能快速演奏出美妙的旋律。而据熊友军介绍说,Walker新一代可以像人类一样,用双手的10根手指在琴键间切换。

2、手眼协调——“力+位置”双重反馈定位

在CES 2019现场,Walker新一代还演示了打开冰箱门,从中取出饮品,并将水拿给“主人”的技能。

机器人双手的设计此前在业内也曾出现过,在优必选的商用服务机器人Cruzr(克鲁泽)上,就有手臂和双手的设计。那么为什么Walker新一代可以实现对不同物体的准确定位和抓取呢?

熊友军告诉智东西,Walker新一代具有手眼协调功能。在物体定位方面,业内常见的是通过摄像头等视觉传感系统获得物体的位置和姿态信息。Walker新一代在位置反馈的基础上,又加入了力反馈信息。

力反馈的基础则是基于Walker新一代灵巧手关节内的力传感器,再配合上力控算法,这才让Walker有了“力”的感觉,不至于捏破或者捏碎物品。而这一反馈系统的研发涉及到了硬件和算法两个层面。

智东西从这位CTO口中了解到,灵巧手对关节的灵活度要求极高,因此也对舵机的精度提出了调整。想要让机器人知道以多大的力如何握着物体,则需要识别出物体的状态、朝向、形状等信息。

在算法层面上将涉及运动、视觉领域的多种算法。为此,优必选的研发团队构建了非常多的动力学和运动学模型,建模后又持续对算法不断进行优化,这才让机器人不至于抓偏或者碰撞到物体。

3、新研伺服舵机——一体化驱动单元

伺服舵机是机器人核心零部件之一,同时也是机器人灵活运动的硬件基础。

优必选在舵机领域有着十多年的技术积淀。早在2008年,优必选就开始钻研伺服舵机,最终在2012年取得了突破,成功自研出了伺服舵机,使其成为优必选技术护城河中的关键一环。周剑及团队“死磕”伺服舵机的故事,也一直被业内津津乐道。

在Walker新一代上,优必选自研了全新的高性能伺服舵机。据熊友军介绍,由于Walker新一代相比于第一代产品重量变大了,对动作的爆发力和精确性要求也更高了,需要输出力矩更大、控制精度更高的伺服舵机。因此,优必选针对其特性,专门研发了新的伺服舵机。

新的伺服舵机采用一体化的驱动单元设计,拥有从2.5Nm到160Nm的系列伺服舵机作为驱动单元,速度可以达60转/分钟,支持位置模式、速度模式和力矩模式三种控制方式。智东西了解到,新的伺服舵机对传动和结构进行了优化配置,相应的电机驱动与控制算法也进行了针对性的优化。

4、柔性设计——与人安全交互的基础

除了基于应用性能上的硬件提升外,优必选在Walker新一代上已经开始实实在在地考虑到大型仿人机器人进入人类生活中的要求了,其中最关键的问题就是人机交互的安全性。

熊友军告诉智东西,Walker新一代全身都采用了柔性控制设计,增加了非常多的柔性算法,可以保证人类在与Walker进行交互中的安全。比如,当Walker想要关上一扇门时,刚好有人类进行阻挡,Walker会停止继续运动让,以免让人类和自己受到伤害。

当Walker碰到桌子、凳子时,由于柔性控制的存在,Walker不会“硬碰硬”而是会进行避让,以免其他物品受到损害。

对于Walker自身的安全,优必选也做了非常多的思考。比如,当人类用手推Walker时,并不会轻易将它推倒,Walker会自动进行平衡调节。

熊友军介绍说,Walker新一代在站立或行走过程中,受到外部冲击扰动或惯性扰动时,可以通过腿部的柔顺控制可以调整自己本身的位置和姿态,从而可以保持自身的平衡。当外界扰动过大,它可以调整落足点来获得平衡,“即便是在家中地板上踩到鼠标,Walker也不会失去平衡”。

柔性的设计也使得Walker新一代拥有一个特殊的模式状态——零力模式。在零力模式下,人手可以安全地拖动机器人进行动作演示,Walker新一代则可以随后复现这些动作。在熊友军看来,这个模式可以让Walker新一代更快更简单地学习并执行很多任务。

识人、开灯、“满地跑”——Walker的六大AI能力

今年的Walker新一代可以说是惊艳了CES 2019,除了看得见的硬件创新之外,其背后有一套软件系统起着关键作用。与此同时,优必选的AI技术在Walker新一代上也得到了充分和全面的展示。

1、ROSA操作系统——Walker的智慧大脑

ROSA操作系统是优必选在2018年9月发布的智能机器人操作系统,集成了优必选多年研究的技术,包括语音操控、视觉识别、定位导航、运动控制、表现力等。ROSA系统还拥有模块化、可扩展、松耦合、全集成四大特点,让开放者不需要再去做底层研究,可以直接调用上述这些技术。

熊友军告诉智东西,自ROSA操作系统发布后,优必选的全系列产品都开始使用这一系统,Walker也不例外。“由于系统非常稳定,Walker新一代的调试过程也非常顺利,ROSA操作系统打了一个很好的基础。”

由于ROSA操作系统此用了模块化设计的优势,大大提升了Walker新一代的推出速度。因此虽然Walker新一代相比于第一代产品,无论从硬件还是软件层面都做了大幅度的优化,但整个周期仅为一年。

2、多模态的人机交互——充分模拟人类间交互方式

多模态交互是近年来人机交互领域研究的重点方向,其意指将多种感官进行了融合,通过文字、语音、视觉、动作、环境等多种方式进行人机交互,充分模拟人与人之间的交互方式,让机器人的智能交互更丰富、更类人、更生动。

今年9月,优必选发布小型智能机器人悟空,其中增加了许多的拟人化的设计,打哈欠、转眼珠都让悟空显得俏皮又可爱。在Walker新一代上,优必选也采用了多模态的人机交互方式,除了基本的语音交互外,还会给交流者反馈表情和动作,像悟空一样会不时地眨眨眼、扭扭头。

熊友军还表示,Walker新一代还会利用大数据不断地进行学习,“它会变得更聪明和更懂你”。“物理交互是一个非常好的切入点,优必选会持续在这个方向上跟进。”

3、控制智能家居——“语音+自动化”的双路控制

让人形机器人走入家庭,是优必选和创始人周剑梦想。在Walker新一代上,我们已经能看到优必选对于家庭场景进行的考虑。

目前,控制智能家居设备是智能家居中控设备的核心能力,手机、智能音箱、智能电视厂商都在努力想成为智能家居场景的中控中心。在优必选看来,智能机器人才是最合适的智能中控选择。

在CES 2019展上,Walker新一代就秀出了作为智能家居中控系统的实力。智东西了解到,通过用户的语音控制,Walker新一代可以实现控制厨房灯的开关以及切换灯的颜色,以及控制智能窗帘、台灯、智能插座的开关,并能让智能插座接入智能家电。

相比于智能音箱,Walker新一代还有一项重要优势,“除了通过联网协议控制智能家居外,Walker新一代还可以进行自动化的控制智能家居。”简单来说就是,Walker可以像人一样,直接走过去开关灯。

4、机器视觉——人、物、场景三大识别能力

在机器视觉领域,Walker新一代具有人脸识别、物体识别和场景识别功能。

在人脸识别方面,Walker新一代可以识别并分析丰富的人体数据,包括性别、年龄、身份、情绪、姿态等多种信息。

在物体识别方面,Walker新一代则可以识别并分析物体数据,包括位姿、类别、操作点等信息,为Walker新一代进行交互和操作提供稳定的外部信息。

在场景识别方面,Walker新一代可以根据空间特征识别出其所处场景,比如家居场景下的客厅、厨房、卧室等。

5、U-SLAM——无标记物自主导航定位

机器人的导航定位一直是业内关注的重点,也称为了判断一家机器人企业是否具有核心技术的因素之一。在导航定位方面,优必选拥有自研的基于三维视觉的定位导航系统U-SLAM。在U-SLAM技术的加持下,Walker不仅可以实现实时定位、路径规划与主动避障的等功能,优必选自研的防抖算法还能有效解决由本体运动引起的视觉抖动问题。

在导航避障方面,此外业内常用的是激光雷达或是视觉和雷达结合的复合型导航方式。在Walker新一代上优必选实现了三维的视觉导航,可以获得外部环境中更加丰富的诸如轮廓、颜色、深度等信息,无需在环境中使用标记物等帮助Walker新一代进行定位。

据熊友军介绍,基于是视觉的主动避障技术会让Walker新一代在避障时考虑障碍物的运动状态,对物体进行姿态识别,同时自身的路径规划器也会根据预测的障碍物运动轨迹以及地图信息,在时间和空间两个纬度上规划处避障导航的最优路径。

此外,为了让Walker新一代更好地适应家庭环境下中的地毯、地板、大理石等不同材质的地面,优必选对Walker新一代的脚踝和膝关节都进行了重新的设计。配合着优必选的运动控制算法,Walker新一代得以实现在不同材质的地面进行稳定行走,同时能够适应障碍物、斜坡、台阶、不平整地面等复杂环境。

熊友军告诉智东西,Walker新一代目前可以达到每小时1.5公里的行走速度,相当于一般人正常状态下的步速,能够满足家庭日常场景的使用需求。

6、通讯领域——为5G网络做好准备

目前,全球的5G网络尚处在建设中,由于其高带宽、低时延的特性,诸多行业期待着它的到来。智东西了解到,Walker新一代也为5G网络做好了准备,在云计算、IoT、NLP等领域,Walker新一代可以切换至最新的通讯技术。

当智东西问到,5G网络对智能机器人研发有哪些推动作用时,熊友军表示,5G将会在三个方面给智能机器人带来影响:

第一、机器人的应用范围将会得到拓展。目前机器人的语音合成、自然语言处理、内容资源、智能视觉等都基于云端,当5G时代到来后,机器人云端处理的时延将会大幅度缩短,人类可能都无法感知到这个时延。人类直观的感觉是机器人的反应变得十分快速,这将使机器人应用边界进一步延展。

第二、5G时代到来后,智能机器人更多的功能可以放在云端,将会大幅度降低机器人本地处理器的负担,也会让机器人的成本降低。

第三、5G到来后物联网将会进一步普及,机器人与其他智能设备之间可以进行更好的交互,更有利于刻画用户画像,提升用户的体验。

Walker的一条腿已迈入你家大门

在类人机器人领域,本田的ASIMO是一款经典产品。从1986年开始,本田经历了多代产品研发才最终于2000年定型了ASIMO的形态。不过,本田一直没有将ASIMO对外销售,也许是由于高昂的研发费用让本田不得不在2018年宣布终结了ASIMO项目的研究,给整个行业都留下了深深的遗憾。

今天,优必选Walker新一代重现点燃了人们对大型人形机器人的热情与期待。

从今天的展示来看,Walker新一代已经集成了当下产业内最前沿的机器人和人工智能技术,已经基本定义了大型智能机器人在家庭场景工作的基本能力。无论是端茶送水、弹琴作画,还是控制智能家居设备、与人“谈笑风生”,Walker新一代已经初步满足了人们对智能机器人的需求。

从2015年立项做双足机器人Walker开始,优必选就为Walker规划出了一条十分清晰的研发路径,并为Walker定义了家庭服务、智能康养、商业服务和科研开发四大场景。在研发方面,优必选逐渐攻城掠地,先从双足研究开始解决机器人的行走问题,然后再将双臂和双手引入,并将时下最前沿的AI技术加入到智能机器人中。

不过,在优必选看来大型类人机器人真正落地到家庭中,还有一段的路要走。在2018年世界机器人大会上优必选创始人兼CEO周剑说过,真正的真人形的机器人要三十年甚至五十年才能实现商业化,但五到十年里,一些仿人形的机器人有可能进入家庭。

那么,Walker落地到底还缺少什么?优必选对Walker下一代产品的计划又是什么呢?

熊友军这位优必选技术的操盘者告诉智东西,智能机器人在人工智能技术、舵机、电池等上下游产业链成熟度还需要提升。优必选对Walker下一代产品的计划将围绕“降低成本和提高可靠性”进行。

熊友军还告诉智东西,“智能机器人会是第三代人机交互中心,优必选在人工智能领域也进行了深度的布局。”人工智能和机器人的先进技术、核心技术是买不到的,要靠企业持续投入大量人才、资金并进行长期持久的研发。在优必选看来,“对于核心技术,不只要布局未来5-10年,更要布局未来50年的前沿技术。”

目前,优必选除了各产品线的研发部门外,还成立了自己的研究院,吸引了一大批优秀的专家学者。其在伺服舵机、步态运动控制算法、机器视觉、语音/语义理解、情感识别、U-SLAM等智能机器人核心技术领域都进行了深度布局。

此外,优必选不仅与清华大学、华中科技大学分别成立智能服务机器人联合实验室,还与悉尼大学成立了人工智能研究院。研究方向涉及:人形机器人驱动伺服、步态运动控制算法、机器视觉、语音/语义理解、情感识别、U-SLAM等多领域。

优必选对于核心技术的深沉的执念,从创始人周剑从2008年开始卖车卖房“死磕”伺服舵机之时就早已种下。

结语:我们离“机器人管家”还有多远?

人们对于智能机器人的幻想已经存在了近一个世纪了。尽管今天各种类型的机器人层出不穷,但在大部分人的想象和期待中机器人的形象仍是类人形态的机器人。1999年的一部美国影片《机器管家》被奉为经典,其中的机器人管家安德鲁成为了人们对机器人形态的普遍幻想。

近两年来,随着人工智能时代的到来,给机器人研发带来了巨大推动力。在2018年,我们看到了机器人索菲亚、数字虚拟人Siren爆红,波士顿动力的两大网红机器人Atlas和Spotmini也频频亮出新的技能。这一切始终给人们带来一种智能机器人时代即将到来,而又若即若离的错觉。

如今一些小型的消费级机器人产品、智能音箱等也开始走入到人们的生活中,虽然这些产品以语音技术为核心驱动点的,但也在进一步推进机器人大脑的成熟。而在硬件层面,双足的移动能力、双手的抓取能力虽有突破,但如何稳定运行、如何百试不爽始终是研发中的重难点。

此次,优必选Walker新一代的正式亮相,不仅集成了时下机器人和人工智能研究领域的最新前沿技术,并且以落地应用为前提已基本定义了智能机器人在家庭场景场景中的基本能力。同时Walker也代表了中国机器人公司在大型仿人服务机器人方面取得的突破。而仅用两年解决双腿移动能力,仅用1年时间解决手臂和整个肢体配合问题的惊人速度,也让智能机器人的研发真正进入到了快速开发、快速调试的道路上来。

Walker新一代让我们相信,“机器人管家”正在成为现实。

广告等商务合作,请点击这里

本文为转载内容,授权事宜请联系原著作权人。

打开界面新闻APP,查看原文
界面新闻
打开界面新闻,查看更多专业报道

热门评论

打开APP,查看全部评论,抢神评席位

热门推荐

    下载界面APP 订阅更多品牌栏目
      界面新闻
      界面新闻
      只服务于独立思考的人群
      打开