本文来自三角兽CMO马宇驰在黑氪HitCrunch2017-嬉皮士·想象力与科技上的分享实录
马宇驰:大家好!感谢今天到场的所有观众,今天我给大家分享一个主题:人工智能与你有什么关系?

关于锤子手机中的Big Bang功能
AI 语义带来的Big Bang是我们帮锤子做的其中一个项目。关于老罗,他其实是一个很正经且务实的企业家,不像台上表现的那样,只能说锤子的产品品牌需要这样的一个角色,这也是我们很多创业公司和创始人的角色代表。
去年号称资本寒冬的时候,我们三角兽公司在10个月内完成3轮8000万融资,同时我们是百度DuerOS金牌合作方,腾讯微软加速期第九期合作企业,新浪AIlab合作方、小米等合作方。

之前我们做的Big Bang1.0版本功能其实很简单,就是一段文字断开,方便人们节选其中的某些词语作为关键字进行搜索。今年锤子手机的Big Bang功能完成了新的升级,做了语义的智能拖拽,任何一段文字,在不需要断开行成关键字的情况下,直接复制粘贴到相关的APP里,就可以通过智能识别的方式显示相关的需求。
比如今天下午三点要在南山文体中心进行黑氪分享,如果把这段文字复制到百度地图里,那么显示的就是地址,复制到日历显示的就是提醒,它的智能就在于一段文字包含了很多信息,包括时间、地点、人物、吃喝玩乐,通过我们的幕后处理,可以在意图识别上精准地判断这段文字通过不同的APP而要展现的内容,这就是人工智能带来的智能便捷的行为方式。

你所看到的人工智能或许不是真的人工智能

用户体验升级其实用一个字就可以描述——“爽”,任何事情你觉得用它更节省时间、更快速、更方便,这种感觉就是一种用户体验,人工智能带来的更“爽”就是可以更大地提升效率,这不是离我们有多远的词汇,很快就会用到,比如锤子手机、小米电视,买了就可以体验。
行业升级,好比如汽车、火车原来烧煤,但是现在用的是汽油,行业升级带来的是本质的变化。人工智能就是如此,所有的创业其实追求的都是在某一方面释放人类追求极致的天性,比如O2O上门是为了获得更好地体验。
人工智能是一个很大的领域,目前市面上打着AI标签中90%的公司都不是AI公司,最主要体现在三个方面:语音、语义、图像。语音相当于耳朵和嘴,语音识别是耳朵,北京、北平就是语音识别,识别成文本就结束。图像相当于眼睛,识别照片上的是男还是女,是孩子还是老人,识别完就结束,这是图像。语义是包含了语音和图像后面的部分,计算机系统只认识文本的处理,包括图像、声音、意图分析,你点滴滴就代表要打车,这些都是语义处理。

我们为什么能够做这块?我们的联合创始人是微软小冰和百度度秘的技术创始人,这是我们的基础所在。人工智能这个领域,诸如深度学习、机器学习它们都只是工具,它和C++本质上没有差别,就是算法,它只不过更复杂、更厉害一些。会了这个基础就可以做吗?不一定。语义理解、决策过程是人工智能的工具、模块,类似于建大楼用的砖和墙。应用领域是真正商业化的,学术界在做很多理论上的研究,但要应用于工业界则是很大的跨界。比如说,从你研究汽车钢铁的强度,到你做成一辆安全的汽车,这是十万八千里的事情。而我们现在在做的可以简单地把这些功能包成API封装起来,通过云就可以应用。

人工智能的本质是什么?就像从北京出发去深圳,结果一样,我都来了,但差别在于过程,是通过走路还是搭飞机,这是完全不同的。我是昨天晚上坐飞机飞来的,如果准备走着来,可能3月前就要准备往这边来了。目前市场关于人工智能的一些泡沫也好,虚假的人工智能公司也好,打的就是这个差,大家看到他们也能做成这个样子,其实他们在现场的演示都是通过人在后面操作,用关键字和或者其他比较笨的方式进行演示,这些谁都可以做。
人工智能两大核心
海量数据+算法模型=实际应用+实战团队
在电影《西部世界》还有英国的《黑镜》等种都有对人工智能的前瞻,人类对自己未知的,希望能拓宽潜能的部分,但是技术上没有达到,怎么办呢?靠想象力,想象是一把双刃剑,至少在人工智能行业就是如此。机器懂的是规则,所有它会的东西,你都要去教它,教了之后,在这个规则上去学更多的东西,但是它不可能超越,你没有教它爱,它不可能学会。所以,真正的数据和算法模型最后就落到实际应用和实战团队上,就看这个部分是否真正用于商业化、是否可以和你身边息息相关。
人工智能语义三大技术方向:聊天、多轮对话、跨域中控
很多人问是否有已经落地的产品是我们已经可以用到的?其实锤子和小米就是。聊天,我们叫开放的聊天。这件事情值得小骄傲一下,国内只有一门技术是从国内返到国外就是聊天,我们做了微软小冰和百度度秘。比如今天王宝强离婚了或者某某开演唱会,观众就开始在各种网页刷评论开始互动,只要是同一个主题,不管你聊50页还是上百页对于我们来说都是同一组数据。这个时候抓取数据后让机器学习,比如“今天穿短袖漂亮吗?”“短袖”这个词涵盖了外观,涵盖了温度、材质、颜色、价格等等不同的维度。这就是中文特别难的地方,所以中文只能用机器学习的方式来抓取数据。之前在马蓉的微博突然涌现进行了十几百万人去骂她的时候,我们做了这样一件事,我们把十几百万的数据抓下来,我们训练了,如果我们开放这个系统,你绝对骂不过机器。

还有一个是有目的的多轮对话,比如你说今天天气怎么样,我要订什么票,明天要去哪儿,这都是有目的的。比如点菜,点这个菜还得问问服务员好不好吃,服务员没有听清,还得再问你是不是这个菜。它的价值在于提供了信息和服务,让你三句话说清楚一件事就不要用五句话。比如订票,明天上午我要回北京,国航经济舱11点的机票。我们这一代人是被搜索引擎训练出来的,产品对于用户习惯的教育有着非常严重的影响,我们认为很多选择是自己判断的,其实不是。比如搜索引擎,我们查天气的时候,会在搜索引擎中查“深圳 天气”,而我们平时聊天的时候会是说“今天深圳热不热,需要不需要带伞?”我们要做的是影响用户习惯,这代表商业化,是你做公司的价值。
跨域中控
大家印象中的人工智能是无所不能的,拆成几个方向:智能信息,90%的人工智能公司原来是做搜索引擎的,然后现在说自己是做人工智能的,这是不科学的。好比说你是做轮胎的,非要说自己是做汽车的,这是很尴尬的事情。


智能聊天和多轮对话,让人工智实现了应用的价值。主动学习,主动反馈,这部分是人工智能真正要具备的。比如在车载系统上你说今天晚上要约女孩吃饭,会说要不要送女孩一束花,要不要送女孩一瓶酒,要不要跟她明天吃一顿早餐?这是潜在挖掘,如果机器不主动学习,系统进行问题的前半部分就结束了。比如系统搜索你说和女孩到哪里吃饭,它就会做导航,这就结束了。而主动挖掘就比如你要和女孩吃饭,人工智能会挖掘你除了和女生吃饭,你可能还要给女生带花这种潜在的信息,它就显示方圆三公里的花店的导航。再进一步可能会显示这个花店有什么价格的花让你完成线上交易,你可以直接去花店拿。整个人工智能的过程行程一个商业闭环。如果是公司实体的存在,价值就在于把技术用于产品,产品用于商业化,能够活下去带来价值。
三大领域
我们将智能语义用于企业品牌、市场、用户运营。我们给光明网做了一个类似于机器人的“小明”,只要你扫“两会”的会员,如果这个人是两会的代表,那他关注过的议题,关于他的新闻,他发表过的作品上面都会显示。腾讯的应用宝,把APP变成类似小程序的东西,原来你说要看《变形金刚4》,你要搜索查找,但这个它会直接给你一个链接,你点了就可以看了。
政府、央企、央媒
企融、保险行业。智能客服,你给招商银行打电话,客服会说信用卡业务请按1。而在欧洲,30%是机器人来回复的。这件事情你们可以认为,我们极大地节省了人在后台的效率,有一个类似于机器人的东西他可以替代人去7×24小时在微信和微博上工作,类似于新浪的微博助手,那个就是我们创造的一个人机交互的人工智能的体现。
IOT

IOT其实就是物联网。智能硬件包括智能家居、智能车载、智能手机等等,智能就体现在他们的软件上,所以很多做人工智能的公司会被调侃说成是软饭硬吃。比如小米电视,你可以问它大白是哪个电影?冯小刚的媳妇儿演了什么电影?等等,找到这些相关的信息都是非常简单的,这些都是经过全网学习后的一个结果,也是人工智能的关键所在。深圳有很多的硬件厂商,他们都会反问这就是所谓的人工智能吗?其实不是因为人工智能很差,而是没有做好。比如说,人工智能带来的交互对话、回答问题,它给了你过高的预期,结果用了之后很失望。这件事情不是你期待的问题,而是它宣传口径的问题。
泛娱乐
针对动漫二次元、游戏、虚拟偶像、真人偶像。让虚拟角色活起来,把机器猫等做成活的,我们预计在今年年底之前可能会出这样一个demo,需要时间,我可以很负责的告诉大家很多企业秀的人工智能都是事先设定好的模板加上幕后的人去操作从而实现的。所以要把聊天做得足够好,机器学习学的足够好,才能去模仿人和人之间不同的性格,这就好比让机器去学习两个15岁的姑娘,你怎么让机器把不同的两个人学的足够不一样?
AI的价值

一是提升效率、节省成本。二是依靠算法重构海量数据。重构的意思是让数据在算法的基础上有了用武之地。如果你没有购买行为、没有点击查询、你用的东西很散怎么办呢?人工智能终究还是要了解你是什么样的人,你是长发、短发,喜欢吃什么、喝什么,这种是极其立体的。我们可以通过这些拿到海量的数据。你晚上12点不睡觉,然后还和人工智能的系统聊天,系统回你一句你是工作还是在外面玩等等,这都是信息。都可以用来描绘精准用户画像。
如果我们把火箭的速度当成标准的话,汽车和轮椅的速度就没有区别,就是因为现在的期待过高,动则说人工智能就是《西部世界》的状态,眼前站了一个女的,不知道真假。我们专门去了大连,探访了成人硅胶娃娃的公司,我们在想能不能做成一个有衣服穿,可以说话,可以互动的的硅胶娃娃,这还是可以期待一下的。比如说,拿到版权,有的宅男喜欢苍老师,做成苍老师,可以和她聊聊天。
判断人工智能公司三个维度

是或不是——技术基因不会凭空出现,好比一个在少林寺扫地扫了20年的和尚说要做人工智能,这是不太现实的,他不是技术出身,没有相关的技术基因。所以团队非常重要,我们公司的团队都是从微软和百度的团队过来,而我本人也是做了12年的市场以及企业品牌运营。
能或不能——说的就是落地应用。举例子比如你是一个医学院的学生,到你成为一个特别牛的外科大夫还有相当长的路,能不能把理论的东西落到实地。
好或不好——是通过交互体验来判断的。我们曾出现在小米、锤子还有百度的发布会上,锤子和小米是产品级的公司,产品如果达不到它要求的极致,我们的产品就没办法生效。所以可以说在这个方向上,我们公司是在国内唯一一家可以满足他们条件的最好的公司。所以,好与不好是决定性的东西。
未来我们会把公众号接上一些功能,你可以和它聊天。我们目前的聊天能到什么程度呢?在语量上超过小冰和度秘。小冰和度秘是一亿级的语量库,我们这边是70亿。这是一个本质的差距。
这是我所有的分享,非常感谢各位!
