傅盛:希望做出有用的机器人 不希望只是一个噱头
新浪科技讯 8月18日消息,2018世界机器人大会拟于8月15日至19日在北京亦创国际会展中心举行。大会以“共创智慧新动能 共享开放新时代”为主题,由“论坛”、“博览会”、“大赛”、“地面无人系统展示活动”四大版块构成。 本届大赛汇聚了来自美国、俄罗斯、德国、日本、以色列等全球近20个国家和地区的1万余支赛队和数百名顶尖专家,共计超过5万多名参赛选手同台竞技。
猎豹移动科技有限公司首席执行官傅盛在论坛上发表了题为“真有用——推进中国服务机器人的产业崛起”的演讲。
以下为演讲全文:
什么是下一个更大的机会?任何一个企业都是时代孕育生长出来的,所谓的创新无非就是在一个社会快速变化的时候抓住那个社会领域之间产生的缝隙,然后把需求发掘出来而已。个人并不认为我们有机会去做所谓的创新,更多的是做发现,发现这个社会需求的变化,然后在恰当的时候去做一件恰当的事情,让它自然地生长出来。
猎豹移动在美国有几千万的用户,并很早就在硅谷设立了办公室,我自己也在硅谷生活过一段时间。我在中美两国来回跑,相对中国来说,目前美国的互联网服务实在是太落后了,要在那里上网买个东西一定不可能像北京这样几个小时就能送达。我们当时是想清楚了这个问题,四年前的时候我发现中国整个移动互联网的应用已经领先于美国了,当时在国内竞争太激烈,对手特别强大的时候,我们选择了国际化,并且在全球做了一个小型APP,专门清理手机上的垃圾和病毒,叫做“猎豹清理大师”,两年内在全球拥有了好几亿的用户,到今天为止,“猎豹清理大师”都有上亿的用户。今天就是这样,应用的研发和服务方面中国是全面领先美国的,大家可能都看过这样的例子,老外来到中国就不想离开,因为在中国拿着一个手机就能满街跑,很多国家都是完全做不到的,甚至落后的日本很多地方还是只能接受现金支付,每次去我都很头疼。
回头来看,中国之所以有今天这样的服务,实际上就是互联网技术的极大发展。我们也经常去日本和台湾,有的时候我觉得这就是上一个时代的社会。在日本曾感受到,一个领域过于发达,就会限制下一个领域的崛起,中国正是由于工业化进程到了一半的时候有了互联网化,使得我们整个服务业大幅度升级。但这一波的升级也到了一个转折点,整个服务产业也会进入到瓶颈期。
为什么这样说呢?我有一个好朋友叫沈鹏,他是美团外卖的负责人和创始人,离开美团创办了一家叫做水滴筹的互联网保险公司,我说你为什么要做互联网保险?他说你不知道,以前指挥上万个外卖员工的时候每天都会有外卖小哥遇到车祸和各种各样的意外,我们就在群里给他筹款,后来我想如果出去的话一定要做一家能够帮助这些服务人员提高生活待遇和基本保障的公司,所以就萌发了从做外卖去做互联网保险。
今天的增长瓶颈在哪里?大家都可以看到,社会当中有很多人口红利。如果你是一家小店,你很容易做匠人精神,把服务做得很好,但十家店、一百家店、一千家店的时候没有谁能够保证这种服务还能够高水平地一致,需要大量的培训、人员的交替,这样才能做到。重复性的劳动当中要保持长时间的高水准也是很难的,大家可能不知道,我们的展台上有一个机器人咖啡师,能够模拟WRC高级咖啡师的手型来做咖啡,整个咖啡界如果一个咖啡师每天做超过三十杯的咖啡质量就开始变得不稳定,因为会疲劳,晃的手型就不会有那么高的水准,但机器人可以保证高水准。每个人都是由简入奢易,由奢入简难,享受了高水平的服务之后想要退回来是很难的,我们对服务就会越来越挑剔,但用人成本越来越高。这是属于企业的难题,如何能够保证越来越好的服务,却又用越来越低的成本?
三年前我在硅谷看到一些小团队做的AI功能,觉得非常的诧异。昨天是我从360离职十周年纪念日,离职的时候我做了一款图片软件,但发现美图有做了图片软件,后来有一天他们推出了“大眼睛功能”,作为产品经理我们都很懵,我们都是把照片做得越来越真实,他们怎么做得越来越不真实?因为当时没有这样的AI技术,要求用户点击鼠标,想要多大就多点击几下,为什么不能找到用户眼睛自己把照片放大?我们就研究了很多人脸识别技术,那个时候就有英特尔CV的技术库,只有百分之六七十的概率找到眼睛,无论如何提高不上去,后来我们只好放弃了。两三年前我们发现很多小团队做的产品能够把人脸识别得非常好,后来慢慢地知道有个东西叫做AI技术。机器人界有一个词叫做Perception(即感知),机器第一次有了接近于人的感知能力,无论是语音识别还是视觉识别都可以在某个领域、某个应用场景接近于人,甚至在某些点上超越人。
这是一个非常巨大的历史契机,如果没有AI,摄像头做的所有照片在计算机里面都是简单的0和1的字符串,只有AI出现以后才知道这是一个人脸、这是一句话,使得服务机器人产业才有了新的机遇。当我想清楚这个问题以后,我在想所谓的机器人产业到底是一个什么产业?AI出现之前,我们讲的所有机器人绝大部分都是自动化的机械化工具,很难有自主的感知能力,所以更多的是执行很多程序,帮助其赋予一些预定的工作,很难和这个环境发生真实的、实际的、自主的交互,基本上AI出现之前我们谈的机器人,尤其是工业化的机器人,更多的是自动化的机器,更多的是千百次地重复一个被高度定制的行为。只有当AI出现以后,我们才有可能使得这个自动化的机器从工业产线走出来,奔向我们的生活场景。生活场景是比工业产线大十倍甚至百倍的场景,这样才能在一个半开放状态下和你实现互动,主动地感知提供服务,这是一轮非常关键的历史契机。
工业制造方面,我们没有机会和领先企业竞争,但由于AI的出现,使得机器人变成了一个非常跨界的技术,只有机器制造空气动力学是不够的,只有AI技术也是不够的,除此之外还需要有互联网的应用。今天的服务机器人可以看成手机当中一个又一个的APP,我并不认为今天会出现一个可以跟着你到处完成所有任务的机器人,就算拿着手机也不能完成所有的服务,需要下载一个又一个专用的APP。通过这种垂直维度思考可以发现,互联网的思路重新考虑机器人,可以找到很多垂直场景的应用,就像有着实体的APP一样,只在这个场景下提供服务,我们就有机会把用户体验和机械制造、人工智能结合起来,做成一个又一个垂直场景的机器人。
这是我自己的机器人公式,就是“AI+软件+应用+服务=机器人”。今天在某个维度特别突出的未必能够做出一款真正满足用户需求的机器人,我们在讲技术创新和黑科技,其实所谓的技术创新和黑科技的本质都是可以给用户提供服务。因为我自己并不算是真正科班出身的技术人员,2002年进入互联网的时候我就莫名其妙地得到了一个职位叫做产品经理,今天想起来,那个职位在当时应该说是互联网第一批产品经理的职位。我们并不懂产品经理应该干什么,但我们当时在想用户到底需要什么,如何把这些技术包装成用户需要的样式。当时遇到的最大问题是做软件的同事能够写出很好的程序,但用户不会用,可能就是界面不会点击,觉得这个简单的文字读不懂,后来我们才发现原来用户需求才是最关键的。
后来我自己做安全软件,在只有几个人的情况下对抗几百人的传统杀毒公司。我们用了所谓的非常底层的一些技术,但快速满足了安全需求,使得我们做的安全软件在短短两年内就在中国拥有超过50%的覆盖率。此后,我又做了一款叫做“猎豹清理大师”工具在美国提供下载,虽然是看上去非常简易的应用,只是把手机当中的垃圾文件清理掉让空间变得更大,在全球广受好评。今天的机器人也是这样,一定要为用户提供他们真正需要的服务,把所谓的后面的黑科技变成可以非常简单使用的服务,而不只是一个技术参数。我自己和猎豹共同投资了一家叫做猎户星空的公司,专门负责打造全链条技术,然后再由猎豹移动过去十年历史当中积累的用户体验结合起来,打造真正有用的机器人。
这里要着重介绍一下猎户星空这家公司,因为经过思考我发现,猎豹移动在全球做出几亿月度活跃的时候,安卓手机已经是非常成熟的生态系,只需要在上面做一个应用就可以让全世界的用户使用。但今天机器人不是这样,AI+硬件+用户体验,其实这里的每个环节都是很早期的。我们讲深度学习大家听得都很热,要是用手机来看,整个深度学习AI领域还是处在非常早期。这个时候很难在市面上找到一个符合需求的技术方案,所以当时我们下定决心,根据自己的需要去定制所有的这些技术环节,使得其组合起来能够变成在用户层面非常好用的产品,我们花了很大的力气打造语音识别、视觉识别、自主导航、机械臂技术。
当然,这是这个时代给我们最大的机遇。很多人问你是做移动应用APP的,你怎么能做深度学习?好像深度学习只有大公司才能做,我说恰恰相反,深度学习给我提供了一个弯道超车的机会。以前很多感知学的不同专业差别是非常大的,人脸识别、翻译和语音识别,每个领域都需要专门的专家,但AI出现以后使得跨行的各个领域变成了集中的底层,神经网络模型都能够在语音识别、人脸识别、图像识别方面达到同样的效果。这就使得我们有机会用一个通用型的技术模型解决各个领域的感知问题,我们也看到了这样的机会,所以定义了机器人的眼耳口鼻手脑,每个环节分别打磨这样的技术。打磨的过程当中,我们又想避免自己成为研发型公司,所以在每个领域都去推出相应的产品,让用户检验我们的技术是不是真的好用。
这是我们的人脸识别算法,之前拿过单模型的冠军,但仅仅如此是不够的。我们在美国也拿过一些世界挑战的冠军,这些都只能表明模型的能力,还是要在很多地方落地。这是互联网公司的优势,我们在全球有几亿月度活跃用户,美国也有最大的第三方直播平台,每天有几十万的用户开直播,直播当中其实都是人脸的数据,这就使得我们这样的人脸识别效果能够很快地提升。今天在猎豹所有的办公区都是刷脸,几千名员工每天上下班购物,包括会议室的预定,就连我要求特别严格的公司会议都是刷脸,不来的都可以罚款。
我们还做了语音合成技术。其实语音合成不是技术突破难度的产品,而是去尊重用户体验的产品,我们用了大量拼接的技术一句一句地听,然后反复调试。
由此开发了一整套的语音为基础的OS,大家可能不知道,今天美地的音箱、喜马拉雅的音箱、我们自己的小豹音箱,包括小米音箱大部分都使用了我们猎户的语音识别能力,而且已经有超过千万的用户每天使用我们的产品。我们认为所谓的语音识别的核心并不是所谓的多么了不起的黑科技,而是交互界面。乔布斯说过,每次交互界面变革都是产业革命的机会,所以从键盘到鼠标到触摸屏到语音交互,其实是一代又一代的交互革命,我非常看好智能音箱和咨询服务机器人,再也不用用户在没有见过的屏幕上面触摸了,而是用最自然的方式表达。目的不是为了和机器聊天,而是通过语音获取想要的内容和服务,我们也接入了大量内容。
我们还做了室内导航的技术,如果一个机器人不能主动移动,其实就很难真正谈得上是一个机器人,和Pad没有什么本质的区别。我们在这里下了很大的功夫,最重要的核心不是能够移动,而是用很低廉的成本移动。我们用了激光+视觉的导航,激光的传感器成本大概只有几百元人民币,用了大量的算法优化使得激光和视觉能够配合,使得在室内的空间能够自主移动和避障。
这是多模态的导航技术,仅有一个点是很难的,包括今天的视觉,我们解决不了所谓非常大的逆光的问题、玻璃的问题,其实就是用多个传感器进行相互的融合。我们加强做了机器人麦克风的阵列,因为一定要在嘈杂的环境当中非常精准地听用户的反馈。大家可以去展台上看一看我们的机器人,这个方面我们完全做到了高噪音下基本可用,不能说是100%保证每句话都可以听懂,但基本上对用户来说已经可用了。
我们用了多家的芯片技术为我们整个机器人提供足够的算力,“3.21”的时候在水立方发布了五款机器人,很多人问为什么要发布这么多款?为什么不只做一款?就是因为这个行业处在很早期,我们很难像智能手机一样通过一次大屏的革命就保证能够跑不同的APP,并且在不同应用当中满足需求,这是化整为零的策略,不同的垂直场景提供不同的服务,让产品和用户一起成长。用户的反馈越来越多的时候,慢慢地就可以抓住真正用户的需求是什么,能够知道不同的用户需求当中能够抽象出什么相同的东西,让它变成一个统一的产品。今天机器人行业还很难推出一款类似iPhone的产品,一个产品的形式就可以满足用户对移动电话和智能电话的需求。
我们每个人在讲机器人、讲人工智能、讲语音识别的时候都会看到它出错的场景,因为今天传感器和各种摄像头、麦克风还不能达到人眼和人耳的水平,今天所谓的人工智能就算出来,其实并不能像人这样动态地理解各种定义场景的时候,很多时候的确容易出错。人工智能最大的好处就是能够保证一个标准以上就不会再掉下来,可以保证不断地重复。为了能够达到这一点,我们用了大量的传感器和芯片的组合,保证我们定义好的场景能够实现高标准的交互和服务。
现在猎豹移动已经开始用这台机器人取代了我们的前台,当然,我们的前台离职率也很高,相信这是大部分公司都面临的问题,总是需要一个比较能够代表公司形象的前台,坐在前面的时候基本上都在找工作或者做网红,一旦看到机会就会离开。每个客人在来的时候都想介绍一下猎豹移动的产品和历史,过去做不到,今天能做到了,每个人开会来找我的时候机器人都会介绍一下中文的历史,整个接待水准可以做到一致化。“豹小秘”也在鸟巢附近的博物馆上岗了,用户愿意的话扫下二维码,可以给用户去讲每一幅画。
除了信息咨询服务之外,我们也在思考有没有机会让机械臂从产线走到生活场景?因为这是一个巨大的,能够提供重复劳动的场景。以前走不出来的核心原因是什么?是因为太贵了,我们都知道一只机械臂动辄几十万、十几万、大几万的价格,让其很难进入生活场景,但为什么它会很贵?就是因为AI出现之前所有的机械臂动作都是要高度定制和快速,所以那个时候我们对机械臂最高的要求是它的精度,因为一旦到不了那个位置就拧不了那个螺丝,也会导致整条生产线停下来。今天由于有了AI,即便是误差稍微大一点,我们可以在最后让它重新做校正。
这是我们做的事情,机械臂上加了摄像头,使得其在最后的时候校正自己的行为。举个例子,老太太的手哆哆嗦嗦,但还是可以穿针引线,因为有了视觉的识别,AI和机械臂结合起来我们就有可能用廉价的方案制造更多的机械臂,使得它的成本能够降下来。由于有了视觉,部署环境不需要那么苛刻,我们做的一款咖啡机,知道那个杯子掉下来没有,如果没掉下来会加大力度,这就解决了工业生产线非常复杂的部署问题。我们非常有信心把这款机械臂的价格非常亲民化,使其大量被应用,完成那些重复的劳动工作。
这是我们做的“豹咖啡”,就在我们的展台,请了WRC高级金牌咖啡师去试校摇咖啡的动作,现在已经做到了不需要编程,只需要一个人来做动作,机械臂就会完全根据这个轨迹来做。我们做了一整套关于学习运动轨迹和用很多子动作拖拽就可以完成机械臂运动的软件,有了软件和AI,使得整个机械臂的运转变得更加容易。希望让每个小卖部都能够提供五星级酒店的服务,这在以前是非常难的,五星级酒店之所以是五星级酒店就是因为它的服务高标准一致化。一旦我们的产品在一个非常简单的垂直场景接待来客,介绍产品,能够实现用户满意度的话就可以大量复制,我们真的可以让每个小卖部就像五星级酒店服务一样不厌其烦、永远热情、保持微笑,有问必答,也希望让每个乡村品尝到金牌大师的咖啡。这在以前是非常难的,今天大家去一些地方的连锁咖啡机构,最大的难题就是招到好的咖啡师,因为需要培训,还要面临高昂的人力成本,而机器人只会越来越便宜、越来越普及,越来越让大家在追求梦想的同时享受越来越好的服务。
我们希望做出真有用的机器人,不希望机器人是一个噱头,或者是一个黑科技,应该切切实实走在我们身边为我们提供服务,从一个小点开始变成和我们共同生长、共同生活的人类的好伙伴和伴侣,我们也希望猎豹移动有机会和大家一起帮助中国整个产业服务升级。