新浪科技 软硬件

特写:智能音箱火爆虚实 共同做大才会有未来

财经天下周刊

关注

本轮智能家居入口争夺战的焦点已转向智能音箱。行业巨头与创业公司仍在面向风口快速跑马圈地,但技术短板、市场尴尬、标准缺失、各平台互联互通之难等却被有意无意忽略。它们或将成为入局者折戟沉沙的致命伤。

记者:孙静

编辑:齐介仑 

由咨询公司Gartner在1995年首度推出的“技术成熟度曲线”一直被业界广泛认可。依照该曲线绘制原理,一项新技术,从产生到成熟,至少要经历5个阶段:萌芽期、期望膨胀期、泡沫幻灭期、复苏期、成熟期。

如果现在把智能音箱拖入这条曲线,人们将会看到什么?

“泡沫。”喜马拉雅副总裁李海波搅动着拿铁杯里的奶泡,铅灰卷发下,一脸超然。

2017年4月,李海波在上海某展会上亲自体验了近百台智能音箱,开窗帘、关空调等大都还灵,一到语音内容上,10句话有9句不能准确识别。按他的标准,没有一台能用的。

“我认为,一年之内,销量都不会很大。”小米公司联合创始人、小米电视负责人王川也审慎地作出判断。

在高调的发布会与密集的媒体报道之外,国内智能音箱行业真正的挑战正在到来,那就是如何顺利占领客厅。唯有将这条路走通,智能家居入口的故事才能继续。

各怀心事,快速卡位

2010年,出门问问创始人李志飞还是谷歌总部的一名科学家。那一年,亚马逊从美国各高校招入很多做语音识别的新员工,这里面就包括李志飞在约翰·霍普金斯大学的师弟、师妹。

当时他既困惑又好奇——亚马逊这是要做什么?

后来的故事如今已广为人知:2014年11月,智能音箱“鼻祖”Echo悄然诞生。它能播放音乐,能收听新闻,能点比萨、叫车以及定闹钟。最新消息是,它内置的语音助手Alexa已拥有惊人的1.5万多个功能,远远胜出Google Assistant的378个以及微软小娜的65个。

不只如此,自问世之日起,Echo即常年占据亚马逊首页显著广告位,销量一路看涨:2015年,400万台;2016年,800万台;2017年,预计1000万台以上。

Echo的成功,带火了智能音箱这一品类。科技巨头如谷歌、苹果、微软先后跟进,Facebook也已投入研发。

而在国内,智能音箱概念搅动的创投躁热,甚或已远超硅谷。不仅人工智能创业公司与互联网巨头纷纷入场,甚至栖身于深圳市南山区的一众智能硬件厂商也已开始磨刀霍霍拼模组,无不盘算着面向风口大赚一笔。

“其实风口早就来了。”喜马拉雅副总裁李海波说。2016年4月,喜马拉雅正式筹备研发智能音箱。2017年6月20日,首款产品“小雅AI音箱”正式发布并展开预售。与别家不同,喜马拉雅不为打造智能家居入口,也不为卖硬件,而是要让自家App实体化。

▲小雅AI音箱。

这更多出于喜马拉雅对自身危机感的考虑:移动触屏时代正在向语音时代过渡,如果有一天,人们不用手机了,喜马拉雅以何立足?他们认定的方向是语音交互。

受命统领喜马拉雅硬件事业部时,李海波曾和CEO余建军立下约定:硬件部门不背营收KPI,考核指标只能是增加用户和时长。截至2016年12月,在手机端,喜马拉雅已拥有3亿多激活用户,每日新增用户40万,用户日均使用时长128分钟。李海波认为,用户基数、使用时长的增长,与公司估值成正比,对未来上市更是影响深远,这比卖硬件的意义大多了。

不难发现,喜马拉雅的商业模式是与其他各类应用及设备争夺用户时间,而BAT、京东、联想、小米等大公司,筹谋的则是未来智能家居入口的想象空间。

在智能音箱之前,路由器、开关、电视、机顶盒等,都曾被视作家居入口且不乏巨头涌入。但这一次,相较以往,阵容和声势都要雄壮得多。

受Echo缔造的商业传奇的鼓舞,国内大大小小公司陆续跃身其间,争相卡位。

从时间上看,2017年的智能音箱之火,最早由联想点燃。1月初,联想智能音箱在美国拉斯维加斯CES上亮相,产品分为海外、国内两个版本,4月正式在联想官网开售,最新售价799元。

此外,联想新近还成立了智能音箱事业部。在7月20日举办的联想TechWorld大会上,联想集团CTO芮勇花很大篇幅介绍了升级版智能音箱SmartCast+。演示看上去很美好,芮勇与小女孩现场出考题,带投影屏的音箱对答流畅,而且它还支持投影购物,可一键下单。

▲联想SmartCast+及投影屏演示效果。

接受《财经天下》周刊记者采访时,联想集团董事长兼CEO杨元庆对SmartCast+不吝赞美:“亚马逊给智能音箱加了块屏幕,我觉得加块屏幕就是PC了,这个不如我们的设计——依然是音箱形状,但是可以给你有互动的屏幕(投影),触摸的屏幕。这是一个能够帮助我们实现梦想的技术。”

但SmartCast+仍停留在实验室Demo(样机)阶段。芮勇自己也说,项目的研发时间很短。联想研究院的一名技术人员则透露,老板希望产品尽快上市,越快越好,因此很多工程师如今都要加班。

这与智能音箱市场争夺战正在升级有关。联想之后,海尔、出门问问、喜马拉雅、阿里、小米等公司,先后发布了自己的智能音箱产品,据称腾讯今年8月也要发布新品。稍显不同的是百度。7月初,百度集团总裁陆奇在百度AI开发者大会上宣布,百度对话式人工智能系统DuerOS要做成开放平台,类似基层水电服务商,将数据和语音技术分享给第三方。

至此,这条赛道上的选手涵盖了互联网巨头、知名硬件企业、电商平台、传统家电厂商以及如雨后春笋般涌现的大量人工智能创业公司。而像科大讯飞、思必驰、云知声、图灵机器人等国内人工智能技术头部企业,也以提供语音助手技术等方式,参与到这场汹涌澎拜的热潮中来。比如联想SmartCast+的语音技术来自图灵机器人,天猫精灵的语音技术来自思必驰。

“目前大家都在抢坑,而不是在做产品。”一位业内人士对《财经天下》周刊记者表示。据他观察,某厂商已连续开了4次发布会,但直到现在,产品仍处于手板阶段,不能发声;另一厂商原本计划5月发布新品,但由于体验一塌糊涂,只能延后。

相比之下,灵隆科技CEO魏强稍感轻松。2015年3月,在Echo发布4个月后,京东集团与科大讯飞便联合成立了灵隆科技,目标也很明确,打造中国版Echo。此前,为了在物联网和智能家居领域布局,京东成立了京东智能集团。魏强和他的同事们一直在探索智能家居的入口级设备,路由器、平板、智能插座、个人WiFi……最终确定了智能音箱这一方向。

对京东而言,智能音箱可以成为购物入口。与之思路相近的,还有阿里今年7月发布的天猫精灵X1。

2015年8月,叮咚第一代产品发售,售价798元,这比很多同行早了近两年。目前,叮咚已拥有150多项技能。

魏强称,在创业头两年,自己有着很强的孤独感:市场不温不火,产业链冗长、繁复,尤其生产端,几乎从零开始。他去深圳考察过很多做语音识别、提供技术方案的公司,最大的困惑是,国内没有一个针对音箱或者语音交互的芯片硬件平台。音箱生产厂家也基本走了一遍,每家都要做智能化改造。

创业公司Rokid起步更早。Rokid创始人祝铭明自2014年离开阿里,就筹备做智能音箱。他的出发点是,人工智能落地势必涉及人机交互,而语音会比视觉更早进入消费市场。

当时Echo还未上市。Rokid投资人、IDG资本合伙人楼军回忆,他向祝铭明问起具体产品形态,后者就在桌子上给他画了一个蛋,说这个蛋是一个灯,下面可以放音箱,你说什么,它都可以听得懂。

▲Rokid若琪新品。

Rokid第一代产品若琪,2016年4月才开始小批量生产,因为公司内部有条红线:用户满意度至少要达到85%,才能推向市场。

由于国内市场有待培育,很长一段时间,若琪有点像是发烧友小圈子里自娱自乐的设备。即使是拥有京东渠道与科大讯飞技术双重优势的叮咚,也在市场推进过程中遭遇重重障碍。

一位不愿透露姓名的业内人士对《财经天下》周刊记者表示,叮咚智能音箱迄今实际总出货量仅在10万台左右,而真正达到入口级水准的产品,这一数量至少要在百万台。“那两年,魏强挺辛苦的。”他说。另据称,因为批量偏少,叮咚还曾被上游供应链合作企业提价。

不过,进入2017年后,智能音箱骤然火爆,市场迅速升温。祝铭明开玩笑说:“现在最辛苦的就是媒体记者了,大家都在吹,记者都不知道该怎么写了。”

与Echo式成功还相去甚远

多位业内人士表示,中国智能音箱企业很难复制Echo在美国的成功。

综合看来,原因包括以下几点:第一,用户基础不同。出门问问曾在中美两国做过用户调研,美国80%的受访者知道智能音箱,而国内受访者对此的知晓率只有15%~20%。第二,美国人的客厅、厨房普遍很大,也很开放,更适合远场语音交互。第三,使用习惯不同。音箱在美国属于大的消费品类,而国内音箱普及率不到20%,更不用说智能音箱了。

用户体验无疑是判断产品能否撬动国内市场的基本依据。

百度音乐商业总监刘小北对智能音箱的印象停留在“Low”“不实用”层面。他的家里摆着好几个品牌的智能音箱,都是半年前购入的,但有的经常断连,有的无法理解指令。新鲜感消退后,索性放在角落里任其吃灰了。

之前同合作伙伴私下交流时,刘小北曾调侃智能音箱是个伪需求。“父母来你家,看你跟音箱扯着嗓子说话,那场景得多傻呀。”

“智能音箱会是入口吗?我不知道,也许会。”祝铭明强调,产品成为入口的前提是用户喜欢并频繁使用,而非只是放在那儿而已。他看过一组数据,语音交互产品使用7天后,留存率仅为3%。“满分100分的产品,做到85分,勉强有人用。但要用户一直使用,就要90分以上。”

《财经天下》周刊记者曾问联想集团执行副总裁刘军给联想智能音箱打多少分,刘军打了80分。但这款产品,联想并未重推,市场反响一般。刘军给出的解释是,智能音箱与传统PC硬件的产品逻辑不同,前者需要在用户使用过程中不断调试、迭代。

就此而言,先行者叮咚,软件产品已经迭代了30多个版本。比如交互层面,原来每完成一步操作,叮咚都会有提示音反馈,但用户觉得啰嗦,后来就取消了。另外,叮咚已累积海量的用户语音交互数据,可据此对远场语音识别技术不断优化。

出门问问创始人李志飞发现,目前有些智能音箱厂商,Demo展示得很炫,但绝口不提产品缺陷。事实上,真到推广时,细微的缺陷也会变成巨大无比的痛点,比如联网稳定性、语音交互速度、是否耗电等。

这些其实都是出门问问此前做智能手表时踩过的坑,今天同样适用于智能音箱行业。出门问问也是语音助手Google Assistant的硬件合作伙伴之一,该公司的战略方向便是“语音交互核心技术+软硬件结合”。

▲即将上市的出门问问智能音箱新品。

小雅团队也在硬件研发上踩过很多坑。比如音箱顶部布料略紧绷,加了0.5毫米厚的衬料后,小雅语音识别率一下从95%降到了10%,几乎每一句都听不懂。物料形态变化导致算法失效,重新计算多花了1个月时间。小雅原定2月14日发布,后来一直拖到6月20日。

“一点点改动,就有可能要全部推倒重来,很恐怖的。”李海波感慨称。

目前国内智能音箱最大的技术问题,或许是语义理解和多轮对话的用户体验不够好。举个最简单的例子,当用户说“我想听《罗辑思维》”时,音箱很可能百度出来的是“什么叫逻辑思维”。

《财经天下》周刊记者曾体验过某知名厂商产品,在半米内让其“播放李健的歌”,音箱被唤醒后,传来的却是高亢的民族女声。这是上一首被叫停的歌曲。记者说“下一首”,音箱继续播放该民族风歌曲。再让其定个闹钟,音箱则陷入尴尬的沉默。

魏强分析称,语义理解是世界性难题,需要场景开放,而且数据量要足够大,所以智能音箱要限制内容服务的类型和范围,这是语音交互产品与传统触控产品颇为不同的一点。

“很多品牌,在前端环节就是拼模组、拼技术,而不是拼体验。”李海波在深圳见过的绝大多数智能音箱品牌,需要准确说出“播放下一首”这5个字,音箱才能听懂指令。但其实,这句话的表达方式有60多种,比如“给我换一个”“我不喜欢这个”等。

从决定自己做智能音箱以来,李海波带领团队一直以“处女座”的苛刻全心打磨产品。为让声音有老收音机一般的质感,小雅底部喇叭换过30多个。他的要求是,低音浑厚,高音不刺耳,连续收听3个小时不会觉得烦躁。因为按照他的标准,音箱使用时长不到3小时,都不算激活。基于技术突破,目前小雅已可实现语音内容的断点播放。

李海波称,喜马拉雅作为内容型互联网平台,杀入硬件领域做智能音箱,目的就是要树立一个语音交互体验的样板。

目前叮咚、天猫精灵X1等已接入喜马拉雅的内容,不过据称真正开放共享的内容,不到喜马拉雅6800万条语音内容的30%。还有一些热门内容,如郭德纲相声等,按照与版权方的协议,喜马拉雅只被允许在本平台播放,不能再转售或共享。

创业公司只能当炮灰?

迅雷联合创始人程浩近日在一次演讲中直言,入口争夺战,创业公司要躲远点,不是溅一身血的事儿,而是很容易成为炮灰。

言下之意,这是巨头的游戏。

但Rokid、出门问问等创业公司未必这么看。他们正着眼当下,竭力提升用户体验。

“阿里的发布会我去看了,出来我就放心了。”一位要求不具名的业内人士表示,他原以为天猫精灵X1会有块屏幕,类似EchoShow,以凸显电商平台的购物优势,实际上并没有。在他看来,阿里现在做的事,并不是他们擅长的。此外,软硬件结合是一种基因,不是资源整合、找别人去拼组就能真正达成的。

Rokid创始人祝铭明不担心与大公司的竞争。在他看来,巨头的加入有助于炒热市场,但智能音箱的市场容量支撑不起大公司的欲望。

祝铭明认为,巨头在流量、数据、资金等层面具备优势,但大公司做单品的压力在于,能否在短时间内集聚大量用户,如果一年只卖几万台,与平台量级不匹配,谈入口就没有意义。在他看来,目前国内用户对智能音箱的接受程度有限,大公司在投入不菲的情况下,是否有足够的耐心等待该单品不断迭代,成长为爆款,很难讲。

号称要“All In”人工智能的联想,就没有把赌注只押在智能音箱上。刘军透露,智能音箱是联想看好的众多智能设备当中的一款,公司另外还有一个全线产品规划。

李志飞同样不认为BAT入场就能把创业公司碾死,理由是,智能硬件不像互联网软件产品那样可以赢家通吃。比如智能手机领域,苹果再厉害,也只占到了全球15%的市场份额,后面的华为、小米等前十名都有不错的出货量。

但对小公司而言,挑战也显而易见:人才储备、技术研发、资源整合等,哪个环节出问题,都有可能玩不下去;此外,巨头涌入后,小公司的步伐很有可能被打乱。

先行者如Rokid,已经在加快节奏,除了寻求独家内容合作商,他们另已开始在探索线下销售模式。原因在于,祝铭明发现,智能音箱的线下转化率非常高。为提供更好的用户体验,若琪今年准备在20个城市开设50家线下直营店,选址多在城市购物中心。在控制电器上,若琪可接入Philips、LifeSmart、BroadLink、ORVIBO、米家等多品牌。

祝铭明认为,两类公司最后会成为赢家:要么有极致体验,要么有极致内容。作为创业公司,Rokid的目标是前者。据称,目前若琪日活比例超过50%,用户日均使用时长超过1小时,总会话量则已超过1200万次。

业界此前猜测,内容、家居生态系统会构成大公司的竞争壁垒,比如阿里旗下拥有虾米音乐;腾讯拿下了环球、索尼、华纳三大唱片公司的全部独家版权;而作为全球最大的智能硬件平台,小米智能家居联网设备总量已超过6000万台。但至少就目前来看,内容提供商、家居品牌商大多抱持的是开放的态度,他们愿意与多家智能音箱企业合作。比如,百度音乐可同时接入小雅、天猫精灵X1、叮咚等。

目前,百度音乐已与10多家硬件方案商有直接合作,形式是收取很少一部分的版权授权费。“毕竟内容是有成本的。”张小北称。

市场热度仍在持续攀升。不出意外的话,出门问问Tichome智能音箱、天猫精灵X1等都将在8月正式发售,腾讯也有望在本月发布其智能音箱产品“耳朵”。

值得一提的是,近日“价格屠夫”小米的入场,扭转了人们对智能音箱的关注点。远未成熟的市场上,价格战的硝烟已若隐若现。

▲小米发布会及同日推出的售价299元的小米AI音箱。

目前,叮咚TOP售价399元,天猫精灵X1售价499元。比天猫精灵X1晚20天发布的小米AI音箱,售价299元,同品类最低。小米公司联合创始人、小米电视负责人王川认为,当下最重要的是降低用户尝鲜的门槛。

出门问问创始人李志飞此前预计,国内50%以上的智能音箱,定价会低于500元,因为价格超过1000元的电子类产品,在电商平台上很难销售。

“我们主要省掉了渠道费和市场费,而这两部分在整个硬件行业支出中的占比都很大。”王川说,这是小米的优势之一。小米AI音箱是小米互联网音箱的升级版,从研发到发布用了近一年。

当初在做产品定义时,他们就认定,智能音箱售价不能超过300元。因为这是新品类,普通用户并不知道它到底能干什么,或者到底能不能像演示的一样好用。“如果你把它卖到1000元,试错成本就特别高;如果卖299元,这就是一顿饭的价钱,大家就愿意去尝试一下。”王川说。

在美国,Echo的最初售价是179.99美元,二代产品下降到49.99美元,这对美国人的购买力而言,试错成本也很低。

Rokid算个异类,一代产品定价5280元。祝铭明解释称,Rokid的早期目标用户是品质敏感型而非价格敏感型。2017年4月,Rokid二代产品“月石”售价降到1299元。据称仅用了一个多月的时间,月石的销量就已达到近万台。

6月20日开放预售的小雅,市场价999元,首批预售价699元,5万台半小时被抢光。李海波说,最初把量估小了,被抢光后,公司紧急派人到深圳追产,但其中有4个主要芯片的原料,生产周期较长,要两个月。小雅计划2017年销售100万台,但因为硬件经验不足,备料不够,目前每天只能生产3000台。

刘小北对智能音箱的看法也在更新。他坚信这是未来的发展方向。据他所知,有些硬件方案商开始直接与房地产开发商合作,从新房装修入手,致力于打造智能语音助手无处不在的家居环境。

智能音箱的火热,终于有了从行业内缓慢向行业外传导扩散的迹象。

共同做大蛋糕才能有未来

被寄予智能家居入口厚望的智能音箱,市场容量究竟有多大?一个业内共识是,短期内出货量会在几百万台。

至于未来,魏强认为,完全要看智能音箱在国内消费者心目中的定位,如果仍是科技数码类体验产品,则市场容量较小。

“我认为,两年之后,中国市场会达到千万台以上的规模。”王川说。在他看来,智能音箱就像家电的遥控器,未来每个家庭都需要。

但在通往爆款的路上,智能音箱还要经历技术泡沫期的小滑坡。

魏强发现,以前做平板、手机硬件的厂商、方案商,现在好像不搞智能音箱,出门都不好跟别人打招呼;还有芯片商,直接拿平板芯片的方案在智能音箱上扩展。

大家都怕错过风口。李海波在深圳看到,有些厂商花80元买个科大讯飞的授权,再拼模组,就攒出一款智能音箱。

“真不是拼模组的小事。手里没有大数据、大人才、大梦想的公司,做不起。”李海波说,小雅团队300多人,历时402天,才把技术打通,而当初Echo研发用时更长,有2000多天。

小雅的语音技术来自猎户星空,这是成立于2016年9月的一家人工智能创业公司,曾获猎豹4000万美元投资。李海波评价猎豹CEO傅盛“是一个打仗的人”:团队开始只有9个算法工程师,3个月后,傅盛给增配至100人,后来是300人;微信上有48个工作小组,傅盛和余建军亲自跟项目。

目前,喜马拉雅已把接口对外开放,希望用一个体系打通所有智能家居场景。美国智能家居行业有统一标准协议,很多服务内容,Echo可以直接接入,但国内基本都是自己打天下。

这也是魏强担心的。要打开国内市场,最好的途径是合作,把各家优势资源整合到一个平台上。在他看来,如果每家都单独做,最后只能是低水平重复建设。

目前阿里有人机交流系统AliGenie,百度有DuerOS,小米则有水滴平台,都向第三方开放。但细看下来会发现,这是一个个“孤岛”。

魏强对此并不陌生。其实早在智能家居兴起之初,海尔等家电巨头也是自己做平台,京东则打造了“京东微联”,如此种种。虽然每家都拿自己的长处来做,但它们相互之间没有打通,无法充分满足终端消费者的需求。至少过去两年,这种割裂是智能家居行业停滞不前的重要原因,智能音箱的发展也受其影响。

目前,各智能音箱品牌,仅支持部分智能家居厂商生产的标准设备。比如叮咚可接入京东微联、美的美居、米家旗下的智米和华米;天猫精灵X1可接入阿里智能、涂鸦智能;小米AI音箱可接入小米生态链设备,并通过米家智能插座等,控制非小米系产品;小雅则可接入海尔、小米等家电。

魏强认为,智能音箱行业虽然有着美好的前景,但蛋糕还不大,入局企业当前的首要任务是共同把蛋糕做大,而非圈地、站队。

李海波估计,市场上最终胜出的品牌不会超过10家,每家会各有特色,比如良好的购物体验、连接所有设备、海量内容等。

李海波依稀看到了智能音箱的未来:仅半年时间,他刚刚5岁的儿子已经离不开家里那台内测版的小雅了。孩子被禁看手机和电视,但他会一边抱着玩具,一边让小雅讲故事。这种陪伴感在日益加深。

一天,李海波背走小雅去见客户,孩子连打了十几通电话,重复一个问题:小雅去哪儿了?

加载中...