语音识别虚火过旺?尴尬在于既容易被复制又无法去超越

 

2017年,无疑是人工智能最火爆的一年。大大小小的人工智能论坛也在如火如荼的召开,各方都在拼命强调自己对于这个行业的深刻见解。然而,在如此丰富的理论支撑下,真正落地的产品不少,产品体验却难尽如人意。

就在6月29日,云知声召开的发布会上,推出了“Pandora”语音中控技术方案,据云知声CEO黄伟介绍,“Pandora”将远场语音识别、语义理解等AI技术元素整合到一起,聚合多方资源,帮助客户实现6个月快速集成,量产出货”。

然而,技术实现应用与落地或许不难,但实现产品真正的价值,成为众多人工智能初创企业的瓶颈。

【亚马逊的成功可以复制吗】

近两年,智能音响市场持续火爆,首先想到的就是Amazon的 Echo。 Echo作为将自然语音转化为在线指令的设备,其效率之高无容置疑,并且可保持在线的自然环境中的自然语言识别。除此之外,Echo定位于家庭设备,直接避开了用户在外使用语音助手的尴尬与不便。据了解,Echo在2014年11月发布以来,2015年售出400万台,2016年售出800万台,2017年销售额达到1000万台。继Echo之后,亚马逊又推出面向中、低端市场的智能音响:Tap和Dot。

Echo的核心技术在于它集成的智能语音助手Alexa。在2015年6月25日亚马逊曾宣布,将开放智能语音硬件Echo的内置AI助手Alexa的语音技术,供第三方开发者免费使用。由此可见,亚马逊向用户呈现出来的不仅仅是技术上的领先,还有真正落地的产品,以及良好的产品体验。

目前,有太多的企业只是停留在技术研发层面,然而,一家企业想要存活并且脱颖而出的真正难点不在于所谓的技术壁垒,而在于商用和落地。或许想要意识到这一点并不难,就像黄伟所说,“想要打造一款类似Amazon Echo的智能中控和音箱类产品是个非常复杂的过程。”

三年多的时间,和Echo的量产形成鲜明对比的是,云知声在今天向行业内展示的“Pandora”的PPT,这套所谓针对行业痛点而提出的解决方案,究竟何时落地,还是个未知数。这似乎并不是一个想要模仿甚至超越竞争对手应有的发展速度和模式。

如果说国外的企业在技术上具备领先优势,短时间内难以超越,这一点无可厚非。与此同时,国内语音识别领域也开始争夺大战。以讯飞听见系列产品为例,自2015年发布以来,总用户突破1000万,应用于30余个行业。目前,已经形成了以听见智能会议系统、讯(询)问笔录系统、听见转写网站、录音宝APP、听见智能会议服务等以智能语音转写技术为核心的产品和服务体系。讯飞输入法以超过97%的语音输入识别准确率,英日韩三种随声翻译,独家支持21种方言语音输入,成为锋时互动、蓦然认知等众多企业的合作对象。

【用户体验是检测产品的关键】

人工智能的发展逐渐渗透到越来越多的行业当中,与人工智能相结合的前提,是要做好自己“份内”的事。语音识别的准确是打造良好交互体验的重要前提,下图为讯飞输入法(左)、云知声输入法(中)、搜狗语音输入法(右)的应用对比。

“红凤凰粉凤凰红粉凤凰花凤凰”,对于普通话版绕口令的识别,三者都能达到较高准确率。

“Do you have any special dishes you can recommend?”然而,对于英文的识别,差距似乎有些明显。

以河南话为例,“你们那有没有啥好吃的可以推荐”,对于方言的识别,不改变原意是最基本的要求。

事实证明,将技术做成可落地可商业化的产品不难,用户体验却是无法逃避的试金石。做好产品品质与体验才是在行业内立足的关键,无非是需要回到专注技术的研发,蕴含在产品背后的科技力量才值得被关注。对于一个专注于语音技术企业而言,让机器“听的懂”不应该是最基本的么?

喜马拉雅硬件总经理兼副总裁李海波,曾经在给我们举例验证了语音识别领域竞争的残酷性:目前,语音识别和语义理解已经成为人工智能发展较为成熟的领域,做语音的企业如雨后春笋般出来抢占市场,它们拼模组,拼方案,拼场景,拼IOT(物联网),然而它们忽略了最重要的一点,拼用户和体验。因为它们根本不知道用户在哪里,只知道趋势来了,我要跟上。

这种行业内的争相效仿,导致的无非是技术上的复制与模仿,以及技术落地后无法打造良好体验的尴尬。如此一来,语音识别虚火过旺,不仅无法带来黑科技的实现,还失去了原有的期待和关注,因为用户最在意的始终是好的产品品质与体验。

 

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.