车载语音坑你不一定选择愚人节,怎么破?

0

谁没被车载语音坑过?还有谁!

文 ▍阮锦程

这不是愚人节策划,随便举个例子,一周前试驾一辆豪华车,我对着语音系统说:“导航到清水湾雅居乐。”然后它跟你说:“我听不清你在说什么,请你说出你想去的目的地,例如是交叉路口、门牌号…..你还可以说……请在看到XX提示后说出你的……”

天呀!我只不过是问了一句说,它就堵住我的嘴让我听它说,到底是谁为谁服务?

如果你觉得这不够直观,看一下去年我试驾某款豪华车型(我不告诉你它来自己瑞典),语音系统戏弄了一番开车的同行,现场视频:

车载语音系统坑人指南

如果你把车载语单系统看作是一个机器人助手,那么这个助手可以分为三个层次:

车载语音坑你不一定选择愚人节,怎么破?

第一层就是打字员。你说什么它就记录什么,甚至你得按它懂得的方式是说话。现在的车载语音系统都能做到这一点,甚至你有一些口音,不是标准普通话,他也能做到识别。

第二个层次是一个办公室的文员。办公室的文员跟打字员的区别是,文员能够理解你的意思,帮助你去完成一个任务。这里就用到AI人工智能,比如我要到某个餐厅去吃饭,你不需要知道这个地址,怎样开车路线和停车,甚至订座,文员都能把这些事情帮你安排好。

第三个层次是秘书。秘书跟文员的区别是什么呢?秘书能够领会领导的意思,有好多东西,领导想做的东西,他不说,秘书知道这是你想做的,你只要稍微提点一下就行了。

车载语音坑你不一定选择愚人节,怎么破?

而目前我们常见的车载语音系统,还在努力做好第二个层次文员的角色。如果做得不好,就是这个文员还不够聪明,或者是语音文化不同导致。例如宝马的语音系统来自Nuance,而荣威RX5的系统同样来自Nuance,宝马的系统功能更为强大,但实际使用中明显是荣威的更聪明。

原因很多方面,Nuance只作为系统提供商,但如何与整合到车上是车厂的事情,也就是说荣威在整合方面做得不错。另一个原因可能是,宝马是按德国人那些严谨的逻辑来设计交互界面,一旦你不按它的规则说话,它可能就识别不了。

车载语音坑你不一定选择愚人节,怎么破?

车载语音坑你不一定选择愚人节,怎么破?

网红荣威RX5的语音系统代表着国内最好水平,同样由Nuance提供

其实不久前我参加了一场Nuance技术会议,在现场我们见识了Nuance产品Dragon Drive(声龙驾驶)语音系统的水平,Nuance中国移动部研发总监徐燃向我们演示:例如你想找个餐馆,你不需要知道餐馆的名字、地址之类,你直接对系统随便说一句任何的话:“我饿了”,或者是“帮我找个餐馆”,系统会按离地距离找到一堆餐馆。然后你可以再说:“找个便宜的。”系统就按人均消费排列顺序。如果你看上了其中一个,不需要跟“第几项”之类,你只需要说出餐馆的关键字就行,例如你说:“要那个沙锅粥的。”

车载语音坑你不一定选择愚人节,怎么破?

展示Dragon Drive(声龙驾驶)的强大功能

关键是你不需要按着系统指定的方式来说话,只要意思符合中文习惯,你怎么喜欢就怎么说,Nuance这个系统就是一个聪明的文员。这看起来是不是有点像苹果iPhone的Siri?其实最早的Siri就是Nuance开发的,只是后来苹果从Nuance挖了人,然后苹果后来就自己开发了。

Nuance是什么来头?

如果你只是一个车迷,不一定知道这家公司,因为目前国内最大的语音识别市场是另一家公司。但如果你是IT行业的人,对语音识别技术感兴趣,“Nuance”是一个如雷贯耳的名字,它在语音识别技术的地位就是操作系统领域的微软。

车载语音坑你不一定选择愚人节,怎么破?

其实,我之所以去参加Nuance的技术会议,就是想认识一下这家在另一个领域的顶尖公司。随便举一些例子,你知道T9手机智能输出法,就是用有限的键盘就能联想输出你想要的文字,这个技术是Nuance的。除此以外,Nuance跟苹果、三星还有华为、中兴都深入的合作,例如华为Mate9和P10就是用了他们的技术。

车载语音坑你不一定选择愚人节,怎么破?

车载语音系统属于移动业务部负责,虽然Nuance在国内不是最大的市场,但在国外的份额占到了70%,包括奥迪、宝马、福特、通用汽车、梅赛德斯奔驰和其他车厂均是Nuance 客户,国内与宝马、上汽、吉利、奔驰等都有合作。

中国这么多方言,车载语音系统怎么破?

答案是,暂时没法破。

你一定在网上看过山东大叔与别克安吉星的对话视频,这就是中国的方言和口音给语音系统带来的新挑战。在技术会议上,Nuance 研究部副总裁吴建雄解释,现在世界各种语音系统对口音都有很好的解决方案,但对于方言可能会比较难一点。

车载语音坑你不一定选择愚人节,怎么破?

因为方言从某种意义上说是一个新的语言,而中国的方言还有一个很大的问题,方言没有书写语,而语音系统的工作方式是搜索数据索+算法,如果你连文字都没有,都不知如何建立这个数据库。

但这是一个很现实的问题,中国的语言环境太复杂,如果你不想丢掉中国市场,就必须本地化。所以就如当年国产DVD打败进口DVD一样,适应中国市场的产品才是生存,这就是要本地化的研发团队。

例如Nuance之前研发中心只有北京和上海,但今年在成都已开设了新的研发中心,从年初开始到现在已经有60个工程师,而且2018年之前会有200个工程师在成都(传说每一个四川人都是语言专家)。

Comments are closed.