新闻中心

科大讯飞与奇瑞合作:让语音识别“跑”在路上

时间:2019-02-10 18:46:03 来源:万达娱乐官网 作者:匿名

自1995年以来,通用汽车的Anjixing一直为北美用户提供语音导航,救援,车辆安全,娱乐和其他信息服务,并率先进入中国市场。 2010年,福特与微软合作推出福特汽车信息系统。同步,该系统可以识别19种语言,包括一些方言,并且可以理解10,000个语音命令。近年来,丰田的G-book,福特的福特和日产的CarWings也开始跟风。 这意味着当我们开车时,我们不必分心在中央控制屏幕上选择目的地,我们也不必伸出手来接听电话。甚至有一天,我们可以想象:告诉汽车做任何事情。 让我们回到现实。 每年,汽车制造商在控制屏幕上投入数十亿元人民币,旨在提高汽车的技术感和用户操作的便利性。但令他们失望的是,大多数车主都没有为此付费,仍然习惯于在车内导航或查询信息。 这种现象的原因可以简单地理解为:在过去,一些主要的语音控制应用,如导航,语音拨号等,用户必须按照产品手册中的说明启动这些服务,完成句子中的固定格式,可由机器识别。在这些应用程序中,数据库简单而原始,识别过程中的算法并不多。他们只负责“处理”。 没有注意用户体验,使语音交互成为汽车场景中相当无味的产品。 在2014年之前,香港科技大学的主要关注点不在车内。当时,该团队认为汽车中声音的应用只是一种点缀。当时,Xunfei的角色是一个小型模块供应商,它将语音技术授权给第三方供应商。 2014年之后,科技新闻团队迅速意识到声音可能成为汽车的严格应用和入口,他们开始与汽车制造商联系和合作。为此,成立了一支由100人组成的团队,专门从事汽车语音开发和服务。 上周末,雷锋网等多家媒体参观了香港科技大学总部和奇瑞总部。据悉,双方共同开发了一款采用深度定制语音技术的车载系统:Cloudrive 2.0,配备奇瑞的新车Ariza 5车型。“这是一个整体软件系统,包括信息服务,汽车和司机互动,”科技飞行公司首席执行官吴晓茹在一次媒体会议上说。这意味着,从语音技术提供商,香港科技大学已成为“云加”软件和服务系统。这种云和本地通信可以为一些本地无法完全识别的内容提供网络识别,并通过云下载更新包以提高离线识别效果。 Cloudrive2.0界面 在功能和操作上,该系统与汽车制造商推出的汽车系统相同:导航,语音控制,蓝牙电话,4G互联网和倒车影像等。用户可以使用方向盘或中控台上的物理按钮。要唤醒语音命令,您也可以使用“Little Ai Hello”语音唤醒命令。 迅飞麦克风阵列板 但是,从经验的角度来看,迅飞的语音服务做得更顺畅。根据官方声明,当汽车高速行驶时,声音识别率可保证在90%以上。这是因为在硬件上,Xunfei使用麦克风阵列来定位人声,并且驾驶和副驾驶位置中的麦克风位于中央控制屏幕下方以准确定位声源。 通常,汽车场景中的车载系统应该具有三种交互模式:语音,触摸和按钮。 触摸交互或按钮交互是逐层界面,例如单击第一个图标,然后单击第二个屏幕。语音不一样,语音的交互是平的:如果用户表达的含义足够准确,最终结果可以直接呈现。 “这给我们带来了巨大的挑战,就是我们可以在与车辆系统进行语音交互时提供用户最需要的信息。”吴小茹告诉我们。 但事实上,挑战已在6个月内完成,并取得了良好的效果。科技大学汽车事业部总经理刘俊峰给出了一个数字:自网上市场推出三四个月以来,用户的有效比例已达到85%以上,在线平均时间长达两个小时。 在与奇瑞合作之前,迅飞没有车辆系统的整合经验。为此,2015年,迅飞成为美航科技的股东,后者是车辆信息系统,电子地图软件,定位服务产品和服务提供商;中国移动作为迅飞的股东,也提供了一些资源合作,包括音乐版权和与车联网相关的交通包服务;针对用户在服务过程中遇到的各种问题,迅飞也参与了呼叫中心公司。凭借这些资源,支持和整合,它为迅飞快速推出Cloudrive2.0奠定了基础。从另一个角度来看,与汽车制造商的合作也可以证明迅飞的语音技术得到了前者的认可。 尽管如此,在媒体传播会上,吴晓茹对我们说,仍有必要继续突破汽车语音的技术方面。例如,如何保留有效信息,过滤无效信息,如何适应各种噪声环境,如何在自然语言中保证更有效的多轮人机交互等等。这也是他们将在下一阶段克服的问题。 上个月初,“互联网女王”的头衔Mary Mickel发布了一份互联网趋势报告,报告内容为213页,其中十分之一发表了演讲。她认为,语音技术和技术成熟的爆发是核心原因之一。目前,语音识别的准确率已从2010年的70%提高到今年的90%。可以预见,如果语音识别准确率从95%增加到99%,将触发质变。 吴晓茹表示,该车刚刚在语音应用门槛上取得突破,未来汽车领域语音交互的应用将翻一番。