文章分页功能可以快速定位到想看的内容哦~

搜索
下载APP
搜索
历史搜索
猜你喜欢

奇瑞的多媒体系统用起来不用动手?

问答叫兽
2021-12-21 12:26

说到车载多媒体系统的语音识别功能,我想大部分用户都会觉得很尴尬。难怪目前车载多媒体系统的语音识别功能大多只停留在语音指令识别阶段。使用车载多媒体系统时,用户必须通过按键启动语音识别程序,然后说出命令,命令的发音和词汇必须准确,否则识别效果差,无法获得更好的用户体验。为了让奇瑞用户更方便、更好地使用语音识别功能,联合国语音识别技术领导者科大讯飞研发了Cloudrive2.0智能云互联驾驶系统。该系统的自然语言处理技术让用户只需通过口说就可以操作多媒体系统的大部分常用功能,识别率可达90%以上。让我们来看看这个多媒体系统有多有用。

科大讯飞到底是谁?

科大讯飞,由中国科学技术大学优秀博士生刘庆峰于2021年创立,是一家专门从事语音技术研发的公司。语音技术包括语音合成技术和语音识别技术。让机器说话,使用语音合成技术;让机器理解人的语音,利用语音识别技术。成立17年来,科大讯飞一直从事语音相关领域的研究,积累了丰富的经验。公司的技术实力也通过多年在语音技术领域获得国内外奖项得到了证明。

2010年,当科大讯飞推出“讯飞语音云”技术时,科大讯飞进入了普通大众的视野。这项技术可以为很多互联网应用提供实时语音识别支持,例如,QQ、短信、微博等内容都可以通过语音输入。识别率高,使用方便,在业界引起了不小的波澜。

今年10月18日,罗永浩在锤子M1/M1L系列手机发布会上宣布,这两款产品将支持讯飞语音输入法,识别率达到97%,基本解决了移动设备的语音输入问题。

在讯飞语音输入法的演示中,罗永浩以很快的速度进行了随机语音输入,手机屏幕立刻生成了准确的文字信息。这瞬间让科大讯飞成为了新锤子产品发布会的主角,也让此前默默无闻的科技企业科大讯飞一夜之间成为“线上名人”。

●是什么催生了具有强大语音识别功能的多媒体系统?

我想用过老式语音识别系统的朋友会抱怨识别率低。除非你用的是发音清晰、声音圆润的标准普通话,语速不能太快也不能太慢,否则就是“日常”。开发人员和用户都知道问题出在哪里,但是兼容不同地区用户口音的差异,让计算机“读懂”人类平时说的自然语言,最终提高识别率,有多容易呢?科大讯飞用了17年的时间积累技术,最终实现了改革,使机器更好地识别自然语音,识别率提高到97%。

同样促成这一变化的还有性能更强、集成度更高的电脑芯片,它可以让具有复杂语音识别功能的车载多媒体系统小到可以安装在汽车中控台内部,同时强大的计算能力可以让语音识别的等待时间达到普通用户可以接受的水平。

4G网络的普及也是变革过程背后的驱动力。通过4G网络,语音识别系统可以随时更新语音库,当本地出现无法识别的单词时,可以通过云服务器进行识别,保证语音识别系统能够识别出目前最新的单词。

●不仅仅是在多媒体系统上安装一个“牛逼”的语音识别软件那么简单。

屏幕前,你可能以为奇瑞的Cloudrive2.0智云互联驾驶系统只是在普通的多媒体系统中安装了一个“牛逼”的语音识别软件。全湿了。实验室里识别率97%的语音识别系统应用到高速公路上行驶的汽车上,识别率可能会下降到50%甚至更低。因为风噪、胎噪等噪声会极大影响语音识别率。

为了满足奇瑞的高要求,科大讯飞作为多媒体系统的提供,必须对整个系统的硬件进行各种耐久性测试,以确保系统在不同的温度和振动环境下具有良好的稳定性。

●语音识别与车载应用的互联互通,给用户带来了便利。

车载多媒体系统空的语音识别率很高,但是如果不能实现任何功能也没用。科大讯飞通过入股地图引擎公司——美星科技,获取了丰富准确的地图信息和数千万的兴趣点信息。通过开启语音识别和导航系统,多媒体系统可以通过说“我想吃火锅”来自动找到导航目的地,然后通过语音确定目的地就可以轻松实现导航。

目前,科大讯飞已与30多家内容提供商合作,熟悉的喜马拉雅FM、网易新闻、大众点评、美团等应用均可与科大讯飞的车载多媒体系统互联,以最简单、最直接的方式实现语音操作。

●科大讯飞的理想——实现人与机器的无障碍交流。

科大讯飞成功开发了一套名为AIUI的人工智能交互界面。通过融合双工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和内容服务,人机交流可以像人与人之间的交流一样轻松。

●真的好用吗?试着去了解。

在实际介绍试用流程之前,我们先来介绍一下这个系统目前在科大讯飞奇瑞的装车情况。搭载Cloudrive2.0智能云互联驱动系统的首款车型是今年3月上市的奇瑞Ariza 5,搭载相同系统的奇瑞Tiggo 3X也将于11月15日正式上市。新车将提供一年的免费流量,以支持多媒体系统上的各种车载应用。如果流量超过,也可以通过银联、微信、支付宝等支付平台扫码支付流量。价格10元100MB。按照目前用户的使用情况,大部分用户的月流量不会超过500MB。

以下视频演示了奇瑞Tiggo 3X多媒体系统的语音识别功能。从视频演示中我们可以看到,测试人员可以以正常甚至略快的语速输入自然语言语音,甚至可以中断系统正在播放的语音来输入语音命令。语音识别率高,导航、音乐播放、电话测试等功能不需要用户按键或触摸屏幕,实现了多媒体系统的操作体验。

更多精彩视频可在视频频道“奇瑞Cloudrive2.0智云互联驾驶系统语音识别演示”中找到

据现场技术人员介绍,奇瑞Cloudrive2.0智云互联驾驶系统应用的语音识别功能不包含方言识别,但对于带有方言口音的普通话可以达到较高的识别率。

全文摘要:

科大讯飞的语音识别技术确实走在世界前列。奇瑞Cloudrive2.0智云互联驾驶系统的语音识别功能在自然语言识别率方面已经达到了很高的水平,一些常用的功能基本上可以通过语音人机交互实现1-2次,大大提高了使用的便利性。驾驶员不用看屏幕,也不用按按钮,就能实现各种多媒体系统功能,更能用心观察路况,提高行车安全性。

通过技术整合,科大讯飞完成了从语音技术提供商到语音服务提供商的转型。科大讯飞提供的车载多媒体系统配备了国际领先的语音识别系统,体验水平很高。相比苹果CarPlay功能的语音识别,由于科大讯飞与车企的深度合作,其多媒体系统可以实现与汽车更深层次的互联,未来还可以通过语音实现控制车内灯光开关、调节空音调等多种功能。作为科大讯飞的合作伙伴,奇瑞也有望成为首批在科大讯飞安装下一代多媒体系统的厂商之一。更先进的AIUI将使其多媒体系统体验上升到更高的水平,值得期待。

打开汽车网APP阅读全文
相关车系
为你推荐 换一批
我来说两句
表情
普通表情 羊老湿 2 羊老湿 车评人
相关文章
更多内容推荐

正在加载中...

进入首页,查看更多实时汽车资讯
打开app,汽车生活由此精彩
首页 > 最新文章 > 正文

海报生成中...

生成失败

长按图片进行分享