全新EC6语音助手NOMI加入大模型,车机大模型大战开启?
我们的车机交互即将迎来变革了吗?不但有大模型上车,还有像蔚来新EC6这样不再“智障”的语音了。
智能汽车发展了多年后,现在智能座舱方面的交互已经转为了触屏为主,采用大屏幕的智能汽车越来越多,但汽车在小屏时代就加入的语音助手功能,一直因为太过于“人工智障”,而被消费者忽视,宁愿选择在触屏上进行操作,也不愿意高强度的使用语音助手功能。
不过在当下,各家车企也都对语音助手逐渐重视了起来,让其更加好用,除了大数据上车,让车机语音助手更好用,甚至转向“生活管家”的角色外,像蔚来新款EC6上更新的Banyan 2.1.0系统,都已经提升了语音助手的可用程度,似乎车机交互正在发生着改变。
蔚来EC6语音助手升级,模糊语义理解更符合人类语境语音助手存在的最大问题,就是沟通模式的问题,人问一句,AI回一句,意思稍微差一点AI语音助手都无法理解。这就是因为人们在使用语音助手的时候,并非是按照屏幕定义菜单那样依次按顺序操作的,人类的沟通是想到什么说什么的,语音可能是模糊的,也可能是不按顺序的,毕竟大多数人不会在聊天时,让别人推荐一家“距离1km以内,美团点评8.0分以上的火锅店”这样准确的语义交流,AI想要摸清模糊语句的意思十分困难。
这一次蔚来新款EC6上更新的Banyan 2.1.0系统,也是采用了新一代神经网络的离在线混合TTS技术,基本上已经可以看成“大模型上车”,这一次Banyan 2.1.0系统也提到了“常用常新”,就是神经网络训练的结果。
而这一次EC6上的NOMI,最主要的问题就是在解决“模糊语境”这个问题,人们在说话的时候,往往并不是想好了直接说出一句准确的话,可能只是随口而出一个句子,比如,在设置导航的时候,很可能脱口而出“我要去火车站”,这时候语音无法理解你要去哪个火车站,但是用户可能会在后续加上“去东站”,AI语音助手可能已经抓取了前面那句去火车站,给出一大串结果让消费者选。但是蔚来新款EC6在更新系统后,会不断抓取关键词,火车站和东站最终都会被抓取,这样就能给出一个相对准确的地点信息,可用程度就能得到很好的提升。
另外就是针对一些错误信息,比如导航至“大学”或者“学院”时,这些名词有时用户并没有搞清楚或者直接说错,蔚来EC6的语音助手能够很好的改正错误,推荐出正确的选项。另外就是这一次Banyan 2.1.0系统有着对话联想功能,
并且这一次新款EC6上更新的Banyan 2.1.0系统还提升了语音操作车机的能力,只要当前页面显示的东西,都可以做到用语音触发,做到了“可见即可说”的程度,也就是页面上的所有元素,用语音的形式就能快速跳转或者操作打开/关闭,好处是在行车过程中,不方便进行触屏操作时,可以用语音替代。并且想要让语音助手优化至覆盖到所有菜单,其实也并非是一件易事,这一点能够看出蔚来在语音助手这方面提起了重视。
另外,这一次Banyan 2.1.0系统还提升了NOMI儿童智能对话功能,能够自己识别到儿童唤醒,并且用更加亲切的语音效果和更亲切的表达方式,提升了互动性能,其实儿童模式在这些年来的其他智能设备上已经有所体现,这一次蔚来则是在儿童模式中丰富了百科知识,也算是针对孩子进行了特别的优化。
各家车企都在布局新的语音助手,车机交互要迎来新的变化?蔚来新款EC6在语音方面加入了神经网络离在线TTS混合系统,其实现在火热的大模型也是一种基于神经网络的概念,可以看做是蔚来EC6加入了“大模型”系统上车,让EC6整体的语音能力得到了提升,当下许多车企都在布局让大模型上车,比如吉利星纪元就搭载讯飞大模型、华为将在问界M9上搭载大模型、理想MEGA也将采用MindGPT大模型等等,下一步车企要卷的,就是车机中的语音交互系统。
车载语音交互其实早就已经出现了,甚至比车载大屏车机出现的更早,但一直受限于对于用户语言识别和理解一直体验不好,而未曾被重视。但随着ChatGPT爆火后,大模型训练找到了全新方向,机器对于用户语言的理解正在突飞猛进的成长中,包括手机语音助手,也纷纷加入了大模型功能,提升可用程度。
当然,这样的功能,对于已经上车的车载语音助手自然不会错过,蔚来新款EC6可以说是走在了前列,从实际体验中也能看出,蔚来新款EC6的体验提升确实很大,对于语句的理解与此前问一句答一句的“智障”设计完全不同,并且最主要的是加入了情感功能,针对儿童语气变化,就能体现出情感交流的变化。这样的功能是各家语音助手在接入大模型后,都会有所提升的部分。
所以接下来在年底时,各家车机语音助手结合大模型的比拼就将开始了,比拼谁的语音助手更加智能贴心,能真正听懂用户说的话,能对生活带来多大的帮助?甚至成为自己的车上“管家”都是有可能,只要语音对话的功能能够很好的理解用户的语言,用户在车上的交互就有改变的希望,很可能会在单人开车的时候,用语音代替自己的手,轻松交互,而在人多的时候因为隐私问题可以使用触屏,一家出游时语音就能成为带娃助手,当然这一切,还是要看有了大模型加持的语音助手,究竟能够“进化”到什么程度了,如果车企的语音变好用了,你会选择用语音代替触屏吗?
写在最后:从蔚来EC6更新后的Banyan 2.1.0系统NOMI中,能够看出搭载神经网络后的语音助手,对于语言的理解能力能够大幅度提升,在交流上,不需要再去一次性准确的描述一件事或者一个地点,而是就像跟朋友聊天一样,模糊的几句话,甚至后续补充的语句,语音助手都能理解最终的意思,这就大幅度提高了语音助手的可用程度。
而类似的“大模型上车”不止蔚来一家,年底将会有更多的品牌加入这场争夺中来,汽车的交互或许就会改变,大屏幕可能只是一种补充了。
你好,吉利-语音灵敏度提升技巧
语音识别小贴士
助您事事有响应。
说别说太快
我们经常在刚唤醒车机后立即开始下达指令,然而说话太快有时会出现识别错误的状况。您唤醒车机后,车机都会回应您,这时,您再随意“安排”TA喽~
太慢也不行
除了没听到车机回答就下达指令以外,车机回答之后很久没发出指令也同样会影响识别效果。
在已经唤醒车机后,如果长时间没有等到指令,系统就会自动关闭识别。
方言请隐藏
目前的车载语音还不支持方言呢,对普通话的识别率最高哦,纯方言现在是听不懂的啦~
生僻字请注意
语音识别引擎还没有学习到这部分的知识,后期我们一定会努力学习,不断再进步哦~
距离请把握
语音识别和唤醒一样,都是通过麦克风来识别的,所以您在下达指令的时候需要注意下麦克风的方位。
一般来说,在主驾和副驾保持正常坐姿说话就行,但后排用户需要稍提高音量哦~
外部环境很重要
噪音有车内设备、车外风声等噪音,也有车内其他人声等,这些都会干扰使用者的识别效果。
在噪音越高的情况下,唤醒成功的概率会逐渐降低,
在有噪音时,可适当提高指令音量。
误唤醒
车内正常交流时明明没有语音唤醒【你好,吉利】语音却突然和你搭讪~,这是因为开启了语音免唤醒功能,语音库会提前将常用的词语进行收录,当您在正常交流中说到识别词时就会被搭讪~,如果您觉得影响到正常交流,可以在语音魔法书内关闭免唤醒功能即可。