声音|AI声音富有「人情味」是怎样的体验,小鹏P7告诉你!

语音,已经被视为智能座舱最主要的交互方式。被偏爱的「林志玲」、「郭德纲」等语音配备,合成音依然有一种机械感。


【 声音|AI声音富有「人情味」是怎样的体验,小鹏P7告诉你!】
声音|AI声音富有「人情味」是怎样的体验,小鹏P7告诉你!
文章插图


就在前不久,小鹏汽车宣布 P7 将上线全新的 AI 声音,核心卖点就「更像真人」,并为此举办一次线上的说明会。

真的这样吗?有兴趣的朋友们可以移步其他平台去听听看。



声音|AI声音富有「人情味」是怎样的体验,小鹏P7告诉你!
文章插图


按小鹏官方说法来看,这次上新的AI声音,采用了「全新一代超大规模在线神经网络引擎+小型离线拼接引擎」的技术相结合,听起来更入耳,生动,富有感情,且更接近人声,个人听起来感受最大的就是这次小P的AI声音讲话有抑扬顿挫那味。

按照国际通用语音质量测试方法MOS评测,小P全新AI声音得分高达4.49分,而满分5分,这个成绩是目前微软MOS语音质量评测得分最高的车载智能语音助手。

疑问还是有的,使用了「在线神经网络引擎」,那么是不是在网络条件差的情况下,会出现卡顿情况?



声音|AI声音富有「人情味」是怎样的体验,小鹏P7告诉你!
文章插图


在 Workshop 上,小鹏的技术专家给了我们解释。

他表示,网络好的情况下能够发挥AI声音最好的音质,但网络不好,也不会带来太大的影响。

小鹏花了大量的时间和精力做了一整套的策略,包括本地加强能力,做到了 97% 以上场景都会是在线引擎,几乎不会让用户感受到降级,也就是机械声音。



声音|AI声音富有「人情味」是怎样的体验,小鹏P7告诉你!
文章插图


此外,全新的在线神经网络引擎,又是否意味着能做到更好的个性化?譬如,口音的个性化识别?

「新声音是语音合成方面的新功能,你所提到的个性化,其实在大 AI 策略中都有。」小鹏专家表示,口音的个性化其实要归类到语音识别的领域,这一块小鹏其实都在做。




小鹏官方表示,全新AI声音采用了24K采样技术,实现了高保真音质,并拥有包括助理、聊天、客服、愉快、温和、亲热、抒情、新闻、严肃、不满、生气、害怕、悲伤、冷静等14种强烈情绪的变换能力,声音细腻动听,生动自然,有真人般的气息顿挫,能表达更多情绪,几乎与真人无异。

我们曾说小鹏的「全场景语音功能」是当下最好智能交互助手,这次全新 AI 声音的进化,又会否让所有人再次感到惊艳?

小鹏P7昨日已经开始预售,有机会的朋友可以去体验看看。