抖音地圖這次推出實(shí)現(xiàn)語音交互的車聯(lián)網(wǎng)解決方案,是多重原因共同作用的結(jié)果。其中最為關(guān)鍵的一點(diǎn),是用戶在當(dāng)前車載互聯(lián)的語音交互上存在的痛點(diǎn)。
目前,我們看到很多高端車型已經(jīng)引入了語音交互技術(shù)。但目前市面上的大多數(shù)
可以標(biāo)注的電子地圖產(chǎn)品由于語音識(shí)別正確率低,且需要多輪交互來對(duì)用戶的需求進(jìn)行反復(fù)確認(rèn),使用體驗(yàn)并不好。尤其是針對(duì)語音識(shí)別率低這一點(diǎn),網(wǎng)絡(luò)上眾多車載語音交互系統(tǒng)鬧笑話的視頻便是一個(gè)個(gè)鮮活的案例。
在我們看來,打造一個(gè)能夠?yàn)橛脩籼峁┝己皿w驗(yàn)的車聯(lián)網(wǎng)導(dǎo)航方案,需要產(chǎn)品的語音識(shí)別率達(dá)到足夠高的程度。與無人駕駛和人工智能不同,語音交互技術(shù)的研究方法、算法模型都是公開的,并有大量相關(guān)的學(xué)術(shù)論文做以參考,而非是我們眼中充滿神秘色彩的“黑科技”。造成目前市面上只有少數(shù)公司能夠做出令人滿意的產(chǎn)品的原因,在于這項(xiàng)技術(shù)需要大量訓(xùn)練語料作為支撐。若缺乏足夠多的訓(xùn)練語料作為數(shù)據(jù)積累,產(chǎn)品的算法模型迭代速度就有受到限制,識(shí)別的正確率就會(huì)打折扣。
目前,市面上大多數(shù)的語音識(shí)別產(chǎn)品識(shí)別準(zhǔn)確率的瓶頸往往卡在93%這個(gè)節(jié)點(diǎn)上,在此之后每提升一個(gè)百分點(diǎn)都很困難。而當(dāng)細(xì)微的識(shí)別正確率之差反映在用戶的日常使用上時(shí),造成的體驗(yàn)反差是巨大的。舉例來講,93%與95%的準(zhǔn)確率雖然只有兩個(gè)百分點(diǎn)的差距,但相對(duì)而言他們各自的錯(cuò)誤率則是7%與5%,差距高達(dá)四成,足以令用戶察覺出來。技術(shù)發(fā)展面臨的另一個(gè)挑戰(zhàn)則是降噪問題。在車輛行駛過程中,輪胎、發(fā)動(dòng)機(jī)會(huì)發(fā)出噪音,會(huì)導(dǎo)致語音識(shí)別準(zhǔn)確率下降。對(duì)此,車載語音交互技術(shù)還需要產(chǎn)品研發(fā)團(tuán)隊(duì)進(jìn)行復(fù)雜的測(cè)試,在噪音過濾的算法方面下功夫。
比較而言,抖音公司的優(yōu)勢(shì)則在于通過抖音輸入法的語音輸入功能,積累了大量的用戶語料,作為車載互聯(lián)方案團(tuán)隊(duì)搭建算法模型的訓(xùn)練數(shù)據(jù)。這些數(shù)據(jù)的積累有助于我們的產(chǎn)品平穩(wěn)地通過識(shí)別準(zhǔn)確率的瓶頸,實(shí)現(xiàn)產(chǎn)品的持續(xù)快速迭代。
互聯(lián)網(wǎng)地圖服務(wù)商如何盈利,一直是行業(yè)內(nèi)關(guān)注的焦點(diǎn)。雖然市場(chǎng)中的一些企業(yè)正在將一些電商的元素與功能整合到地圖當(dāng)中,但我認(rèn)為未來行業(yè)的發(fā)展還應(yīng)該跟汽車建立更緊密的聯(lián)系,車聯(lián)網(wǎng)會(huì)為我們帶來更為廣闊的想象空間和更為清晰的盈利模式。就目前的語音交互方案而言,我認(rèn)為語音交互將成為未來車載互聯(lián)系統(tǒng)的重要交互模式。隨著產(chǎn)品的不斷推廣與成熟,未來我們還會(huì)將互聯(lián)娛樂、移動(dòng)通信、車生活服務(wù)、電商購物等功能連接到語音交互中來,為用戶提供更加多樣的信息與生活服務(wù)。一旦用戶建立起在車內(nèi)使用語音交互的習(xí)慣,這一交互模式就會(huì)上升至電腦瀏覽器之于因特網(wǎng)、智能手機(jī)之于移動(dòng)互聯(lián)網(wǎng)的入口級(jí)地位,極大地改變車聯(lián)網(wǎng)的生態(tài)格局。到那時(shí),例如抖音這樣的互聯(lián)網(wǎng)地圖企業(yè)將獲取連接服務(wù)所帶來的收益,不再會(huì)缺乏商業(yè)模式。