車用語音人機介面發展趨勢分析
智慧科技與網通
瀏覽數:290
發布日期:2020/10/06
從目前各大廠的發展布局來看,從語音、手勢控制、駕駛意識偵測等各種新興車用人機介面的發展來看,以語音控制的發展進程最快,各大車廠發展語音助理從早期語音指令,至近年逐漸發展出能自然對話的語音助理系統,如豐田Toyota、奧迪Audi、福特Ford,近年來已發表將語音助理或平台導入車載機內的車款,其餘車廠也陸續在後續相關車款中納入相關技術。
 
語音助理在各類的3C產品中已有相當高的普及度,以各類科技大廠主導相關技術發展,包含亞馬遜、蘋果和Google都是其中的佼佼者,為了延伸應用,科技大廠紛紛積極進入車用市場,必且將既有的語音平台重新調整為車用平台,同時為因應技術發展需求,而與軟體廠商合作甚至併購,例如Google買下多倫多大學資工系所創辦的DNNresearch,加強其語音搜尋引擎能力,亞馬遜則為增強語意辨識,於2012年併購Evi等。
 
車用語音助理的關鍵為如何清楚地接駕駛者或乘客的語音指令,關鍵零組件為聲學元件,樓氏電子Knowles、瑞聲ACC、歌爾GoerTek等皆有發展車內專用聲學元件,為目前市場主要領導者。車用語音助理相關業者可分為三類,包含車廠、語音平台以及語音技術/設備商,三方業者各有不同目標,呈現相互競爭又合作的態勢。整體而言,可歸類為三種合作模式。
 
第一種模式為車廠直接採用語音平台服務。語音平台為提升其服務可及性以及取得更多使用者數據,多投入開發車用語音平台,例如Google的Android Auto、亞馬遜的Echo Auto以及蘋果的Carplay,同時開放開發者環境,強化與車上電子系統的整合,車廠為增加銷售賣點為動機,將語音平台引入車內,藉以增加服務體驗。不過在增加車內服務項目和體驗下,車廠對此合作方式亦有所顧慮,擔心消費者體驗倒向平台大廠,因此各大車廠也積極在相關平台的基礎上發展自有的服務平台,以維持消費者的認同感與滿意度。
 
第二種模式為車廠自行開發語音服務,部分車廠希望掌握車上相關聯網服務廣大商機,同時由於語音平台亦將連結車輛控制系統,因此部分車廠投入自有語音系統相關技術研發,此方式需投入大量成本和人力。
以賓士為例,與各大語音平台皆有合作,但在2018年仍自行開發MBUX系統,可結合車機上座艙控制以及影音娛樂、導航等功能,亦可銜接各語音平台影音娛樂功能。
 
第三種合作模式為語音技術商結合平台導入車廠的車輛產品,語音技術軟體/設備廠商如Nuance、SoundHound,皆有開發語音技術以及相關應用軟體,ROAV和Chris則發展相關設備可介接至車內。此類業者可藉自行開發軟體或硬體,將語音系統服務導入車載機系統,同時以API方式銜接各大語音平台相關服務,以此方式銷售自家語音產品,同時亦可取得使用者數據提升技術。
 
語音助理在車用環境中以麥克風硬體設備收音,採用MEMS陣列式麥克風為主流,收聲元件中振模採用矽材質,相較於早期電容式麥克風採用的聚合纖維更耐熱、抗震,收音品質較不受溫度及電壓變化等影響,且金屬外殼具有良好射線屏障,避免收取不必要雜訊。
 
軟體處理中主要為自然語言處理,其中包含到語音識別、語意理解,後續再回饋語音則有語言生成、語音合成,亦或是文字轉換為語音等。
 
動作執行層面則分為屬車輛控制的座艙調整、空調、啟動引擎和車門,以及娛樂、導航、通訊等項目,除車輛控制外,剩餘項目皆可在無需嵌入車電系統環境下進行,例如透過個人行動裝置、後裝設備等方式,對於語音平台或相關技術業者而言更多以此類服務滲入市場。
 
因車內收音並非直接對麥克風說話,屬於遠場收音形式,其效果不如對手機、話筒設備等近場收音,個人主聲特徵更不明顯,噪音處理對於車內語音應用情境至為關鍵,背景噪音和發聲回音更容易影響收音品質,且在車內有多人談話須作考量,也有反應速度的要求,技術上需克服如何在多人談話中辨識駕駛聲音以及如何提升運算效能的需求。
 
不過整體來看,對於普羅大眾而言,因語音技術使用情境更趨自然,同時學習的門檻更低,可以想見在車內的應用環境,語音將成為未來在智慧車輛中最具親和力的人車互動介面,亦將成為未來許多服務進入車用環境的大門,其中新品與應用情境勢將百花齊放更為精彩。
 
(本文刊登於2020/10/4 工商時報A9版;本文作者為資策會MIC產業分析師官盛堯、產業顧問張家維)
關鍵字: 車用語音人機介面