AI語音技術供應商策略方向探討
發佈日期:2018/9/16 | 類別:資訊電子產業 | 點閱次數:101

眾多資訊業者搶攻語音助理平台角色,事實上並不意外。語音互動介面乃大勢所趨,而AI語音助理平台位居生態系「樞紐」大位,串連智慧家庭裝置╱家電、個人用智慧裝置、智慧車、第三方服務業者等各方業者。這意味著在語音數據時代,勝出的AI語音助理平台業者,將成為數以萬計智慧終端產品的中心點,尤在龐大語音數據背後潛藏的價值,及應用潛力充滿諸多想像空間。

受到Amazon Alexa於美國智慧家庭市場成功落地的鼓舞,Google、Apple、Microsoft、Samsung等資訊科技巨擘紛紛跟進,加碼資源優化自家AI語音助理軟體,更有不少後進業者斥資打造AI語音助理平台與生態系,如陸商百度、小米科技、阿里巴巴、京東、騰訊等,韓系大廠亦沒缺席,如SK Telecom、Korea Telecom、Kakao等,而通訊軟體業者Line也與韓國知名搜尋引擎平台業者Naver合作,研發AI語音助理平台Clova。

眾多資訊業者搶攻語音助理平台角色,事實上並不意外。語音互動介面乃大勢所趨,而AI語音助理平台位居生態系「樞紐」大位,串連智慧家庭裝置╱家電、個人用智慧裝置、智慧車、第三方服務業者等各方業者。這意味著在語音數據時代,勝出的AI語音助理平台業者,將成為數以萬計智慧終端產品的中心點,尤在龐大語音數據背後潛藏的價值,及應用潛力充滿諸多想像空間。

為求突圍,各平台大廠不惜重金挖角AI語音技術人才,更不斷透過併購、合作或轉投資等方式,確保掌握核心技術。單就併購活動而言,Amazon前後併購Yap、Evi、Invona Software等公司,取得語音轉文字、文字轉語音等技術,Google併購了DNNresearch、Wavii、DeepMind、Mobvoi等公司,取得機器學習技術、進階自然語言處理演算法,而Apple亦透過併購Novauris、VocalIQ、Workflow等新創團隊,取得語音辨識、自然語言處理等核心語音技術。資訊大廠動作頻頻,其在「語音優先 (Voice First)」世代先馳得點的企圖心可見一斑。

AI語音助理平台大廠耕耘家用市場有成,繼AI智慧音箱後,緊接著將觸角伸入行動裝置、穿戴裝置與PC、車載資通訊系統等產品,企圖讓AI語音助理滲透民眾日常生活。由於「生態系規模」是通用型AI語音助理市場的關鍵成功因素,平台大廠挾帶資源優勢,自然一鼓作氣高築壁壘,中、小型語音科技公司望塵莫及。

雖然不少底層語音科技公司掌握某項領先的語音技術,無奈在B2C業務模式下,此優勢似乎無力成就大局。通用型AI語音助理的「聰明與否」,除了取決於多元技術與應用服務的整合功力之外,更需高度掌握一般使用者的生活數據與偏好。就此角度而言,貼近消費大眾的AI語音助理平台大廠,自然握有絕對優勢。

所幸,當戰場移到B2B市場時,競爭態勢可望改觀。首先,Amazon、Google等資訊大廠打造AI語音助理之目的,多半是為了助攻本業營收,故主要客群鎖定普羅大眾。客製化程度高的利基應用市場,顯然不吻合資訊大廠事業策略方向,故預期資訊大廠大舉進軍的意願不高。再者,B2B市場本是語音技術供應商主戰場,長年累積下來的業務拓展經驗與客戶關係,在深耕利基應用領域時,將是有力籌碼。

面對資訊大廠客戶話語權逐步提升之事實,語音科技供應商可選擇持續研發進階技術,或可嘗試轉型為解決方案供應商,藉此降低對既有客戶的依賴度。

觀察AI語音助理平台大廠的語音技術布局軌跡,起初多著重於語音辨識技術、自然語言處理演算法等核心語音技術。隨著準確率達到一定水準後,大廠嘗試讓家用AI語音助理化身「個人貼身秘書」,故聚焦發展使用者偏好預設功能、聲紋辨識技術等,以創造個人化的互動體驗。現階段,下游資訊科技巨擘企圖進一步為AI語音助理添加「人味」,因此語音技術研發轉而聚焦多輪式對話、多語言夾雜、多人穿插發言等對話管理技術,讓使用者與AI語音助理的互動,更貼近人與人之間的對話情境。

語音技術供應商轉型服務供應商,亦是可行出路,但除需掌握利基應用領域數據來源、產業知識外,通路與售後服務資源亦需到位。觀察AI語音技術標竿業者NUANCE Communications的重振經驗,便可看出端倪。

為在利基應用市場扎根,NUANCE Communications已進行超過40次的整合、併購或合作活動,藉此補強解決方案供應商必備能耐。在選定利基市場後,首先透過整合與併購同業,來取得產業知識、數據來源及通路資源,接著,即擴展利基客群及國際市場。站穩腳步後,再補強產品力、完善產品線,以建立「一站式購買」之競爭力。姑且不論轉型成效,從NUANCE Communications的轉型布局軌跡來看,顯然語音科技公司在跨足解決方案業務時,仍有諸多關鍵資源待補。

面對下游廠商語音技術掌握度提升的事實,語音技術供應商可選擇鑽研進階技術、轉型解決方案供應商,或採雙業務並行模式。倘若依舊以技術授權金為主要營收來源,可參考資訊大廠AI語音助理技術布局軌跡,聚焦情緒辨識、多輪式對話、多語言夾雜、多人穿插發言等「對話管理技術」。

若有意進一步拓展AI語音利基應用,則需留意單靠領先的技術能力,恐仍不足以立足市場。借鏡AI語音科技標竿業者NUANCE Communications的轉型經驗,顯示掌握利基領域「數據來源」、「產業知識」與「通路」為基本前提。另外,亦需同步補強系統整合與即時支援等能耐。就此角度而言,併購或跨業合作將是必要之舉。

(本文刊登於工商時報 2018/9/16 A9版)

本文作者

林巧珍  
領域:
簡歷:
熱門點選
  1.   量子電腦發展趨勢前瞻
  2.   中美貿易戰將重塑全球電子產業市場版圖
  3.   2017年GPS/GNSS市場動態觀測
  4.   IBM研發運用光路的AI晶片 超高速且超省...
  5.   晶片大廠於邊際運算之布局
相關研究