近日國內成功大學向美國法院控告Apple Siri 語音控制系統侵權一案,使得在市場已開始廣泛投注開發與應用的語音控制及辨識技術又再度備受關注。語音控制已行之有年,然而,卡在處理器速度及NLU演算法、資料庫尚未發展完備的瓶頸,致使聲控介面遲遲不能普及。從2000年開始,語音行動上網需求浮現,初始是將語音搜尋器安裝於電腦電話整合系統 (CTI) 的伺服器平台上,以利消費者查詢以電話查詢即時股票、餐飲等訊息。近幾年開始,聲控市場起了莫大變化,技術成熟、資料庫愈來愈完整,美國各大廠在聲控版圖的發展不盡相同,產業變化熱鬧繽紛。
Apple 以金錢換取時間 併購Siri、同步搶攻汽車聲控
Apple在2011年推出 iPhone 4S,搭載 Siri語音秘書系統,讓語音控制技術又成為各家業者競相追逐的技術。儘管 Microsoft 宣稱在 2005年即已推出手機語音控制概念,Google也於一年多前推出類似的語音搜索 (voice search) 服務,但 Siri 掀起的熱潮仍使 Microsoft 及 Google 望塵莫及,原因在於語音控制技術的難度及門檻,並非靠科技研發便能達成,語音識別的工作原理相當繁複(如圖一),當中牽涉了人的自然用語習慣、各種口音、講話速度等人為因素,因此必須累積更多的人力及時間來建構語料資料庫。
隨著Apple跨足汽車業,目前全球一線車廠的高階車款皆有標配或選配聲控功能,這也意味著 Siri這樣新元素即將整合至汽車車款。儘管 Microsoft 投資的 Nuance 已搶先提供汽車聲控解決方案,然而聲控功能仍不如 Siri 來得自然、強大,而在平台商跨足汽車業的同時,難度不只是技術,更在於同時整合汽車、手機、安全系統等產業。因此在後續的市場搶攻策略中,各大廠之間呈現何種競爭格局、又採用哪些整合模式,將是汽車聲控產業的焦點議題。
Microsoft 整合旗下產品、推出共用程式 與Apple區隔市場
不甘讓Apple Siri專美於前,Microsoft繼 Windows Phone 7 可以透過語音啟動應用程式後,於今年6月發表 Windows Phone 8,導入透過語音控制應用程式 或進行網頁搜尋等功能,再度強化其語音控制功能,也採用三大平台(手機、平台、個人電腦)的共用程式,讓使用者能遊走於三種產品之間。然而,因其應用程式商城種類尚不夠強大完整,僅10萬餘個應用程式,市佔率目前仍不敵有50萬個應用程式的 Android 手機及 iPhone。
Microsoft在手機語音控制的發展似乎不若 遊戲機 Kinect 來得受人矚目。報導指出 Microsoft 可能在近期計劃將Xbox 360上安裝IE 9瀏覽器。同時還計劃將新的瀏覽器與Kinect整合,讓使用者透過語音和手勢來操控瀏覽器。整合旗下產品,使 Xbox 360具有 Bing 視頻搜索功能及 Kinect 語音辨識功能,此舉意欲提高使用者體驗人性化的程度,也與Apple專長領域有所區隔。