產業與經濟
蘋果微軟谷歌三強戰聲控 九大車廠擁護Siri最具贏面

張瑋容╱北美智權報 編輯部

2012.09.03
         

語音控制是最直接的人機溝通方式,這項技術由來已久,美國的聲控市場也出現不同產業整合、併購的熱鬧景象。Apple為加快語音控制發展腳步,買下 Siri並大動作與車商洽談,同步申請專利。Microsoft則整合旗下產品、並推出Windows Phone已開發聲控版圖;語音辨識商Nuance 發展策略多角化;Google則先攻手機與電視整合聲控先機。在三強搶攻的聲控戰場中,目前以Apple取得雙B、Toyota等九大車廠的擁護,最具冠軍相。


近日國內成功大學向美國法院控告Apple Siri 語音控制系統侵權一案,使得在市場已開始廣泛投注開發與應用的語音控制及辨識技術又再度備受關注。語音控制已行之有年,然而,卡在處理器速度及NLU演算法、資料庫尚未發展完備的瓶頸,致使聲控介面遲遲不能普及。從2000年開始,語音行動上網需求浮現,初始是將語音搜尋器安裝於電腦電話整合系統 (CTI) 的伺服器平台上,以利消費者查詢以電話查詢即時股票、餐飲等訊息。近幾年開始,聲控市場起了莫大變化,技術成熟、資料庫愈來愈完整,美國各大廠在聲控版圖的發展不盡相同,產業變化熱鬧繽紛。

Apple 以金錢換取時間 併購Siri、同步搶攻汽車聲控

Apple在2011年推出 iPhone 4S,搭載 Siri語音秘書系統,讓語音控制技術又成為各家業者競相追逐的技術。儘管 Microsoft 宣稱在 2005年即已推出手機語音控制概念,Google也於一年多前推出類似的語音搜索 (voice search) 服務,但 Siri 掀起的熱潮仍使 Microsoft 及 Google 望塵莫及,原因在於語音控制技術的難度及門檻,並非靠科技研發便能達成,語音識別的工作原理相當繁複(如圖一),當中牽涉了人的自然用語習慣、各種口音、講話速度等人為因素,因此必須累積更多的人力及時間來建構語料資料庫。


圖一:語音識別的工作原理

Apple在開發語音控制技術時,也曾嘗試自行開發,於2009年申請的專利(US2010312547A,圖二) 便可得知。然而語音控制成效不佳,為加快語音控制發展技術,並趕上 iPhone新機推出時程,Apple於 2010年買下Siri,快速在手機作業系統iOS中集成語音控制,並在用戶體驗方面對語音控制功能進行優化,雖然Siri語音系統現今仍未臻完美,但已成功達到再一次的技術創新,讓它使用起來更加自然,更像對話式的語音控制,而非只有下達簡單指令。


圖二、US2010312547A首頁圖說

Siri竄起之後,也促使提供 Siri 技術、專門開發聲音及語言解決方案的Nuance加快語音控制發展腳步,曾經控告 Vlingo這家語音辨識服務廠商的Nuance,選擇盡棄前嫌,於2011年底以5億美金併購了Vlingo,透過這兩家廠商的技術及資源整合,Nuance 於今年8月發表了行動程式虛擬助理Nina,為市場上首度提供SDK解決方案的廠商,同時Nina提供的 SDK支援iOS與Android平台,透過雲端提供了語音辨識、文字轉語音、聲音生物辨識及自然語言理解技術,不但能理解使用者所下的指令或查詢,也能辨識說話者的身份。開發人員只要將Nina嵌入自己的程式或不同平台中,便可讓使用者透過聲音控制程式來完成某些工作。 

汽車聲控市場角力戰 Apple, Microsoft, Nuance, FORD競合關係

除了致力於手機語音控制技術的布局與發展,Apple也大張旗鼓的將版圖擴張至汽車聲控市場。Apple在今年的全球開發者大會上正式公佈,在未來的一年內計畫與全球多數主要車廠合作,將Siri整合入汽車車體設計之中,計畫在今年第三季發表SEFM (Siri Eyes Free Mode) 搶市,即將iPhone的Siri按鈕複製到汽車的方向盤上,如此駕駛便可透過汽車影音系統與Siri交談,利用語音控制與連接汽車的新技術讓Siri完成找路、定位、播放音樂等工作。依Apple公佈的資料,目前決定參與整合並支援Apple Siri 功能的車廠分別是 Audi、BMW、Crysler、Honda、General Motors、Jaquar、Land Rover、Benz及TOYOTA等九家車廠。

繼Apple計畫在今年第三季發表SEFM (Siri Eyes Free Mode) 搶市,Microsoft也不甘示弱,與車廠福特合作推出車用智慧聲控平台SYNC;而Google則將藉由今年下半年陸續問世的Android車載資通訊 (Telematics) 系統,力推語音搜尋服務。三大平台商的頻繁大動作,顯示已卯足全力角逐汽車聲控商機,而汽車聲控市場激戰也蓄勢待發。

福特為各大車廠在汽車聲控及語音控制等技術投入最積極的汽車公司,應用了Nuance語音識別技術,新一代的福特車款搭載SYNC AppLink軟體,提供駕駛者使用語音操控智慧型手機,Android、BlackBerry和iPhone等智慧型手機上的應用程式都可以操作。Microsoft相中汽車聲控這塊大餅,投資 Nuance、與福特聯手打造的SYNC車載資通訊平台,以聲控功能做賣點,並已售出四百萬台在市場先攻下一席之地;然而,挾有兩大應用程式平台的Apple與Google已急起直追,將對微軟後續發展帶來極大威脅與挑戰。

隨著Apple跨足汽車業,目前全球一線車廠的高階車款皆有標配或選配聲控功能,這也意味著 Siri這樣新元素即將整合至汽車車款。儘管 Microsoft 投資的 Nuance 已搶先提供汽車聲控解決方案,然而聲控功能仍不如 Siri 來得自然、強大,而在平台商跨足汽車業的同時,難度不只是技術,更在於同時整合汽車、手機、安全系統等產業。因此在後續的市場搶攻策略中,各大廠之間呈現何種競爭格局、又採用哪些整合模式,將是汽車聲控產業的焦點議題。

Microsoft 整合旗下產品、推出共用程式 與Apple區隔市場

不甘讓Apple Siri專美於前,Microsoft繼 Windows Phone 7 可以透過語音啟動應用程式後,於今年6月發表 Windows Phone 8,導入透過語音控制應用程式 或進行網頁搜尋等功能,再度強化其語音控制功能,也採用三大平台(手機、平台、個人電腦)的共用程式,讓使用者能遊走於三種產品之間。然而,因其應用程式商城種類尚不夠強大完整,僅10萬餘個應用程式,市佔率目前仍不敵有50萬個應用程式的 Android 手機及 iPhone。

Microsoft在手機語音控制的發展似乎不若 遊戲機 Kinect 來得受人矚目。報導指出 Microsoft 可能在近期計劃將Xbox 360上安裝IE 9瀏覽器。同時還計劃將新的瀏覽器與Kinect整合,讓使用者透過語音和手勢來操控瀏覽器。整合旗下產品,使 Xbox 360具有 Bing 視頻搜索功能及 Kinect 語音辨識功能,此舉意欲提高使用者體驗人性化的程度,也與Apple專長領域有所區隔。

Google 整合手機與電視聲控

行動搜尋市佔率高達97%的Google,在一年多前也推出語音搜索服務(voice search),為了強化行動搜尋功能,Google推動「Grand Prix」計畫,讓工程師改造行動搜尋系統,計劃能隨時隨地搜尋、用聲控或拍照取代打字。Google並於2010年發布Voice Action,使Android智慧手機能夠透過此程式將聲音轉換成文字訊息發送以及使用Google搜尋以及Google地圖。儘管擁有強大搜尋市佔率,Google開發語音控制功能的速度始終跟不上Apple,原因在於未來即時整合自有產品及平台。向來以創意及技術開發的 Google,未能迅速推出新行動產品或廣告,現在則需要推出某些創新,才能從行動平台獲得更多營收。

Google發展聲控技術的腳步雖略為落後,但其觸角已成功延伸至電視產業。據Patently Apple網站的消息指出,在Apple推出iCloud與Siri功能的前幾天,Google向USPTO提出透過行動裝置上之聲音控制功能遙控Google電視的專利,這意味著未來Android智慧型手機內將內建這項聲控技術,以達到手機同步顯示與Google電視進行語音控制的需求。如圖三所示,這項聲控技術不只能夠應用在電視機的節目上,亦可應用到無線音樂播放的功能。在距離家裡將近400公尺處便可感應,因此消費者在到家前可先行聲控設定播放家裡的音樂、並打開電視。


圖三、Google TV與智慧型手機或平板電腦整合示意圖  資料來源:Patently Apple

Amazon 強化網站搜尋 併購 Yap

據美國證券交易委員會 (SEC) 文件顯示,Amazon 在2011年9月收購了語音辨識技術公司Yap,交易雙方一直沒有透露相關消息,顯示目前Amazon的一切產品都還沒有設計聲控,但 Amazon也悄悄踏出聲控發展的一小步。Yap的技術主要用於將語音轉換為文本,而 Siri 的功能不僅限於語音文本轉換、更著眼於將語音轉換為指令的功能。因此,Amazon併購 Yap 不單只是為了與 Siri抗衡,主要用意在於建立自己的語音技術平台,用來強化Amazon的客戶服務與網站行動搜尋。

綜合以上所述,聲控技術雖然發展已久,但因技術限制及語料累積,至近兩年才堪稱開花結果。從手機應用擴展到汽車聲控,語音辨識及控制技術愈臻成熟的同時,也出現了不同產業間的整合現象。手機、導航、影音系統、汽車公司、語音控制技術商、平台商、安全系統製造商之間的競合關係,使聲控產業益顯熱鬧。各大廠的在聲控領域的發展策略亦不盡相同,從USPTO查詢可得知(表一),Microsoft雖有367項相關的語音控制專利,但主要應用在於自家遊戲產品 Xbox及 Kinect,雖以推出Windows Phone緊追在後,但因其應用程式種類不夠多,目前難獲消費者青睞。獲得Microsoft投資的Nuance 則以210件專利表現亮眼,除了併購、與車廠合作、同時是上游技術供應商,發展策略相當多元化。Apple為一舉攻下智慧型手機語音控制市場,併購 Siri並成功搶進汽車聲控事業,時效掌握迅速搶得先機。Google語音控制專利件數為16件,同步顯示並整合手機與電視聲控功能令人矚目。而聲控專利申請僅2件的Amazon,以併購 Yap策略顯示其意圖不在於和 Siri抗衡,反倒著眼於網站搜尋服務。

表一、美國各大廠語音控制專利申請數及發展策略整理表
大廠 語音控制專利數 聲控布局策略
Microsoft 367 至2012/08/30止,今年共通過32項語音專利,藉由整合自家產品來擴大聲控版圖,並投資Nuance
Nuance 210 Microsoft投資,Siri的技術供應商,併購 Vlingo,與車廠FORD合作開發SYNC,與 hTC簽訂合約,發展多元化
Apple 68 併購 Siri,大舉擴張汽車聲控版圖
Google 16 同步整合手機與電視聲控
Amazon 2 併購Yap
統計製表:張瑋容   數據資料來源:USPTO    搜尋日期:2012/08/30
附註:USPTO搜索字串 Assignee AND Abstract: speech

 

Facebook 按讚馬上加入北美智權報粉絲團       

Issue 68 Index
本期智權報文章
李淑蓮
張瑋容
張瑋容
徐嶔煌
葉雪美
呂克行
黃蘭閔
葉雲卿
李淑蓮
徐嶔煌
Renee
陳宜誠
你好大我好怕!趁Apple沒出手 智慧型手機廠搶攻LTE市場
蘋果微軟谷歌三強戰聲控 九大車廠擁護Siri最具贏面
口音多、聲控技術中國最難! 「我愛妳」變成「鵝矮泥」
什麼?!這個鍵盤可以丟到廚房用水洗!
蘋果三星戰完整報導 設計專利侵權鑑定大公開
從Rambus之DRAM專利訴訟看一封往返長達9年的電子郵件
美國AIA系列修法:發明人宣誓書37 CFR配套修法摘要
雲端也爆專利戰 - 英國電信興訟戰Google
前案檢索降低專利無效風險 功力深淺效果差很大
爽!中央公務員一生賺4420萬 慘!青年月薪不到三萬
不要只會扼殺商機!交通部應開放路權、發展重機觀光取代禁止
只要求工程師趕貨拚產能,不重視研發創新,如何能提昇產業競爭力?