產業與經濟
口音多、聲控技術中國最難! 「我愛妳」變成「鵝矮泥」

張瑋容╱北美智權報 編輯部

2012.09.03
         

各國致力於開發自有語言的聲控技術,紛紛推出專屬語言的語音辨識軟體,如韓國Samsung及LG的 S Voice 及 Q Voice、日本 NTT DoCoMo的Sabette Concier、陸廠科大訊飛的「訊飛語點」、長虹的Ciri、及台廠賽微科技的 Voice Go及「賽微輕鬆說」。各國發展聲控不遺餘力,聲控技術也從手機應用至家電、車載影音、醫療等面向。有趣的是,在中國市場由於地廣口音多,導致聲控技術發展難度最高,講一句「我愛妳」變成「鵝矮泥」,情人節的時候,一不小心可能釀成分手悲劇。


語音辨識技術的問題,在於對噪音環境的處理、對於不同口音、說話習慣的辨識,以及必須不斷優化的演算法。其基本原理在於對輸入的語音信號進行分析,接收並擷取語音特徵參數、再與資料庫中的語音範本參數進行匹配辨識。也因為如此高技術門檻,語音辨識技術的識別率一直不高,也導致語音辨識技術一直沒有能夠大規模開展。

儘管如此,隨著Siri引起的熱潮,以及考量便利性與安全的需要,聲控技術在各國依舊如火如荼競相車拼。以下針對韓國、日本、大陸及台灣各家大廠逐一說明之。

韓國Samsung、LG手機聲控不遺餘力  主打國外、兼顧國內

隨著Siri語音控制系統蔚為風潮,各種語種的聲控功能也隨之受到注意。不僅用於智慧型手機,各種家電、車用影音、導航、醫療等面向,也處處可見聲控的市場。在手機聲控方面,韓國 Samsung 及LG分別開發了S Voice及 Quick Voice 的語音控制軟體,在市場一較高下。

三星(Samsung)在2012年發布的Galaxy S3旗艦機種,亦具備S Voice語音秘書功能,為聲控進展再添佳績。而Samsung在語音相關專利申請布局上也同樣不遺餘力,在USPTO上共有127件通過的語音專利,申請中、待審核的專利共有151件。與此同時,LG 也宣佈在其Optimus 手機推出自家的語音指令系統 Quick Voice (今年七月更名為 Q Voice),只支援韓文語音,同樣能以韓文口語方式完成查詢天氣、發簡訊、網路搜尋等任務。LG雖然在USPTO語音控制專利申請相較 Samsung少非常多,僅通過31件,申請中的專利也僅33件,但LG專注開發韓文語音系統 (但七月已公佈明年將推出英文版語音),不與 Siri 正面迎戰,專心經營國內市場,發展策略與 Samsung 明顯不同,未來也較沒有在國際打專利官司的疑慮。

表一、Samsung、LG語音控制專利件數及佈局
大廠 語音控制專利通過件數 語音控制專利申請件數 發展策略
Samsung 127 151 S Voice兼顧國內及海外市場,與 Siri 正面迎戰。另發展家電、機器人等語音專利
LG 31 33 手機語音控制 助理Q Voice僅支援韓文,專注國內市場。將於明年支援英文
統計製表:張瑋容   數據資料來源:USPTO    搜尋日期:2012/08/30
附註:USPTO搜索字串 Assignee AND Abstract: speech

家電、機器人統統來  Samsung聲控應用多元

除了智慧型手機的聲控功能,Samsung 於今年年初於美國國際消費電子展 (CES) 上,發表新一代旗艦智慧電視 ES8000,搭載雙核心處理器,可同時多工處理觀賞電視、上網及使用應用程式,Smart TV,搶先Apple及Microsoft,推出同時具備聲控及體感控制功能的高畫質電視 (HDTV)。使用者可用語音及體感來操控電視,透過外接裝置,用戶可以在至少四公尺的距離操控Samsung Smart TV,使用語音輸入不同的指令,例如轉換頻道、音量調整等。然而 Samsung的聲控並非透過雲端運作,而是連結外接裝置來進行,因此將受限於外接裝置的網路連線及硬體效能,不能發揮太多功能。

從今年年初的CES 2012發表新一代 Smart TV,到之前發表的新款旗艦手機Galaxy S III,Samsung已經將自然語音操作應用到不同產品上,最不同的是,也許下一步將用在機器人的語音控制?根據Samsung近期所取得的一項專利內容(如圖一),機器人可根據環境噪音自動調節聲音探測能力,意謂著即使在嘈雜的環境下依然能辨識使用者的指令。不過此份專利書主要闡述透過語音辨識後完成指令動作的應用情境,並未對機器人能完成哪些事項多做說明,因此未來Samsung是否推出具有聲控功能「機器管家」,朝完整的家電聲控版圖邁進,相當有趣也值得期待。



圖一、Samsung 關於機器人語音控制的專利書首頁

NTT DoCoMo開發日文語音迎戰 Siri  日本大廠專注家電聲控發展

韓國LG目前僅開發支援韓文語音控制 Q Voice,無獨有偶,未取得 iPhone販售權的日本電信商NTT DoCoMo於今年3月初,為旗下以 Android 的智慧型手機提供語音助理 Sabette Concier。如同 Siri 所提供的,Sabette Concier 透過雲端提供用戶語音指引與搜尋功能,並利用與 Wikipedia、NTT DoCoMo 自有平台 dmenu 以及其他主要內容提供平台締結。Siri 也有日文版語音控制,但 NTT DoCoMo希望藉由Sabette Concier挑戰販售 iPhone 的電信商 KDDI 與 Softbank。

日本電氣公司NEC在2011年9月13日獲得USPTO核准一項8019091、關於Voice activity detector (VAD) 的專利,用來處理噪音、並應用於家電語音控制。而Sony在家電聲控技術的發展則專注於網路電視,在台發表4個系列共11款大小從32吋到55吋的網路電視Sony Internet TV,使用者手機、平板電腦只要安裝遙控軟體,還可聲控輸入文字在Facebook發送訊息。

表二、日本大廠語音控制專利件數及佈局
大廠 語音控制專利通過件數 語音控制專利申請件數 發展策略
NTT DoCoMo 20 6 電信公司,專注於手機語音控制系統開發
NEC 373 97 應用於各種家電
Panasonic 46 14 應用於各種家電
Sony 232 75 家電、影音系統
統計製表:張瑋容   數據資料來源:USPTO    搜尋日期:2012/08/30
附註:USPTO搜索字串 Assignee AND Abstract: speech

民間、官方合作開發  大陸聲控技術克服各地口音

中文屬於困難的語言,存在四個聲調的變化,加上各地區不同口音的存在,對於語音辨識來說,中文一直是極具挑戰的語種。舉例來說,若情人節時要透過語音傳送簡訊給女朋友,男朋友邊開車邊對著手機說聲「我愛妳」,但因為四聲及口音的辨識困難,有可能會出現「握矮泥」等字樣,此時男朋友若要再花心思修正語音,可能因注意力轉移而不小心釀成車禍悲劇。iOS 6版本的 Siri即將推出中文版語音,實際功能仍待觀察。面對 Siri的強大競爭,行動通訊業者中國移動砸下重金投入網路建制、並提高手機補貼策略以提振獲利成長。據彭博報導,行動通訊業者中國移動於今年8月23日向香港證交所申報資料顯示,中國移動擬以每股19.40元人民幣,認購語音控制技術公司安徽科大訊飛7030萬股股票(即15%股權),共耗資13.6億元人民幣(2.14億美元)。科大訊飛於今年3月提出支援 Android 系統的手機語音軟體「訊飛語點」,中國移動砸下的重金能否獲得手機市佔率,戰況將於 iOS 6推出後趨於明朗。

除了民間企業,大陸官方的中科信利語音實驗室於2002年在中國科學院知識創新工程的支援下成立,隸屬於中國科學院聲學研究所。中科院聲學所於近期內與其轉投資子公司北京中科信利技術有限公司與富迪科技 (Fortemedia Inc.) 結盟,結合雙方的語音合成技術及資源來面對加劇的競爭。

在家電應用方面,大陸彩電業者長虹推出中文語音辨識系統 Ciri,此套系統基於 Android 系統,由長虹-訊飛語音實驗室自行開發,主要功能包含了人機互動、語音搜索、語音輸入等,在幅員廣大、口音種類相對複雜的大陸,除了北京普通語外,Ciri目前可支援的方言包含四川湖南廣東等地。

另外,華為在其高階的智慧型手機上採用全新的Emotion UI,並與科大訊飛聯手開發「語音助手」功能。「語音助手」改善Android系統Voice Actions的詬病,針對自然語言的理解和反應進行改善。除了雲端服務,「語音助手」可離線使用,並通過車載藍牙使用語音助手,為本語音控制軟體的亮點。

台廠賽微科技專注開發行動手機聲控軟體  台達電語音專利布局搶先

在台灣的聲控技術方面,專職於語音辨識與手機平台開發的賽微科技 Cyberon,結合自身對手機平台及 Mobile app的熟稔,開發了語音搜尋程式 Voice Go 及「賽微輕鬆說」等軟體,只要依據自然的中文口說習慣,便可搜尋出想要的資訊,目前約有百萬名使用者。除了與導航廠商 Mio, Papago合作導入語音聲控導航外,賽微也幫數家醫院開發行動巡房、「iSir掛號小幫手」行動掛號應用程式。對於開發過程中所遇到的技術困難,賽微科技嵌入式解決方案事業處副總劉進榮表示,語音控制產業的進入門檻較高,要使自然語言處理(Natural Language Processing, NLP)能力的涵蓋範圍夠大,需要長時間的語料累積及大量人力投注,推出產品也必須夠成熟才能廣為使用者接受。目前賽微正開發閩南語聲控軟體,準備搶攻高齡市場。賽微目前已通過數個語音控制相關專利,仍有3個專利在審核中,劉進榮表示,好的發明仍需要專利的保護,進而進行優質的市場佈局。

國內廠商台達電於2000年開始亦投入語音辨識領域,其嵌入式語音識別應用解決方案將語音識別技術嵌入於各種不同的裝置端,家電用品、汽車、電腦、手機、玩具、3C產品等皆為應用終端。台達電也推出閩南語辨識系統,而在專利布局方面,台達電通過的語音專利項目為36件,專利布局策略較為全面。

 

Facebook 按讚馬上加入北美智權報粉絲團       

Issue 68 Index
本期智權報文章
李淑蓮
張瑋容
張瑋容
徐嶔煌
葉雪美
呂克行
黃蘭閔
葉雲卿
李淑蓮
徐嶔煌
Renee
陳宜誠
你好大我好怕!趁Apple沒出手 智慧型手機廠搶攻LTE市場
蘋果微軟谷歌三強戰聲控 九大車廠擁護Siri最具贏面
口音多、聲控技術中國最難! 「我愛妳」變成「鵝矮泥」
什麼?!這個鍵盤可以丟到廚房用水洗!
蘋果三星戰完整報導 設計專利侵權鑑定大公開
從Rambus之DRAM專利訴訟看一封往返長達9年的電子郵件
美國AIA系列修法:發明人宣誓書37 CFR配套修法摘要
雲端也爆專利戰 - 英國電信興訟戰Google
前案檢索降低專利無效風險 功力深淺效果差很大
爽!中央公務員一生賺4420萬 慘!青年月薪不到三萬
不要只會扼殺商機!交通部應開放路權、發展重機觀光取代禁止
只要求工程師趕貨拚產能,不重視研發創新,如何能提昇產業競爭力?