手語研究的方向與現狀

學識都 人氣:2.57W
摘要:介紹國內外手語研究的主要方向及研究現狀,手語識別的各種方法、手語合成的組成部分、手語網絡通信的實現技術以及手的運動約束問題。

手語是聾啞人使用的語言。它是由手形動作輔之以表情姿勢而構成的比較穩定的表達系統,是一種靠動作/視覺進行交際的特殊語言。

手語研究的方向與現狀

人類交互往往聲情並茂,除了採用自然語言(口語、書面語言)外,人體語言(表情、體勢、手勢)也是人類交互的基本方式之一。與人類交互相比,人機交互就呆板得多,因而研究人體語言理解,即人體語言的感知,及人體語言與自然語言的信息融合對於提高計算機的人類語言理解水平和加強人機接口的可實用性的極有意義的。手語是人體語言的一個非常重要的組成部分,它是包含信息量最多的一種人體語言,它與語言及書面語等自然語言的表達能力相同,因而人機交互方面,手語完全可以作爲一種手段,而且具有很強的視覺效果,它生動、形象、直觀。

手語的研究不僅有助於改善和提高聾啞人的生活學習和工作條件,爲他們供更好的服務。同時也可以應用於計算機輔助啞語教學、電視節目雙語播放、虛擬人的研究、電影製作中的特技處理、動畫的製作、醫療研究、遊戲娛樂等諸多方面。另外,手語的研究涉及到教學、計算機圖形學、機器人運動學、醫學等多學科。因此,手語的研究是一個非常有意義的課題。這裏將結合國內外手語研究的相關方向,對手語的識別、手語的合成、手語的網絡通信、手的'運動約束這幾方面作一下綜述。

1 手語的識別

手語的識別不但具有深遠的研究意義,而且具有廣闊的實際應用前景,至少表現在以下幾個方面:(1)能夠使得聾啞人,尤其是使得文件程度比較低的聾啞人,使用手語和正常人交流;(2)從認知科學的角度,研究人的視覺語言理解的機制,提高計算機對人類語言的理解水平;(3)利用手勢控制VR中的智能化;(4)機器人的示範學習;(5)虛擬現實系統中的多模式接口等。

從手語輸入設備來看,手語識別系統主要分爲基於數據手套的識別和基於視覺(圖像)的手語識別系統。基於數據手套的手語識別系統,是利用數據手套和位置跟蹤測量手勢在空間運動的軌跡和時序信息。這種方法的優點是系統的識別率高。缺點是打手語的人要穿戴複雜的數據手套和位置跟蹤器,並且輸入設備比較昂貴。利用數據手套等典型傳感設備的方法,臺灣大學的Liang等人利用單個VPL數據手套作爲手語輸入設備,可識別臺灣手語課本中的250個基本詞條,識別率爲90.5%。CMU的Christopher Lee和Xu在1995年完成了一個操縱機器人的手勢控制系統。Kadous用Power Gloves作爲手語輸入設備,識別有95個孤立詞構成的詞彙集,正確率爲80%。基於視覺的手勢識別是利用攝像機採集手勢信息,並進行識別。該方法的優點是輸入設備比較便宜,但識別率比較底,實時性較差,特別是很難用於大詞彙量的手語錄的識別。在基於視覺的方法方面,具有代表性的研究成果包括:1991年富士通實驗室完成了對46個手語符號的識別工作。Davis和Shah將戴上指間具有高亮標記的視覺手套的手勢作爲系統的輸入,可識別7種手勢。Starner等在對美國手語中帶有詞性的40個詞彙隨機組成短句子識別率達到99.2%。Grobel和Assam從視頻錄像中是取特徵,採用HMM技術識別262個孤立詞,正確率爲91.3%。此外,Vogler與Metaxas將兩種方法結合用於美國手語識別,交互採用一個位置跟蹤器及三個互相垂直的攝像機作爲手勢輸入設備,完成了53個孤立詞的識別,識別率爲89.9%。

從識別技術來看,以往手語識別系統主要採用基於人工神經網絡(ANN)及基於隱Markov模型(HMM)等方法。神經網絡方法具有分類特性及抗干擾性,然而由於其處理時間序列的能力不強,目前廣泛用於靜態手勢的識別。著名的Fels的GloveTalk系統採用神經網絡方法作爲識別技術。對於分析區間內的手語信號,通常採取HMM方法進行模型化。HMM是衆周知並廣泛使用的統計方法,一般拓撲結構下的HMM具有非常強的描述手語信號的時空變化能力,在動態手勢識別領域一直佔有主導地址,如卡內基·梅隆大學的美國手語識別系統及臺灣大學的臺灣手語識別系統等均採用HMM作爲系統的識別技術。另外,Grobel與Assam利用HMM識別由戴有色手套的用戶通過攝像機輸入的262個孤立手語詞,正確率爲91.3%。然而正是由於HMM拓撲結構的一般性,導致這種模型在分析手語信號時過於複雜,使得HMM訓練和識別計算量過大。尤其是在連續的HMM中,由於需要計算大量的狀態概率密度,需要估計的參數個數較多,使得訓練及識別的速度相對較慢。因而以往手語識別系統所採用的HMM一般爲離散HMM。

TAGS:手語