Please use this identifier to cite or link to this item: http://hdl.handle.net/11455/17838
標題: 利用PCA與CHMM於國語數字之語音辨識
Using the Method of PCA and CHMM to Speech Recognition of Mandarin digits
作者: 張全豐
Chang, Chuan-Feng
關鍵字: PCA;CHMM;Baum-Welch;Segmental K-means
出版社: 應用數學系所
引用: [1] Jeff A. Bilmes, “A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models.”ICSI, 1998. [2] M. Bilginer Gülmezo lu , Vakif Dzhafarov, Mustafa Keskin, and Atalay Barkana, “ A Novel Approach to Isolated Word Recognition.” IEEE Vol. 7, NO.6, pp.620-628, 1999。 [3] M. Bilginer Gülmezo lu, Vakif Dzhafarov, and Atalay Barkana, “ The Common Vector Approach and Its Relation to Principal Component Analysis.”IEEE , Vol.9, NO.6, pp.655-662, 2001。 [4] Bling-Hwang Juang and L. R. Rabiner, “The Segmental K-Means Algorithm for Estimating Parameters of Hidden Markov Models.”IEEE Vol.38. NO.9, pp.1639-1641, 1990. [5] L. R. Rabiner, “A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition.”Proc.IEEE, Vol.77. NO.2, pp.257-286, 1989. [6] Huang, Acero, Hon, “Spoken Language Processing” pp.170-175, PH PTR, 2001. [7] H. Sakoe and S. Chiba. “Dynamic programming algorithm optimization for spoken word recognition.”IEEE Transaction on Acoustic, Speech, Signal processing, 26(1):43-49, 1978. [8] Wu, C.F.J. “ On the convergence properties of the EM algorithm..”The Annals of statistics, 11, 95-103, 1983. [9] 林進燈,周志成,周佑霖(2002)。”以結合決策樹與GCVHMM為基礎之不特定語者中文連續數字語音辨識”,碩士論文,國立交通大學電機與控制工程研究所,新竹市。 [10] 黎自奮,李宗寶,余林達(2004)。”探討隱藏式馬可夫模型應用於國語數字辨識”,碩士論文,國立中興大學應用數學系,台中市。 [11] 李宗寶,許晉榮(2005)。“用混合Segmental K-Means和HMM方法辨識國語之語音數字”,碩士論文,國立中興大學應用數學系,台中市。 [12] 王小川(2004)。“語音訊號處理”。全華書局,台北市。 [13] 李宗寶,林靖剛。“利用Multiple Common Vector於國語數字之語音辨識”,碩士論文,國立中興大學應用數學系,台中市。 [14] 吳明哲,黃世陽(1998)。“Visual Basic 6.0 學習範本”。松崗書局,台北市。
摘要: 
CHMM是語音辨識中常用的模型而PCA的方法可以將聲音的不變特徵擷取出來,本論文希望透過擷取不變特徵後再用CHMM來做語音的模型訓練與辨識進而做一些分析,因此構成PCA與CHMM的混合模型。

本論文要探討以PCA與CHMM混合模型下,在什麼樣的情況會有較好的辨識度。我們考慮的條件有1.Baum-Welch與Segmental K-means兩種訓練模型與辨識語音方式;2.特徵值取大與取小兩種情況,及該取幾個特徵值較好;3.特徵參數內的變數假設是獨立與假設是相關的。而實驗最後的結果認為用Baum-Welch與Segmental K-means各有優缺點;將特徵值取大的、取九個特徵值及假設變數之間是獨立的有較好的辨識結果,即210個測試語音中有96.19%的辨識率
URI: http://hdl.handle.net/11455/17838
其他識別: U0005-2506200712233600
Appears in Collections:應用數學系所

Show full item record
 
TAIR Related Article

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.