Please use this identifier to cite or link to this item: http://hdl.handle.net/11455/17771
標題: 共同向量於語音數字辨識之探討及比較
The investigation and comparison for the method of common vector on speech digits recognition
作者: 張靜芳
zhang, jing-fang
關鍵字: common vector;共同向量
出版社: 應用數學系所
引用: [1]H. Angm, “Common vector obtained from linearly independent speech vectors by using LPC parameters,” graduation project, Elect. Electron. Eng. Dept., Osmangazi Univ., Eskisehir, Turkey, 1995. [2]M. B. Gulmezoglu, Vakif Dzhafarov, and Atalay Barkana, “ A novel approach to isolated word recognition,” IEEE Trans. On Speech and Audio Processing, vol. 7, No. 6,pp.620-628, 1999. [3]M. Bilginer Gulmezoglu, Vakif Dzhafarov, and Atalay Barkana ,“The common vector approach and its relation to principal component analysis” IEEE Trans. On Speech and Audio Processing, vol. 9. No. 6,pp.655-662.Septmber 2001. [4]M. Keskin, M. B. Gulmezoglu, O. Parlaktuna, and A. Barkana, “Isolated word recognition by extracting personal differences,” in Proc. 6 th Int.Conf. Signal Processing Applications and Technology, Boston, MA , pp.1989-1992, 1996. [5]S. Yucel, “Application of Gram-Schmidt orthogonalization method to speech recognition for different noise levels”, graduation project, Elect. Electron. Eng. Dept., Osmangazi Univ., Eskisehir, Turkey, 1996. [6]Thomas F. Quatieri, Discrete-time speech signal processing principles and practice, Prentice Hall PTR, 2002. [7]李宗寶,吳宗憲。”探討K-mean之共同向量法應用於國語數字辨識”。碩士論文,國立中興大學應用數學研究所,台中,2005。 [8]李宗寶,林峰樣。”探討共同向量法應用於國語數字辨識”。碩士論文,國立中興大學應用數學研究所,台中,2004。 [9]王小川。”語音訊號處理”。台北市:全華圖書公司,2004。 [10]李宗寶,余林達。”探討隱藏式馬可夫模型應用於國語數字辨識”。碩士論文,國立中興大學應用數學研究所,台中,2004。 [11]李宗寶,林靖剛。”利用Multiple Common Vector 於國語數字之語音辨識” ,國立中興大學應用數學研究所,台中,2006。 [12]陳志堅,黃銘崇。”不特定語者語詞辨識系統之特徵設計” 。碩士論文,國立中興大學電機工程研究所,台中,2001。 [13]國立臺灣師範大學國音教材編輯委員會。”國音學”。正中書局,2002。
摘要: 
本論文主要是利用「共同向量」來建構語音模型及辨識比對,看辨識比對的切割音框數大小,和子母音切割不同是否影響辨識的能力,目的是希望看什麼音框數之下切割子音和母音比例,有較佳的辨識能力。
在此論文中探討國語數字0~9的語音辨識,利用前處理切割音框壓縮和擴張到5、10、20、30、50、70、90、110、130個音框數,再將子音和母音切割一定的比率2.25:7.75、2:8、1.75:8.25、1.5:8.5、1.25:8.75,最後使用共同向量的方法,求出具代表性的共同向量,再做辨識比對的工作,辨識出較正確的語音。
本實驗語音資料由21人中進行錄音,其中為12位男生、9位女生,每個人念0~9的音各三次,之後取音,其中的前兩次共420個音為訓練語音的模型,第三次的語音210做為特定語者辨識系統時的測試語音,接下來對語音資料庫內所有的語音做前處理動作,其中含有數位取樣、常態化、語音端點偵測、切割音框、預強調、視窗化等六個步驟,再求出多組維度不固定的倒頻譜參數,將音框數壓縮或擴張成m = 5、10、20、30、50、70、90、110、130個,再將每個音求出多組的特徵向量、變成一組的特徵向量矩陣。最後用共同向量法建構語音模型和辨識比對。辨識結果最好在取音框70個、子母音比為1.25:8.75,其中辨識率為99.05%。
URI: http://hdl.handle.net/11455/17771
其他識別: U0005-1007200715130800
Appears in Collections:應用數學系所

Show full item record
 

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.