Please use this identifier to cite or link to this item: http://hdl.handle.net/11455/18715
標題: 利用共同向量法辨識中文單音及爆破氣音的探討
Using the Method of Common Vector to Recognize Isolated Mandarin Word and Investigation of Plosive
作者: 陳漢良
Chen, Han-Liang
關鍵字: Mel-frequency cepstrum coefficient;梅爾頻率倒頻譜係數;Common vector;共同向量法
出版社: 統計學研究所
引用: [1] 王小川 (2004)。“語音訊號處理”。台北市:全華。 [2] 王國榮 (2000)。“Visual Basic 6.0 實戰講座”。台北市:旗標。 [3] 杜思良,李宗寶 (2008)。“利用共同向量於特定語者之中單音辨識”。碩 士論文,國立中興大學應用數學研究所,台中。 [4] 吳明哲,黃世陽 (1998)。“Visual Basic 6.0 中文版學習範本”。台 北市:松崗。 [5] 吳忠達,李宗寶 (2011)。“利用K最近鄰居方法以及最佳梅爾頻率倒頻譜 係數之特徵辨識特定語者之中文單音”。碩 士論文,國立中興大學統計學 研究所,台中。 [6] 陳首鳴,李宗寶 (2009)。“利用權重式Multiple Common Vector於中 字彙之特定語者中文單音辨識”。碩 士論文,國立中興大學應用數學研究 所,台中。 [7] 陳宛余,李宗寶 (2011)。“探討梅爾頻率倒頻譜係數之特徵擷取對國語子 音之影響”。碩 士論文,國立中興大學統計學研究所,台中。 [8] 劉紋惠,李宗寶 (2004)。“利用Viterbi演算法於MFCC特徵之國語數字辨 識”。碩 士論文,國立中興大學應用數學研究所,台中。 [9] 歐陽杰璋,李宗寶 (2010)。“利用音框移動之比較法於中字彙之特定語者 中文單音辨識”。碩 士論文,國立中興大學統計學研究所,台中。 [10] 鍾靖爵,李宗寶 (2011)。“利用共同向量法以及最佳梅爾頻率倒頻譜之特 徵辨識特定語者之中文單音”。碩 士論文,國立中興大學統計學研究所, 台中。 [11] 羅璟義,李宗寶 (2009)。“利用權重式共同向量法於中字彙之特定語者中 文單音辨識”。碩 士論文,國立中興大學應用數學研究所,台中。 [12] 籃元隆,李宗寶 (2009)。“利用權重式多重KNN法於中字彙之特定語者 中文單音辨識”。碩 士論文,國立中興大學應用數學研究所,台中。 [13] Gu ̈lmezog ̌lu M. B., Dzhafarov V., Keskin M., and Barkana A. (1999). “A Novel Approach to Isolated Word Recognition”, IEEE Trans. On Speech and Audio Processing, Vol. 7, No 6, pp. 620-628. [14] Gu ̈lmezog ̌lu M. B., Dzhafarov V., and Barkana A. (2001). “The Common Vector Approach and Its Relation to Principal Component Analysis”, IEEE Trans. On Speech and Audio Processing, Vol. 9, No 6, pp. 655-662.
摘要: 
本篇論文主要探討1391個國語單字的特定語者單音辨識,利用梅爾頻率倒頻譜係數求取語音特徵值,並以共同向量法建構其語音模型進行辨識比對。本論文考慮影響辨識率的實驗因子有『特徵值維度』、『音框擺盪數』、『音框取樣點數』等三種,透過不同的辨識參數所得之辨識結果,找出在何種參數設定下能有較佳的辨識效果。本次實驗最佳平均辨識率為95.69%。

The aim of this paper is to discuss the 1391 mandarin consonant word recognition. The feature of Mel-frequency cepstrum coefficient(Mfcc) and method of common vector are used for the recognition. Three experimental factors in paper we considered
in this paper; That is “dimension of speech feature”, “the swing of frame” and “the length of frame”. The optimal parameter set is found to get the highest recognition rate. Among the averaged recognition rate, the best one in this experiment is 95.69%.
URI: http://hdl.handle.net/11455/18715
其他識別: U0005-0207201213171800
Appears in Collections:統計學研究所

Show full item record
 

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.