Please use this identifier to cite or link to this item: http://hdl.handle.net/11455/18732
標題: 利用K最近鄰居方法以及最佳梅爾頻率倒頻譜係數之特徵辨識特定語者之中文單音
Using K-Nearest Neighbor Method and the Optimal Mel-Frequency Cepstrum Coefficient Feature to Recognize Isolated Mandarin Word for Speaker-Dependent System
作者: 吳忠達
Wu, Jhong-Da
關鍵字: Mel-frequency cepstrum coefficient;梅爾頻率倒頻譜;k-nearset neighbor;K最近鄰居法
出版社: 統計學研究所
引用: [1]. Loizou, P. C. and Spanias, A. S. (1996). “High-Performance Alphabet Recognition”, IEEE Trans. On Speech and Audio Processing, Vol. 4, No. 6, pp. 430–445. [2]. 王小川 (2004)。“語音訊號處理”。台北市:全華。 [3]. 王國榮 (2000)。“Visual Basic 6.0 實戰講座”。台北巿:旗標。 [4]. 李蕙珺,李宗寶 (2009)。“利用權重式第K位最鄰近方法於中字彙之特定語者中文單音辨識”。碩士論文,國立中興大學應用數學研究所,台中。 [5]. 張國清,李宗寶 (2005)。“用K-means之動態時間軸校正法於國語數字之語音辨識”。碩士論文,國立中興大學應用數學研究所,台中。 [6]. 黃世陽,吳明哲,何嘉益,張志成,吳志忠,曹祖聖 (2008)。“Visual Basic 6.0中文版學習範本”。台北市:松崗。 [7]. 劉紋惠,李宗寶 (2004)。“利用Viterbi演算法於MFCC特徵之國語數字辨識”。碩士論文,國立中興大學應用數學研究所,台中。 [8]. 歐陽杰璋,李宗寶 (2010)。“利用音框移動之比較法於中字彙之特定語者中文單音辨識”。碩士論文,國立中興大學統計學研究所,台中。 [9]. 羅璟義,李宗寶 (2009)。“利用權重式共同向量法於中字彙之特定語者中文單音辨識”。碩士論文,國立中興大學應用數學研究所,台中。 [10]. 籃元隆,李宗寶 (2009)。“利用權重式多重KNN法於中字彙之特定語者中文單音辨識”。碩士論文,國立中興大學應用數學研究所,台中。
摘要: 
本篇論文主要是探討337個國字單音的特定語者辨識系統,所使用的特徵值為梅爾頻率倒頻譜係數(Mel-frequency cepstrum coefficient, Mfcc),辨識方法為K最近鄰居法(k-nearest neighbor, knn),試想找出最佳的Mfcc參數及knn方法使其有高辨識率的表現,實驗中考慮到影響辨識率的實驗因子有「音框取樣長度」、「子音終點加長長度」、「權重」、「子音擷取音框數」、「特徵值擷取維度」及「擺盪比對音框數」。最後實驗的結果,我們發現資料庫的平均辨識率最高可達91.5%。

This paper is mainly to discuss the speech recognition of 337 isolation mandarin words for speaker dependent. The feature is Mel-frequency cepstrum coefficient(Mfcc), and the method is k-nearest neighbor(knn), for the recognition, we try to find out the optimal parameters to obtain high performance recognition. Six experimental factors(the length of frame, the dimension of Mfcc, the number of frame, the weight of consonant and vowel, the swing of frame and the duration of consonant) we considered in the work. We find that the best average rate of recognition in database attains 91.5%.
URI: http://hdl.handle.net/11455/18732
其他識別: U0005-2306201112263000
Appears in Collections:統計學研究所

Show full item record
 

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.