Please use this identifier to cite or link to this item: http://hdl.handle.net/11455/19541
DC FieldValueLanguage
dc.contributor吳宗憲zh_TW
dc.contributor江永進zh_TW
dc.contributor古鴻炎zh_TW
dc.contributor.advisor余明興zh_TW
dc.contributor.author林金玉zh_TW
dc.contributor.authorLin, Chin-Yuen_US
dc.contributor.other中興大學zh_TW
dc.date2009zh_TW
dc.date.accessioned2014-06-06T07:06:59Z-
dc.date.available2014-06-06T07:06:59Z-
dc.identifierU0005-1808200812320900zh_TW
dc.identifier.citation[1] Frederick Jelinek , “Statistical Methods for Speech Recognition”,The MIT Press Cambridge Massachusetts,1997. [2] Ian Witten,Eibe Frank,”Data Mining practical machine learning tools and techniques with JAVA implementations ”,Morgan Kaufmann publishers,1999. [3] Jiawei Han,Micheline Kamber,”Data Mining Concepts and Techniques”, Morgan Kaufmann publishers,1999. [4] Weka 3, http://www.cs.waikato.ac.nz/ml/weka/。 [5] Yih-Jeng Lin, Ming-Shing Yu, and Chiung-Jung Huang,“The Polysemy Problems, an Important Issue in a Chinese to Taiwanese TTS System”,the IEEE proceedings of the International Congress on Image and Signal Processing (CISP2008), May 27-30, Sanya, Hainan, China, 2008。 [6] Yih-Jeng Lin, Ming-Shing Yu, Chin-Yu Lin, and Yuan-Tsun Lin,” A Multi-Layered Approach to the Polysemy Problems in a Chinese to Taiwanese TTS System” The IEEE International Conference on Sensor Networks, Ubiquitous, and Trustworthy Computing, SUTC 2008,June 11-13, 2008 Taichung, Taiwan。 [7] 游子宜,“台灣閩南語一字多音之研究上、下篇”,1997。 [8] 林日祥、林宏基,“台語破音多音詞彙”,2004。 [9] 林元淳,“中文文轉音系統中一詞多音之研究“,中興大學資訊科學研究所碩士論文,2005。 [10] 中研院中文斷詞系統 http://ckipsvr.iis.sinica.edu.tw/。 [11] 中央研究院平衡語料庫,ttp://www.sinica.edu.tw/ftms-bin/kiwi1/mkiwi.sh。 [12] 張子榮、 初敏, “解決多音詞字-音轉換的一種統計學習方法”, 中文信習學報, 2002, 第3期, pp.39-45. [13] 蔡文鴻, “語言模型訓練與調適技術於中文大詞彙連續語音辨識之初步研究”,國立臺灣師範大學資訊工程研究所碩士論文,2005。 [14] 李啓鑫, “資料探勘與統計技術的自由軟體整合介面”,淡江大學統計學所, 2004。 [15] 林震岩, “多變量分析SPSS的操作與應用”,智勝出版社,2007。 [16] 張大平、張一岑,“SPSS統計建模與分析程序”,文魁出版社,2007。zh_TW
dc.identifier.urihttp://hdl.handle.net/11455/19541-
dc.description.abstract一個中文轉台語文轉音系統可以將一連串的中文文字(句子)轉換成台語語音輸出。相對於中文的多音詞現象,台語的一詞多音問題更是嚴重,一詞多音現象會直接影響到輸出的台語文句之瞭解度(Intelligibility)。本研究針對中文轉台語文轉音系統中,一詞多音現象作探討,並利用語言模型、決策樹及貝式分類器來預測中文文句轉台語文句中,詞的正確台語發音。 本研究的目標是希望能夠針對中文文句轉台語文句中所有的一詞多音都能有正確的發音,並且提出一種組合式策略技術結合了語言模型及決策樹並搭配門檻值的設定,實驗的結果大部分都有提昇語言模型、決策樹的正確率,並可以套入現有的TTS系統中使用。zh_TW
dc.description.abstractA Chinese to Taiwanese text to speech system (TTS) is a system that can output Taiwanese speech with some input Chinese text. Compared with Mandarin, the polyphone problems in Taiwanese is more complex than that in Mandarin. We call it is the polysemy problem in Taiwanese. We think it is an intent work should be done in a Taiwanese TTS system. This research focuses on the polysemy problems in a Chinese to Taiwanese TTS system. We use language models, decision trees and Bayes classifier to predict the correct pronunciation for words with polyesmy problem in Taiwanese. The main works we done is to predict the correct pronunciation for words with polyesmy problem in Taiwanese. We make good use of the abovementioned three methods. Results show that the combined approaches can achieve higher accuracies in predicting pronunciations of each word with polysemy problems.en_US
dc.description.tableofcontents第一章 緒論 1 1.1 研究動機及方向 1 1.2 台語文轉音系統之架構 1 1.3 台語文轉音系統架構 2 1.4 論文架構 5 第二章 台語一詞多音的現象 6 2.1 台語一詞多音現象 6 2.2 台語一詞多音特徵抽取 9 第三章 研究方法 11 3.1 語言模型(Word-base Uni-gram Language Model, WU) 11 3.2 決策樹 12 3.2.1 卡方自動互動檢視法 (CHAID) 14 3.2.2 C4.5 15 3.3 貝式分類 16 3.4 使用工具介紹 17 3.4.1 Weka 3.4 17 3.4.2 SPSS 17 第四章 實驗結果 18 4.1 語料的準備 18 4.2 語言模型實驗結果 24 4.3 CHAID實驗結果 28 4.4 C4.5實驗結果 32 4.5 貝式分類實驗結果 36 第五章 實驗比較及改進 40 5.1 一詞多音各實驗方法結果比較 40 5.2 組合式策略 41 5.2.1 設定門檻值 41 5.3. 外部測試 47 5.4 實驗比較 52 第六章 結論與未來方向 53 參考文獻 54 附錄一 標音工具介紹 56 附錄二 已發表論文 57zh_TW
dc.language.isoen_USzh_TW
dc.publisher資訊科學與工程學系所zh_TW
dc.relation.urihttp://www.airitilibrary.com/Publication/alDetailedMesh1?DocID=U0005-1808200812320900en_US
dc.subjectpolysemyen_US
dc.subject一詞多音zh_TW
dc.subjectChinese to Taiwanese TTS systemen_US
dc.subjectlanguage modelen_US
dc.subjectdecision tree and combined strategyen_US
dc.subject台語文轉音zh_TW
dc.subject語言模型zh_TW
dc.subject決策樹zh_TW
dc.subject組合式策略技術zh_TW
dc.title中文轉台語文轉音系統中一詞多音之預測zh_TW
dc.titleSolving the Polysemy Problem in a Chinese to Taiwanese TTS Systemen_US
dc.typeThesis and Dissertationzh_TW
Appears in Collections:資訊科學與工程學系所
文件中的檔案:

取得全文請前往華藝線上圖書館



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.