Please use this identifier to cite or link to this item: http://hdl.handle.net/11455/19787
標題: 以資料探勘之技術解決線上客語語音合成系統中多音字發音歧義之研究
A Research on Resolving Pronunciation Ambiguity of Polyphonic Characters by using Data Mining Techniques in an On-Line Hakka Text-to-Speech System
作者: 羅丞邑
Luo, Cheng-Yi
關鍵字: Hakka
客語
Polyphonic characters
Text-to-speech
多音字
語音合成系統
詞義辨識
出版社: 資訊網路多媒體研究所
引用: 1. 鍾榮富,“台灣客家語音導論”,五南圖書出版股份有限公司,2004。 2. 龔萬灶,“客話實用手冊”,龔萬灶,2007。 3. “客語能力認證基本詞彙–初級(四縣腔)”,行政院客家委員會,2009。 4. “客語能力認證基本詞彙–中高級(四縣腔)”,行政院客家委員會,2009。 5. 客語能力認證基本詞彙–初級(海陸腔)”,行政院客家委員會,2009。 6. 林東逸,“客語文句翻語音系統之實作”,交通大學電信工程學系碩士論文,2006。 7. 吳俊毅,“線上客語語音合成系統中產生韻律訊息之研究”,中興大學資訊科學與工程學系研究所碩士論文,2010。 8. 黃豐隆,“線上國客雙語有聲詞典建置之研究”,全國計算機會議(NCS-2009),台北,台灣,2009。 9. 黃豐隆,“線上語音合成系統之研製與應用,”全國電信研討會 (NST-2008),雲林,台灣, 2008。 10. 潘能煌,“中文文轉音系統的韻律預估及其改進”,國立中興大學應用數學系博士論文, 2004。 11. 蔡育和,“中文文轉音系統中韻律階層的求取”,中興大學資訊科學學系碩士論文,2005。 12. 林金玉, “中文轉台語文轉音系統中一詞多音之預測”, 國立中興大學資訊科學與工程學系研究所碩士論文, 2008。 13. 台文/華文線頂辭典http://203.64.42.21/iug/Ungian/soannteng/chil/Taihoa.asp 14. 行政院客委會 客語能力認證網站http://api1.game.hakka.gov.tw/hkaword.php 15. 臺灣客家語拼音方案http://www.edu.tw/mandr/bulletin.aspx?bulletin_sn=3824 16. 臺灣客家語常用詞詞典網路版 http://hakka.dict.edu.tw/ 17. 臺灣話語音漢字辭典及外語辭典http://www.edutech.org.tw/DICT/All-Dictionaries.htm 18. 聯合大學線上國客語有聲詞典http://203.64.183.226/public2/hakka-edu/hakka-index.htm 19. 賴亦傑,“應用多詞及多詞性語言模型的中文斷詞及詞性標記方法”,中興大學資訊科學與工程學系碩士論文,2011。 20. 張子榮、 初敏, “解決多音詞字-音轉換的一種統計學習方法”, 中文信息學報, 2002, 第3期, pp.39-45. 21. 蔡文鴻, “語言模型訓練與調適技術於中文大詞彙連續語音辨識之初步研究”,國立臺灣師範大學資訊工程研究所碩士論文,2005。 22. 廖振淵, “利用粗糙集理論解決中文轉台語文轉音系統中一詞多音問題”,中興大學資訊科學與工程學系研究所碩士論文,2010。 23. 中研院中文詞知識庫小組http://godel.iis.sinica.edu.tw/CKIP/treebank.htm 24. 李雪貞,“客語語音合成之初步研究”,台灣科技大學資訊工程系研究所碩士論文,2002。 25. 蔡昀庭,“基於隱藏式馬可夫模型之中文語音合成系統”,國立清華大學電機工程研究所碩士論文,2007。 26. 高瑜璟,“數位學習-學習的新趨勢”,高師大資訊教育研究所。http://www.nhu.edu.tw/~society/e-j/57/57-22.htm 27. Jiawei Han and Micheline Kamber, "Data Mining Concepts and Techniques", Morgan Kaufmann publishers, 1999. 28. Min Chu, Hu Peng, Hong-yun Yang and E.Chang, " Selecting Non-Uniform Units from A Very Large Corpus for Concatenative Speech Synthesizer ", Proceedings of ICASSP 2001, IEEE, Volume 2, pp.785 - 788, Salt Lake City. 29. Classification and Regression Trees (C&RT),http://www.statsoft.com/textbook/classification-and-regression-trees/ 30. Quinlan, J. R. C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, 1993. 31. Frederick Jelinek, "Statistical Methods for Speech Recognition " ,The MIT Press, Cambridge Massachusetts, 1997. 32. Corinna Cortes and V. Vapnik, "Support-Vector Networks", Machine Learning, 20, 1995. http://www.springerlink.com/content/k238jx04hm87j80g/ 33. David Graff and Ke Chen “Chinese Gigaword”, Linguistic Data Consortium (LDC) catalog number LDC2007T03 and isbn 1-58563-409-3. http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2007T38 34. S. Kotsiantis, "Supervised Machine Learning: A Review of Classification Techniques", Informatica Journal 31, 2007, 249-268. 35. Keh-Jiann Chen and Shing-Huan Liu, "Word Identification For Mandarin Chinese Sentences", Proceeding COLING ''92 Proceedings of the 14th conference on Computational linguistics 1992, Vol. 1, pp.101-107. 36. Andi Wu, Zixin Jiang, "Word Segmentation In Sentence Analysis", International Conference on Chinese Information Processing in Beijing China 1998, pp.169-180.
摘要: 近年來由於政府的政策,以及少數族群意識的抬頭,鄉土文化與方言教學逐漸受到重視,由於現代網際網路非常發達,因此靜態的學習資訊幾乎是隨處可得,但動態輔助學習的工具則略顯不足。因此我們著手建立客語系統,採用以詞為合成單元的架構,並在各詞間加入適當的停頓,以及對多音字的判斷,使發音結果清晰,讓人可以輕鬆聽懂。 我們的重點放在多音字的處理,從一字兩音、一字三音等,各挑選出幾個來做模型訓練。我們用決策樹分類器訓練出多音字模型,並以此預估當文句中含有不在字典中的多音字時,該多音字應發哪種音。最後把預估的結果合成語音,並進行線上的聽測實驗,結果顯示,本系統所產生的客語合成語音具有真人說話之自然與清楚的特性。
This thesis aims at the implementation for Hakka Text-to-Speech (TTS) System on Internet. Our system is composed of four components as follows: Text analysis, Mandarin to Hakka, Prosody prediction, and Speech generation module. More than 5400 monosyllabic speech units and 4063 word speech units of Hakka and several silences with various durations have been recorded as basic unit for speech synthesis. By adding breaks to Hakka sentences and finding out the pronunciation of polyphonic characters appropriately, we can provide real synthesis speech with frequent, prosodic and natural quality on Internet . We focus on solving pronunciation ambiguity of polyphonic characters, i.e., to determine which pronunciation should be chosen. We predict pronunciation by using Bayesian network classifier、 C4.5 decision tree classifier、 CART classifier, and SVM classifier. The result of our experiments show that we can handle the prediction of some words very well in our Hakka Text-to-Speech System.
URI: http://hdl.handle.net/11455/19787
其他識別: U0005-1008201117194600
文章連結: http://www.airitilibrary.com/Publication/alDetailedMesh1?DocID=U0005-1008201117194600
Appears in Collections:資訊網路與多媒體研究所

文件中的檔案:

取得全文請前往華藝線上圖書館



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.