Please use this identifier to cite or link to this item: http://hdl.handle.net/11455/19685
標題: 利用粗糙集理論解決中文轉台語文轉音系統中一詞多音問題
Applying Rough Set Theory in Solving the Polysemy Problem in a Chinese to Taiwanese TTS System
作者: 廖振淵
Liao, Jhen-Yuan
關鍵字: word with variant pronunciations
一詞多音
Taiwanese text-to-speech
Rough Sets Theory
台語文轉音
粗糙集
出版社: 資訊科學與工程學系所
引用: [1] Z. Pawlak, ”Rough Sets”, International Journal of Computer and Information Science,Vol. 11,No. 5, pp. 341-356,1982. [2] Z. Pawlak, ”Rough Sets and Intelligent Data Analysis”, Information Science, Vol. 147, pp.1-12 ,2002. [3] Frederick Jelinek , “Statistical Methods for Speech Recognition”,The MIT Press, Cambridge Massachusetts,1997. [4] Ian Witten,Eibe Frank,”Data Mining practical machine learning tools and techniques with JAVA implementations ”,Morgan Kaufmann publishers,1999. [5] Jiawei Han and Micheline Kamber,”Data Mining Concepts and Techniques”, Morgan Kaufmann publishers,1999. [6] Weka 3, http://www.cs.waikato.ac.nz/ml/weka/。 [7] Yih-Jeng Lin, Ming-Shing Yu, and Chiung-Jung Huang,“The Polysemy Problems, an Important Issue in a Chinese to Taiwanese TTS System”, the IEEE Proceedings of the International Congress on Image and Signal Processing (CISP2008), May 27-30, Sanya, Hainan, China, 2008。 [8] Yih-Jeng Lin, Ming-Shing Yu, Chin-Yu Lin, and Yuan-Tsun Lin, ” A Multi-Layered Approach to the Polysemy Problems in a Chinese to Taiwanese TTS System”, The IEEE International Conference on Sensor Networks, Ubiquitous, and Trustworthy Computing, SUTC 2008,June 11-13, 2008 Taichung, Taiwan﹒ [9] 游子宜,“台灣閩南語一字多音之研究上、下篇”,1997。 [10] 林日祥、林宏基,“台語破音多音詞彙”,2004。 [11] 教育部一字多音審訂表 http://www.edu.tw/EDU_WEB/EDU_MGT/MANDR/EDU6300001/allbook/kyjd/c15.htm?open [12] 中研院中文斷詞系統 http://ckipsvr.iis.sinica.edu.tw/。 [13] 中央研究院平衡語料庫,http://www.sinica.edu.tw/ftms-bin/kiwi1/mkiwi.sh。 [14] 張子榮、 初敏,“解決多音詞字-音轉換的一種統計學習方法”, 中文信習學報, 2002, 第3期, pp.39-45. [15] 蔡文鴻,“語言模型訓練與調適技術於中文大詞彙連續語音辨識之初步研究”,國立臺灣師範大學資訊工程研究所碩士論文,2005。 [16] 李啓鑫,“資料探勘與統計技術的自由軟體整合介面”,淡江大學統計學所,2004。 [17] 教育部詞類標記 簡化詞類-to-精簡詞類, http://ckipsvr.iis.sinica.edu.tw/cat.htm [18] 林金玉,“中文轉台語文轉音系統中一詞多音之預測”,國立中興大學資訊科 學與工程學系研究所碩士論文,2008。 [19] 莊宜娟,“應用約略集合理論預測銀行授信顧客倒閉機率”,南台科技大學國際企業學系研究所碩士論文,2005。 [20] 黃俊霖,“應用約略集理論與模糊理論於臺股指數期貨漲跌幅之預測”,國立台灣科技大學資訊管理學系研究所碩士論文,2004。 [21] 李昆鴻,“醫學影像之診斷-應用粗集合理論與類神經網路”,東海大學工業工程學系研究所碩士論文,2002。 [22] 張文俊,“利用約略集合理論作供應商的分類與選擇”,國立成功大學工業與資訊管理學系研究所碩士論文,2005。
摘要: 在文轉音系統中,一詞多音一直都是文句分析處理的重要工作之一。不管中文或是台語甚至客語都有這種問題。其中以台語的一詞多音的問題較為嚴重,導致處理中文轉台語文轉音系統(Chinese to Taiwanese TTS system)的合成品質一直無法大大的提升。因此,對於一個中文轉台語文轉音系統而言,將每個字或詞的正確台語音找出,應當是重要的課題之一。 本研究的目標是希望透過粗糙集(Rough Set)此分類演算法進行訓練與預測,希望能夠解決台語中的一詞多音現象。實驗有效結果顯示出粗糙集合理論可以改善台語一詞多音問題。
In a Chinese to Taiwanese Text-to-Speech(TTS) system, the problem of words with polysemy is one of the important topics. The languages Chinese, Taiwanese, and Hkka all have this problem in common. The polysemy problem in Taiwanese is especially important. If it was not properly solved, the synthesis quality cannot be improved significantly a the Chinese to Taiwanese TTS system. So, in a Chinese to Taiwanese TTS system, to find out the correct Taiwanese pronunciation is an important task. We hope that the polysemy problem in Taiwanese can be solved by using the Rough Set Theory, and its related classification algorithm to train and predict the correct pronunciation. The results of our experiments show that Rough Set Theory can improve the prediction of pronunciations of some words in solving Taiwanese polysemy problem.
URI: http://hdl.handle.net/11455/19685
其他識別: U0005-1308201017073800
文章連結: http://www.airitilibrary.com/Publication/alDetailedMesh1?DocID=U0005-1308201017073800
Appears in Collections:資訊科學與工程學系所

文件中的檔案:

取得全文請前往華藝線上圖書館



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.