dc.description.abstract圖書資料分類編目作業,為各級圖書館經營管理的核心,亦是最重要的基礎工作;例行性的分類編目事務,便是由館員依文意與內容主旨,決定該館藏所屬類別。但是國內的圖書館館員多半為圖書資訊領域背景,卻必須負責所有到館圖書的編目,因此常常有因為學科背景不足,造成分類困難的情形。再加上,近年各個學科領域皆有長足進步,圖書出版的數量大幅度增加,造成編目館員負擔日益沉重,除了影響新進館藏之上架時程外,更容易因為受到主觀認知差異性的影響,導致產生inter-consistency和intra-consistency一致性低落等編目品質問題。 本研究探討傳統單層式圖書分類系統的作法,並結合多種分類器的優點,提出使用投票策略之多層式圖書自動分類系統。為了探討多層式圖書分類系統的效能,分別使用兩種語料集(博碩士論文、網路書店書目)及其對應至圖書分類號的資料,作為訓練與測試語料。同時,針對博碩士論文的文件內容,探討各種內容組合對於文件特徵值擷取的影響後,找出應用於圖書自動分類之最佳內容組合。另外,針對各種分類器的組合,進一步探討多層式圖書分類器的最佳組合。最後,實驗結果證實,多層式圖書分類系統的正確率達99%,比傳統的單層式圖書分類系統,具有更佳的分類效能。zh_TW
dc.description.abstractCataloging books are the kernel and foundation of the management for the library at all levels. Most of librarians only understand the knowledge of the library information sciences, but they are responsible for bibliography of the knowledge fields. Due to lack of background knowledge the bibliography becomes more and more difficult for the librarians. Moreover, as the recent repid achievement in every knowledge field the amount of publishing increases very quickly, the bibliography load further increases. The good quality of bibliography cannot be maintained such as high inter-consistency and high intra-consistency of library classification. Thus, this paper deals with issues of traditional one layered book classification systems and employs the advantages of various classifiers to propose a two layered book classification system using voting strategy. Moreover, the collection of dissertations from National Chung Hsing University and the bibliographies of network bookstore are used as the training and test corpus. The classification codes of each dissertation are employed as the gold standard as well. Each dissertation contains various content parts such as title, authors or cited papers et al. On the one hand, to understand the classification effect of all the combinations of content parts, various combinations are studied as well and the best combination is recommended. On the other hand, to obtain the best classification performance, the combination of classifier for multi-layered book classification system is studied and the best combination is also recommended as well. Finally, the experimental results show that the performance of the proposed multi-layered book classification system outperforms the traditional one layered book classification systems.en_US
dc.description.tableofcontents摘要 i Abstract iii 目次 v 表目次 vii 圖目次 ix 第一章 緒論 1 第一節 研究背景與動機 1 第二節 研究目的與問題 3 第三節 研究範圍與限制 3 第四節 名詞解釋 7 第二章 文獻探討 11 第一節 文件表示方法 13 第二節 分類器建構方法相關研究 14 第三節 評估分類器成效之方法 21 第四節 影響分類成效之因素 23 第五節 圖書自動分類之相關研究 24 第三章 研究設計與實施 27 第一節 研究架構 27 第二節 研究對象 29 第三節 研究工具 29 第四節 分類模組流程 30 第四章 語料分析與實驗 33 第一節 先導實驗-博碩士論文資料集 33 第二節 先導實驗-少量網路書店書目資料集 43 第三節 正式實驗-網路書店書目資料 49 第四節 效用評估與討論 62 第五章 結論與未來研究方向 67 第一節 結論 67 第二節 未來研究方向 69 參考文獻 71 附錄一 中文停用字 77 附錄二 英文停用字 79 附錄三 書目資料原始樣態 83 附錄四 經中文詞斷字系統處理後之書目樣態 87 附錄五 經軟體轉換後的特徵值-內容檔範例 91 附錄六 經軟體轉換後的特徵值-二進位格式範例 97 附錄七 使用WEKA軟體進行文件自動分類步驟 101zh_TW
