Please use this identifier to cite or link to this item: http://hdl.handle.net/11455/4947
標題: 以資料採礦方法探討台灣地區機車污染排放特性
作者: 葉家麟
Yeh, Char-Lin
關鍵字: data mining;資料採礦;knowledge discovery in databases;KDD;association rule;motor emission;emission characteristics;資料挖掘;關聯法則;機車定檢資料庫;移動源;機車排放;排放特性
出版社: 環境工程學系
摘要: 
本研究應用資訊科學領域的資料採礦技術(data mining)中的─關聯法則搜尋技術,對機車定檢資料庫(由工研院機械所維護)做知識發掘(knowledge discovery)的工作。關於機車排放特性的研究,國內基本研究方面所獲得的資訊已相當充裕,使用資料採礦技術所得到的結論不僅可以與以往的研究結果做驗證,亦可以從另外一個角度剖析機車排放特性。本研究目的在於:探討資料採礦技術應用於紀錄性資料的可行性、找尋出以往的分析方法所無法發現的資料特性。
資料採礦技術尚在發展中,且應用範圍廣,本研究僅使用其中的關聯法則搜尋技術對機車定檢資料作研究。研究進行的程序依序如下:1.資料純化與整理:修正資料錯誤之處,並刪去無用的部分,整理出可用於資料採礦的部分。2.數值資料分級:部分連續性的數值資料無法直接應用於資料採礦技術,需要加以分級。3.搜尋高頻項目:為減少資料採礦工作量並減少產生過多無用的關聯法則,以Apriori演算法先產生高頻項目。4.產生關聯法則:以產生出的高頻項目排列組合出關聯法則。5.關聯法則評估與探討:計算各個關聯法則的信賴度(confidence),並配合支持度(support)評估關聯法則的強弱,並探討關聯法則於實際應用上所代表的意義。
研究結果顯示,所得到的關聯法則相當多,且與前處理步驟,處理程序設定的門檻值有相當重要的關係。其中,「連續資料分級」與「如何設定門檻值」可為一相當重要的課題,需要進一步的研究。關於排放特性方面,研究結果顯示,具有下列三個特性的機車,幾乎就是低污染的代名詞:「cc:90~125」、「四行程」、「車齡2~4年」。此外,也出現了較為奇特的關聯法則:「co:4~6 à 二行程」有81%的信賴度,「hc:6k~9k à 二行程」也有高達97%的信賴度,此兩者目前較難以常理解釋,尚待進一步的研究分析。得到最強勢的關聯法則為「二行程ßàcc<=50」與「四行程ßà90
URI: http://hdl.handle.net/11455/4947
Appears in Collections:環境工程學系所

Show full item record
 
TAIR Related Article

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.