Please use this identifier to cite or link to this item: http://hdl.handle.net/11455/19474
標題: 一個XML檔上的節省空間索引方法
SEIM: A Space-Efficient Indexing Method for XML Documents
作者: 張嫄萱
Chang, Yuan-Hsuan
關鍵字: 索引方法
XML
Index
B-tree
Space-efficient Indexing method
XQuery
XPath
出版社: 資訊科學系所
引用: 參考文獻 1. 中文部份 (1). 圖書 [1] 位元文化,“XML技術實務”,文魁出版社,2003。 (2). 期刊論文 [2] 吳慶順,“有效處理支脈配對在可擴展標記語言資料上的索引”,國立清華大學,碩士論文,2005。 (3). 網路資源 [3] http://www.xml.org.tw/function/Fresource1.asp?INO=10&CNO=1 。 2. 西文部份 (1). Books [4] XML How to Program, Deitel, Deitel, Nieto, Lin & Dadhu, Prentice-Hall, 2001. (2). Journal and Conference Articles [5] Jaideep Roy and Anupama Ramanujan, “XML: data’s universal language,” IT Professional, Volume 2, Issue 3, May-June 2000, pp.32-36. [6] A. Zisman. “An overview of XML,” Computing and Control Engin. J., Volume 11, Aug. 2000, pp.165-167. [7] Z. Chen, H. V. Jagadish, L.V. S. Lakshmanan, and S. Paparizos, “From Tree Patterns to Generalized Tree Patterns: On Efficient Evaluation of XQuery,” in Proc. of VLDB, Germany, Sept., 2003, pp.237–248. [8] S. Guha, H.V. Jagadish, N. Koudas, D. Srivastava, and T. Yu, “Approximate XML Joins, ” in Proc. of ACM SIGMOD, Wisconsin, June 4-6, 2002, pp. 287-298. [9] A. Halverson, J. Burger, L. Galanis, A. Kini, R.Krishnamurthy, A. H. Rao, F. Tian, S. D. Viglas, Y. Wang, J.F. Naughton, and D. DeWitt, “Mixed Mode XML Query Processing, ” in Proc. of VLDB, 2003, pp.225-236. [10] Q. Li and B. Moon, “Indexing and Querying XML Data for Regular Path Expressions,” in Proc. of VLDB, Roma, Italy, Sept. 11-14, 2001, pp. 361-370. [11] N. Bruno, N. Koudas, and D. Srivastava, “Holistic Twig Joins: Optimal XML Pattern Matching,” in Proc. of ACM SIGMOD, Wisconsin, June 4-6, 2002, pp. 310-321. [12] H. Jiang, H. Lu, W. Wang, and B. C. Ooi, “XR-tree: Indexing XML Data for Efficient Structural Joins,” in Proc. of IEEE ICDE, 2003, pp. 253-264. [13] Simon Sheu and Nigel Wu, “XCut: Indexing XML Data for Efficient Twig Evaluation,” in Proc. of ICDE, 2006, pp.127. [14] C. Zhang, J. F. Naughton, D. J. DeWitt, Q. Luo, and G. M. Lohman, “On Supporting Containment Queries in Relational Database Management Systems,” in Proc. of SIGMOD, 2001, pp. 425-436. [15] S.-Y. Chien, Z. Vagena, D. Zhang, V. J. Tsotras, and C. Zaniolo, “Efficient Structural Joins on Indexed XML Documents, ” in Proc. of VLDB, 2002, pp. 263-274. [16] J. Kim, S. H. Lee, and H.-J. Kim, “Efficient Structural Joins with Clustered Extents,” in Proc. Letters, Volume 91, Number 2, 2004, pp. 28-33. [17] H. Wang, S. Park, W. Fan, and P. S. Yu, “ViST: A Dynamic Index Method for Quering XML Data by Tree Structures,” in Proc. SIGMOD, 2003, pp. 110–121. [18] P. Rao and B. Moon, “PRIX: Indexing and Querying XML Using Pr
摘要: 由於XML具有資料格式交換的特性存在,伴隨著網際網路傳遞資料愈來愈普遍的情況底下,即時處理的XML資料量急劇增加。在XML查詢的歷程中,包括以XQuery、XPath來進行查詢之外,目前相關的研究已經朝向建立XML索引所取代。由於目前XML索引的相關研究主要著重於,如何加快查詢的速度。甚至於許多的研究更鑽研在如何增進分支的查詢速度,忽略了空間運用方面的問題。然而,許多嵌入式的3C電子產品,卻隨著科技的演進與生活的便利性,充斥在我們的生活週遭。 本研究有別於傳統以加快查詢速度為主的索引機制,提出一個可以有效壓縮XML檔的索引架構,提供使用者進行多元化的查詢。在研究Wang /Meng method[19]提出的索引架構中,由於缺乏考量節點重覆性的問題,當大量的XML檔轉換出來的字串(sequence)重覆性低的情況下,容易造成索引連結過多,產生大量的空間連結。因此,本研究考量節點重覆性的問題,提出以節點儲存字串的編碼數值,將數值集中儲存以減少大量的連結空間產生。 本研究提出一個可以有效壓縮XML檔的索引方式,提供使用者進行選擇性節點的查詢與parent – child (PC) 與ancestor-descendant (AD) 的查詢。主要基於B-tree建立一個適用於XML資料結構的索引機制,在編碼方面可以避免false hits的問題產生。在實驗的效能評估方面,本研究在索引的空間佔空間大小約為原本XML檔的百分之三十;在查詢的效能方面,也較傳統的XSLT方式快速。相關應用方面,本研究的實驗環境以SAX的方式進行剖析(parser)與驗證,符合XML stream即時(real-time)的特性;因此,本研究可以應用於類似於影像串流等環境底下,以及適用於低運算或是有限空間的硬體平臺使用。
URI: http://hdl.handle.net/11455/19474
其他識別: U0005-2707200721002800
文章連結: http://www.airitilibrary.com/Publication/alDetailedMesh1?DocID=U0005-2707200721002800
Appears in Collections:資訊科學與工程學系所

文件中的檔案:

取得全文請前往華藝線上圖書館



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.