文簡要描述了dom的概念和內部邏輯結構,實例講述dom文檔操作和xml文件互相轉換的java實現過程。
1. dom簡介
目前,w3c已于2000年11月13日推出了規范dom level 2。文檔對象模型(dom)是html和xml文檔的編程接口規范,它與平臺和語言是無關的,因而可以用各種語言在各種平臺上實現。該模型定義了thml和xml文件在內存中的邏輯結構(即為文檔),提供了訪問、存取thml和xml文件的方法。利用dom規范,可以實現dom 文檔和xml之間的相互轉換,遍歷、操作相應dom文檔的內容??梢哉f,要自由的操縱xml文件,就要用到dom規范。
2. dom內部邏輯結構
dom文檔中的邏輯結構可以用節點樹的形式進行表述。通過對xml文件的解析處理,xml文件中的元素便轉化為dom文檔中的節點對象。dom的文檔節點有document、element、comment、type等等節點類型,其中每一個dom文檔必須有一個document節點,并且為節點樹的根節點。它可以有子節點,或者葉子節點如text節點、comment節點等。任何的格式良好的xml文件中的每一個元素均有dom文檔中的一個節點類型與之對應。利用dom接口將xml文件轉化成dom文檔后,我們就可以自由的處理xml文件了。
3. java中的dom接口
dom規范提供的api的規范,目前sun公司推出的jdk1.4測試版中的java api遵循了 dom level 2 core推薦接口的語義說明,提供了相應的java語言的實現。
在org.xml.dom中,jkd1.4提供了document、documenttype、node、nodelist、element、text等接口,這些接口均是訪問dom文檔所必須的。我們可以利用這些接口創建、遍歷、修改dom文檔。
在javax.xml.parsers中,jkd1.4提供的doumentbuilder和documentbuilderfactory組合可以對xml文件進行解析,轉換成dom文檔。
在javax.xml.transform.dom和javax.xml.transform.stream中,jdk1.4提供了domsource類和streamsource類,可以用來將更新后的dom文檔寫入生成的xml文件中。
4. 例程
4.1 將xml文件轉化成dom文檔
這個過程是獲得一個xml文件解析器,解析xml文件轉化成dom文檔的過程。
jdk1.4中,document接口描述了對應于整個xml文件的文檔樹,提供了對文檔數據的訪問,是該步驟的目標。document接口可以從類documentbuilder中獲取,該類包含了從xml文檔獲得dom文檔實例的api。xml的解析器可以從類documentbuilderfactory中獲取。在jdk1.4中,xml文件轉化成dom文檔可以有如下代碼實現:
//獲得一個xml文件的解析器
documentbuilderfactory factory = documentbuilderfactory.newinstance();
//解析xml文件生成dom文檔的接口類,以便訪問dom。
documentbuilder builder = factory.newdocumentbuilder();
document = builder.parse( new file(filename) );
4.2 遍歷dom文檔
獲得接口類document實例后,可以對dom的文檔樹進行訪問。要遍歷dom文檔,首先要獲得root元素。然后獲得root元素的子節點列表。這里通過遞歸的方法實現遍歷的目的。
//獲得root元素
element element = document.getdocumentelement();
//獲得root元素的子節點列表
nodelist = element.getchildnodes();
//用遞歸方法實現dom文檔的遍歷
getelement(nodelist);
其中getelement方法實現如下:
|
注意:上面的代碼只是顯示node類型和text類型的對象。它們的類型標識分別是1和3。
4.3 修改dom文檔
修改dom文檔的api在dom level 2 core規范中做了說明,jkd1.4中的org.xml.dom中實現了這些api。修改dom文檔操作主要集中在document、element、node、text等類中,這里給出的例子中是在解析出的dom文檔中增加一系列對象,對應與在xml文件中增加一條記錄。
// 獲得root對象
element root = document.getdocumentelement();
// 在dom文檔中增加一個element節點
element booktype = document.createelement("computes");
//將該節點轉化成root對象的子節點
root.appendchild(cdrom);
//在dom文檔中增加一個element節點
element booktitle = document.createelement("title");
//將該節點轉化成booktype對象的子節點
booktype.appendchild(booktitle);
//在dom文檔中增加一個text節點
text bookname = document.createtextnode("understand corba");
//將該節點轉化成bookname對象的子節點
booktitle.appendchild(bookname);
4.4 將dom文檔轉化成xml文件
// 獲得將dom文檔轉化為xml文件的轉換器,在jdk1.4中,有類transformerfactory
// 來實現,類transformer實現轉化api。
transformerfactory tfactory = transformerfactory.newinstance();
transformer transformer = tfactory.newtransformer();
// 將dom對象轉化為domsource類對象,該對象表現為轉化成別的表達形式的信息容器。
domsource source = new domsource(document);
/* 獲得一個streamresult類對象,該對象是dom文檔轉化成的其他形式的文檔的容器,
可以是xml文件,文本文件,html文件。這里為一個xml文件。*/
streamresult result = new streamresult(new file(“text.xml”));
// 調用api,將dom文檔轉化成xml文件。
transformer.transform(source,result);
這里提供了該例程的完整程序,該例程在windows 2000中jdk1.4環境中運行通過。
以上給出了一個例子,讀者可以從中了解到對dom操作的思路。因為對dom的操作均遵循了dom規范,所以也適用于其它語言對dom的處理。
新聞熱點
疑難解答