一個XML文件通常包含文件頭和文件體兩大部分
1. 文件頭
XML文件頭由XML聲明與DTD文件類型聲明組成。其中DTD文件類型聲明是可以缺少的,關于DTD聲明將在后續的內容中介紹,而XML聲明是必須要有的,以使文件符合XML的標準規格。
在前面的Flowers.xml文件中的第一行代碼即為XML聲明:
<?xml version="1.0" encoding="gb2312"?>
其中:
“<?”代表一條指令的開始,“?>”代表一條指令的結束;
“xml”代表此文件是XML文件;
“ version="1.0" ”代表此文件用的是XML1.0標準;
“ encoding="gb2312" ” 代表此文件所用的字符集,默認值為Unicode,如果該文件中要用到中文,就必須將此值設定為gb2312。
注意:XML聲明必須出現在文檔的第一行。
2. 文件體
文件體中包含的是XML文件的內容,XML元素是XML文件內容的基本單元。從語法講,一個元素包含一個起始標記、一個結束標記以及標記之間的數據內容。
XML元素與HTML元素的格式基本相同,其格式如下:
<標記名稱 屬性名1="屬性值1" 屬性名1="屬性值1" ……>內容</標記名稱>
所有的數據內容都必須在某個標記的開始和結束標記內,而每個標記又必須包含在另一個標記的開始與結束標記內,形成嵌套式的分布,只有最外層的標記不必被其他的標記所包含。最外層的是根元素(Root),又稱文件(Document)元素,所有的元素都包含在根元素內。
在前面的Flowers.xml文件中,根元素就是<Flowers>,根元素必須而且只能有一個,在該文件有三個<Flower>子元素,這樣的元素可以有多個。
1. 注釋
XML的注釋與HTML的注釋相同,以“<!--”開始,以“-->”結束。
2. 區分大小寫
在HTML中是不區分大小寫的,而XML區分大小寫,包括標記,屬性,指令等。
3. 標記
XML標記與HTML標記相同,“<”表示一個標記的開始,“>” 表示一個標記的結束。XML中只要有起始標記,就必須有結束標記,而且在使用嵌套結構時,標記之間不能交叉。
在XML中不含任何內容的標記叫做空標記,格式為:<標記名稱/>
4. 屬性
XML屬性的使用與HTML屬性基本相同,但需要注意的是屬性值要加雙引號。
5. 實體引用
實體引用是指分析文檔時會被字符數據取代的元素,實體引用用于XML文檔中的特殊字符,否則這些字符會被解釋為元素的組成部分。例如,如果要顯示“<”,需要使用實體引用“<”否則會被解釋為一個標記的起始。
XML中有5個預定義的實體引用,如表 4.1所示。
表 4.1 XML預定義的實體引用
< | < |
> | > |
" | " |
' | ' |
& | & |
6. CDATA
在XML中由一個特殊的標記CDATA,在CDATA中所有文本都不會被XML處理器解釋,直接顯示在瀏覽器中,使用方法如下:
<![CDATA[
這里的內容可以直接顯示。
]]>
7. 處理指令
處理指令使用來給處理XML文件的應用程序提供信息的,處理指令的格式如下:
<?處理指令名稱 處理指令信息?>
例如,XML聲明就是一條處理指令:
<?xml version="1.0" encoding="gb2312"?>
其中,“xml”是處理指令名稱,version="1.0" encoding="gb2312"是處理指令信息。
新聞熱點
疑難解答