通過前面三章的學(xué)習(xí),我們已經(jīng)對(duì)什么是XML,它的實(shí)現(xiàn)原理以及相關(guān)的術(shù)語有所了解。接下來我們就開始學(xué)習(xí)XML的語法規(guī)范,動(dòng)手寫自己的XML文檔。
一、XML語法規(guī)則
XML的文檔和HTML的原代碼類似,也是用標(biāo)識(shí)來標(biāo)識(shí)內(nèi)容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則:
規(guī)則1:必須有XML聲明語句
這一點(diǎn)我們?cè)谏弦徽聦W(xué)習(xí)時(shí)已經(jīng)提到過。聲明是XML文檔的第一句,其格式如下:
<?xml version="1.0" standalone="yes/no" encoding="UTF-8"?>
聲明的作用是告訴瀏覽器或者其它處理程序:這個(gè)文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認(rèn)是UTF-8。
規(guī)則2:是否有DTD文件
如果文檔是一個(gè)“有效的XML文檔”,那么文檔一定要有相應(yīng)DTD文件,并且嚴(yán)格遵守DTD文件制定的規(guī)范。DTD文件的聲明語句緊跟在XML聲明語句后面,格式如下:
<!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name">
其中:
"!DOCTYPE"是指你要定義一個(gè)DOCTYPE;
"type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同;
"SYSTEM/PUBLIC"這兩個(gè)參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網(wǎng)址,而PUBLIC則指文檔調(diào)用一個(gè)公用的DTD文件的網(wǎng)址。
"dtd-name" 就是DTD文件的網(wǎng)址和名稱。所有DTD文件的后綴名為".dtd"。
我們還是用上面的例子,應(yīng)該寫成這樣:
<?xml version="1.0" standalone="no" encode="UTF-8"?>
<!DOCTYPE filelist SYSTEM "filelist.dtd">
規(guī)則3:注意你的大小寫
在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標(biāo)識(shí)。注意在寫元素時(shí),前后標(biāo)識(shí)大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯(cuò)誤的。
你最好養(yǎng)成一種習(xí)慣,或者全部大寫,或者全部小寫,或者大寫第一個(gè)字母。這樣可以減少因?yàn)榇笮懖黄ヅ洚a(chǎn)生的文檔錯(cuò)誤。
規(guī)則4:給屬性值加引號(hào)
在HTML代碼里面,屬性值可以加引號(hào),也可以不加。例如:<font color=red>word</font>和<font color="red">word</font>都可以被瀏覽器正確解釋。
但是在XML中則規(guī)定,所有屬性值必須加引號(hào)(可以是單引號(hào),也可以是雙引號(hào)),否則將被視為錯(cuò)誤。
規(guī)則5:所有的標(biāo)識(shí)必須有相應(yīng)的結(jié)束標(biāo)識(shí)
在HTML中,標(biāo)識(shí)可能不是成對(duì)出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標(biāo)識(shí)必須成對(duì)出現(xiàn),有一個(gè)開始標(biāo)識(shí),就必須有一個(gè)結(jié)束標(biāo)識(shí)。否則將被視為錯(cuò)誤。
規(guī)則6:所有的空標(biāo)識(shí)也必須被關(guān)閉
空標(biāo)識(shí)就是標(biāo)識(shí)對(duì)之間沒有內(nèi)容的標(biāo)識(shí)。比如<br>,<img>等標(biāo)識(shí)。在XML中,規(guī)定所有的標(biāo)識(shí)必須有結(jié)束標(biāo)識(shí),針對(duì)這樣的空標(biāo)識(shí),XML中處理的方法是在原標(biāo)識(shí)最后加/,就可以了。例如:
以下為引用的內(nèi)容: <br>應(yīng)寫為<br />; <META name="keywords" content="XML, SGML, HTML">應(yīng)寫為<META name="keywords" content="XML, SGML, HTML" />; <IMG src= "cool.gif">應(yīng)寫為<IMG src= "cool.gif" /> |
二、元素的語法
元素由一對(duì)標(biāo)識(shí)以及其中的內(nèi)容組成。就象這樣:ajie。元素的名稱和標(biāo)識(shí)的名稱是一樣的。標(biāo)識(shí)可以用屬性來進(jìn)一步描述。
在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范:
1.名稱中可以包含字母、數(shù)字以及其它字母;
2.名稱不能以數(shù)字或"_" (下劃線)開頭;
3.名稱不能以字母 xml(或 XML 或 Xml ..)開頭
4.名稱中不能包含空格
5.名稱中間不能包含":"(冒號(hào))
為了使元素更容易閱讀理解和操作,我們還有一些建議:
1.名稱中不要使用"."。因?yàn)樵诤芏喑绦蛘Z言中,"."是作為對(duì)象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替;
2.名稱盡量簡短。
3.名稱的大小寫盡量采用同一標(biāo)準(zhǔn)。
4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。)
另外,補(bǔ)充一點(diǎn)關(guān)于屬性的說明。在HTML中,屬性可以用來定義元素的顯示格式,比如:<font color="red">word</font>將把word顯示為紅色。而在XML中,屬性只是對(duì)標(biāo)識(shí)的描述,與元素內(nèi)容的顯示無關(guān)。例如同樣一句:<font color="red">word</font>,并不會(huì)將word顯示為紅色。(那么,有網(wǎng)友會(huì)問:如何在XML中將文字顯示為紅色呢?這就需要使用CSS或者XSL,我們?cè)谙旅嬖敿?xì)講述。)
三、注釋的語法
注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會(huì)被程序解釋或則瀏覽器顯示。
注釋的語法如下:
<!-- 這里是注釋信息 -->
可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習(xí)慣將使你的文檔更加便于維護(hù),共享,看起來也更專業(yè)。
四、CDATA的語法
CDATA全稱character data,翻譯為字符數(shù)據(jù)。我們?cè)趯慩ML文檔時(shí),有時(shí)需要顯示字母,數(shù)字和其它的符號(hào)本身,比如"<",而在XML中,這些字符已經(jīng)有特殊的含義,我們?cè)趺崔k呢?這就需要用到CDATA語法。語法格式如下:
<![CDATA[這里放置需要顯示的字符]]>
例如:
<![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]>
在頁面上顯示的內(nèi)容將是"<AUTHOR sex="female">ajie</AUTHOR>"
五、Namespaces的語法
Namespaces翻譯為名字空間。名字空間有什么作用呢?當(dāng)我們?cè)谝粋€(gè)XML文檔中使用他人的或者多個(gè)DTD文件,就會(huì)出現(xiàn)這樣的矛盾:因?yàn)閄ML中標(biāo)識(shí)都是自己創(chuàng)建的,在不同的DTD文件中,標(biāo)識(shí)名可能相同但表示的含義不同,這就可能引起數(shù)據(jù)混亂。
比如在一個(gè)文檔<table>wood table</table>中<table>表示桌子,而在另一個(gè)文檔<table>namelist</table>中<table>表示表格。如果我需要同時(shí)處理這兩個(gè)文檔,就會(huì)發(fā)生名字沖突。
了解決這個(gè)問題,我們引進(jìn)了namespaces這個(gè)概念。namespaces通過給標(biāo)識(shí)名稱加一個(gè)網(wǎng)址(URL)定位的方法來區(qū)別這些名稱相同的標(biāo)識(shí)。
Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下:
<document xmlns:yourname='URL'>
其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網(wǎng)址。
假設(shè)上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為
<document xmlns:zhuozi='http://www.zhuozi.com'>
然后在后面的標(biāo)識(shí)中使用定義好的名字空間:
<zhuozi:table>wood table</table>
這樣就將這兩個(gè)<table>區(qū)分開來。注意的是:設(shè)置URL并不是說這個(gè)標(biāo)識(shí)真的要到那個(gè)網(wǎng)址去讀取,僅僅作為一種區(qū)別的標(biāo)志而已。
六、entity的語法
entity翻譯為"實(shí)體"。它的作用類似word中的"宏",也可以理解為DW中的摸板,你可以預(yù)先定義一個(gè)entity,然后在一個(gè)文檔中多次調(diào)用,或者在多個(gè)文檔中調(diào)用同一個(gè)entity。
entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯(cuò),文檔中多個(gè)相同的部分只需要輸入一遍就可以了。2.它提高維護(hù)效率。比如你有40個(gè)文檔都包含copyright的entity,如果需要修改這個(gè)copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。
XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。
entity的定義語法為:
以下為引用的內(nèi)容: <!DOCTYPE filename [ <!ENTITY entity-name "entity-content" ] > |
例如我要定義一段版權(quán)信息:
以下為引用的內(nèi)容: <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved" ] > |
如果我的版權(quán)信息內(nèi)容和他人共享一個(gè)XML文件,也可以使用外部調(diào)用的方法,語法象這樣:
以下為引用的內(nèi)容: <!DOCTYPE copyright [ <!ENTITY copyright SYSTEM "http://www.sample.com/copyright.xml"> ] > |
定義好的entity在文檔中的引用語法為:&entity-name;
例如,上面定義的版權(quán)信息,調(diào)用時(shí)寫作?copyright;
完整的例子如下,你可以copy下來存為copyright.xml觀看實(shí)例:
以下為引用的內(nèi)容: <?xml version="1.0" encoding="GB2312"?> <!DOCTYPE copyright [ <!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"> ]> <myfile> <title>XML</title> <author>ajie</author> <email>[email protected]</email> <date>20010115</date> ©right; </myfile> |
七、DTD的語法
DTD是"有效XML文檔"的必須文件,我們通過DTD文件來定義文檔中元素和標(biāo)識(shí)的規(guī)則及相互關(guān)系。如何建立一個(gè)DTD文件呢?讓我們一起來學(xué)習(xí):
1.設(shè)置元素
元素是XML文檔的基本組成部分。你要在DTD中定義一個(gè)元素,然后在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*>
說明:
"<!ELEMENT" 是元素的聲明,說明你要定義的是一個(gè)元素;
聲明后面的"DESCRIPTION",是元素的名稱;
"(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內(nèi)容以及相互的關(guān)系。下面的表格概要列出了元素的規(guī)則:
2、元素規(guī)則表:
#PCDATA 包含字符或文本數(shù)據(jù) <MYFILE(#PCDATA)> 元素MYFILE包含一個(gè)文本數(shù)據(jù)
#PCDATA, element-name 包含文本和其它子元素 <MYFILE(#PCDTATA,TITLE)> MYFILE元素必須包含文本和TITLE子元素
, 使用逗號(hào)分隔排序 <MYFILE (TITLE,AUTHOR,EMAIL)> MYFILE元素必須依次包含TITILE,AUTHOR,EMAIL三個(gè)子元素
| 使用"|"表示或者 <MYFILE (TITLE | AUTHOR | EMAIL)> MYFILE元素必須包含TITLE,或者AUTHOR或者EMAIL子元素。
name 只能使用一次 <MYFILE (TITLE)> MYFILE元素必須包含TITLE子元素,而且只能使用一次。
name? 使用一次或者不使用 <MYFILE (TITLE,AUTHOR?,EMAIL?)> MYFILE元素必須包含TITLE子元素,而且只能使用一次;可以包含或者不包含AUTHOR和EMAIL子元素,但是如果使用,只能一次。
name 使用至少一次或多次 <MYFILE (TITLE ,AUTHOR?,EMAIL)> MYFILE元素必須包含TITLE子元素,而且使用至少一次;接下來可以跟隨AUTHOR子元素,也可以不跟;最后必須包含EMAIL子元素,而且只能使用一次。
name* 使用一次,多次,或者根本不使用 <MYFILE (TITLE*)> MYFILE元素可以包含一個(gè),多個(gè)或者不包含TITLE子元素
( ) 設(shè)置組,可以嵌套 <MYFILE(#PCDATA | TITLE)*> 元素MYFILE包含一個(gè)或者更多的文本或者TITLE子元素。
<MYFILE((TITLE*, AUTHOR?, EMAIL)* | COMMENT)> MYFILE元素必須包含一些內(nèi)容,內(nèi)容或者是一個(gè)注釋;也或者是多個(gè)組,組里包含:一個(gè),多個(gè)或者沒有TITLE子元素,接著是一個(gè)或者沒有AUTHOR子元素,再接著是一個(gè)必須的EMAIL子元素。
另外,我們還可以為元素定義屬性,因?yàn)槲覀儾煌扑]使用屬性,在這里就不詳細(xì)展開了。
最后,我們來總結(jié)一些前四章學(xué)習(xí)的內(nèi)容,寫一個(gè)包含DTD,XML,以及Script的簡單實(shí)例,便于讀者理解:
1.將下面文件存為myfile.dtd
以下為引用的內(nèi)容: <!ELEMENT myfile (title, author)> <!ELEMENT title (#PCDATA)> <!ELEMENT author (#PCDATA)> |
2.然后建立XML文檔myfile.xml
以下為引用的內(nèi)容: <?xml version="1.0" encoding="GB2312"?> <!DOCTYPE myfile SYSTEM "myfile.dtd"> <myfile> <title>XML輕松學(xué)習(xí)手冊(cè)</title> <author>ajie</author> </myfile> |
3.建立HTML文檔myfile.html
以下為引用的內(nèi)容: <html> <head> <script language="JavaScript" for="window" event="onload"> var xmlDoc = new ActiveXObject("Microsoft.XMLDOM"); xmlDoc.async="false"; xmlDoc.load("myfile.xml"); nodes = xmlDoc.documentElement.childNodes; title.innerText = nodes.item(0).text; author.innerText = nodes.item(1).text; </script> <title>在HTML中調(diào)用XML數(shù)據(jù)</title> </head> <body bgcolor="#FFFFFF"> <b>標(biāo)題: </b> <span id="title"></span><br> <b>作者: </b> <span id="author"></span><br> </body> </html> |
4.用IE5.0以上瀏覽器打開myfile.html就可以看到效果了。
新聞熱點(diǎn)
疑難解答
圖片精選