所謂的xml,就是eXtensible Markup Language, 翻譯成中文就是“可擴展標識語言“,在國內很多人理解xml為html的簡單擴展,這實際上是一種誤解。盡管xml同html關系非常密切。
XML與SGML、HTML的關系。
SGML、HTML是XML的先驅。SGML是指“通用標識語言標準”(Standard Generalized Markup Language), 它是國際上定義電子文件結構和內容描述的標準,是一種非常復雜的文檔的結構,主要用于大量高度結構化數據的防衛區和其他各種工業領域,利于分類和索引。同XML相比,定義的功能很強大,缺點是它不適用于Web數據描述,而且SGML軟件價格非常價格昂貴。 HTML相信大家都比較熟悉,即“HyperText Markup Language” (超文本標識語言),它的優點是比較適合web 頁面的開發。但它有一個缺點是標記相對少,只有固定的標記集如
.等。缺少sgml 的柔性和適應性。不能支持特定領域的標記語言,如對數學、化學、音樂等領域的表示支持較少。舉個例子來說,開發者很難在web pape 上表示數學公式、化學分子式和樂譜。
Xml 結合了sgml 和html的優點并消除其缺點。Xml 仍然被認為是一種sgml語言。比sgml要簡單,但能實現sgml的大部分的功能。1996年的夏天,Sun Microssystem的John Bosak開始開發W3C SGML工作組(現在稱為xml工作組)。他們的目標是創建一種sgml,使其在Web中,既能利用Sgml的長處,又保留html的簡單性。現在目標基本達到。
二、Xml 的發展。
在專業領域中,出現了Web標記語言的許多項目,著名的有CML—化學標記語言,由Peter Murray_Rust 開發,同時開發了第一個通用xml 瀏覽器Jumbo . 在數學方面,包括IBM公司再內都在致力開發MathML 1997年四月,出版了xll的第一個版本。當xll完整實現時,將比html 和當前瀏覽器所達到的鏈接水平更復雜,更強大。1997年8月,Microsoft公司和Inso公司引入xsl.由于xml是純結構和語義的,需要描述單個元素格式方法。可以使用html的CSS;另一種方案是xsl. 1998年1月,microsoft 公司出版發行了msxsl程序。可以利用xsl表和xml文檔創建能被IE4 識別的html頁面。1998年2月,W3C發布了xml1.0的正式版本。最近一年多來,由于網絡應用的飛速發展,xml的發展非常迅猛。出現了DOM(Document Object Model),XSLT(XSL Transformation)等新名詞,xml的應用軟件也有了飛速的發展,Microsoft、IBM、Breeze、Stilo等公司紛紛推出了自己的或解析器,或開發平臺。在MicrosoftIBM、HP等大公司的推動下,目前有兩個著名的xml的研究組織,分別是biztalk.com和oasis.org,由他們向W3C提出標準的建議。其中biztalk是有Microsoft牽頭組織的,有趣的是Microsoft公司同時參加了oaisis,不過不同于IBM、HP等著名大公司,他的年費只交10萬美元,用Microsoft發言人的話就是“一切視oasis的發展而定!“,言下之意就是如果oasis制定的標準抵觸Microsoft的應用,一場標準大戰不可避免。
什么是XML
首先XML是一種元標記語言,所謂“元標記”就是開發者可以根據自己的需要定義自己的標記,比如開發者可以定義如下標記
等已經定義的標記,對于用戶自己定義的標記是不認識的。 第二xml是一種語義/結構化語言。它描述了文檔的結構和語義。舉個例子,在和html中,要描述一本書,可以如下表示:
新聞熱點
疑難解答