XMPP(一)XML
XML
XML 被设计用来传输和存储数据。
HTML 被设计用来显示数据。
什么是XML
- XML 指可扩展标记语言(EXtensible Markup Language)。
- XML 是一种很像HTML的标记语言。
- XML 的设计宗旨是传输数据,而不是显示数据。
- XML 标签没有被预定义。您需要自行定义标签。
- XML 被设计为具有自我描述性。
- XML 是 W3C 的推荐标准。
XML的树形结构
XML 文档使用简单的具有自我描述性的语法:
<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
-
第一行是 XML 声明。它定义 XML 的版本(1.0)和所使用的编码(ISO-8859-1 = Latin-1/西欧字符集)。
-
下一行描述文档的根元素(像在说:"本文档是一个便签"):
<note>
-
接下来 4 行描述根的 4 个子元素(to, from, heading 以及 body):
-
最后一行定义根元素的结尾:
</note>
总结:
-
XML 文档必须包含根元素。该元素是所有其他元素的父元素。
-
所有的元素都可以有文本内容和属性(类似 HTML 中)。
<title lang="en">Harry Potter</title>
节点元素名
title
他有一个属性lang
= en -
所有的 XML 元素都必须有一个关闭标签
<to>Tove</to>
标签名是
<to>
那么关闭标签就是</to>
-
XML 标签对大小写敏感
-
XML 属性值必须加引号
-
在 XML 中,空格会被保留
-
XML 以 LF 存储换行
-
XML 中的注释
-
实体引用
在 XML 中,一些字符拥有特殊的意义。 如果您把字符 "<" 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始。 这样会产生 XML 错误: <message>if salary < 1000 then</message> 为了避免这个错误,请用实体引用来代替 "<" 字符: < < less than > > greater than & & ampersand ' ' apostrophe " " quotation mark
XML 命名规则
- 名称可以包含字母、数字以及其他的字符
- 名称不能以数字或者标点符号开始
- 名称不能以字母 xml(或者 XML、Xml 等等)开始
- 名称不能包含空格
可使用任何名称,没有保留的字词。
属性
属性(Attribute)提供有关元素的额外信息。
属性通常提供不属于数据组成部分的信息。在下面的实例中,文件类型与数据无关,但是对需要处理这个元素的软件来说却很重要:
<file type="gif">computer.gif</file>
避免 XML 属性
- 属性不能包含多个值(元素可以)
- 属性不能包含树结构(元素可以)
- 属性不容易扩展(为未来的变化)
- 属性难以阅读和维护。请尽量使用元素来描述数据。而仅仅使用属性来提供与数据无关的信息。
XML 命名空间 - xmlns 属性
XML 命名空间提供避免元素命名冲突的方法。
当在 XML 中使用前缀时,一个所谓的用于前缀的命名空间必须被定义。
命名空间是在元素的开始标签的 xmlns 属性中定义的。
命名空间声明的语法如下。xmlns:前缀="URI"。
<root>
<h:table xmlns:h="http://www.w3.org/TR/html4/">
<h:tr>
<h:td>Apples</h:td>
<h:td>Bananas</h:td>
</h:tr>
</h:table>
<f:table xmlns:f="http://www.w3cschool.cc/furniture">
<f:name>African Coffee Table</f:name>
<f:width>80</f:width>
<f:length>120</f:length>
</f:table>
</root>
在上面的实例中,<table> 标签的 xmlns 属性定义了 h: 和 f: 前缀的合格命名空间。
当命名空间被定义在元素的开始标签中时,所有带有相同前缀的子元素都会与同一个命名空间相关联。
命名空间,可以在他们被使用的元素中或者在 XML 根元素中声明:
<root xmlns:h="http://www.w3.org/TR/html4/"
xmlns:f="http://www.w3cschool.cc/furniture">
<h:table>
<h:tr>
<h:td>Apples</h:td>
<h:td>Bananas</h:td>
</h:tr>
</h:table>
<f:table>
<f:name>African Coffee Table</f:name>
<f:width>80</f:width>
<f:length>120</f:length>
</f:table>
</root>
注意:
- 命名空间 URI 不会被解析器用于查找信息。
- 其目的是赋予命名空间一个惟一的名称
统一资源标识符(URI)是一串可以标识因特网资源的字符。
最常用的 URI 是用来标识因特网域名地址的统一资源定位器(URL)。另一个不那么常用的 URI 是统一资源命名(URN)。
在我们的实例中,我们仅使用 URL。
XML解析
- PCDATA - 被解析的字符数据
- CDATA - (未解析)字符数据