XML规范简单理解
2013-04-26 本文已影响0人
引颈歌者
xml 的特性
-
xml的设计宗旨是传输数据,而html宗旨是显示内容。
-
xml有自我描述性。
-
需要自定义标签。
-
xml元素指的是从标签开始到结束的部分。元素可以包含其他元素,文本或者两者的混合物。
<bookstore> <book category="CHILDREN"> <title>Harry Potter</title> <author>J K. Rowling</author> <year>2008</year> <price>99.99</price> </book> </bookstore>
上例子中,只有book有属性。
xml的命名规则
- 名称可以含有数字,字母和其他字符。
- 不能以数字或者标点开始。
- 不能以xml开始。
- 不能包含空格。
- 避免有中划线"-"。可以使用下划线"_"。
- 避免":"。冒号会被转换为命名空间使用。
- 空标签的写法:<noelement></noelement>或者<noelelment />。
W3C对xml的一些规定
- xml对大小写敏感。
- 必须正确的嵌套。
- 必须有根元素。
- 属性值必须加引号。单引号和双引号都可以。
- 文本中的<必须被<代替。否则解析错误。
- 注释和html相同。
- xml中以\n来存储换行,win以\r\n存储换行,linux和unix以\r存储换行。
- 建议xml少用属性:属性无法包含多重值,属性无法描述为树结构,属性不易扩展,属性难以阅读。
- 元数据==存储数据的数据应当存储为属性。
xml的DTD(文档类型定义)
DTD的作用是定义xml的文档结构,使用一系列合法的元素来定义文档结构:
<!DOCTYPE note [
<!ELEMENT note ( to, from, heading, body ) >
<!ELEMENT to ( #PCDATA )>
<!ELEMENT from ( #PCDATA ) >
<!ELEMENT heading ( #PCDATA )>
<!ELEMENT body (#PCDATA) >
]>
而W3C支持一种基于XML的DTD代替者,名字为XML Schema:
<xs:element name="note">
<xs:complexType>
<xs:sequence>
<xs:element name="to" type="xs:string" />
<xs:element name="from" type="xs:string" />
<xs:element name="heading" type="xs:string" />
<xs:element name="body" type="xs:string" />
</xs:sequence>
</xs:complexType>
</xs:element>
xml有命名空间
如果两个xml文件同时使用相同的元素名称,那么命名会起冲突。
例如,一个表格:
<table>
<tr>
<td>Apple</td>
</tr>
</table>
一个有关桌子的信息:
<table>
<name>Coffee table</name>
<width>20</width>
</table>
使用前缀
某个表格信息可以表示为:
<h: table>
<h: tr>
<h: td>Apple</h:td>
</h: tr>
</h:table>
某个家具信息:
<f:table>
<f:name>Coffee table</f:table>
<f:width>20</f:width>
</f:table>
使用命名空间
<h:table xmlns:h="http://www.w3.org/html4">
<h: tr>
<h: td>Apple</h:td>
</h: tr>
</h:table>
带有家具信息的xml:
<f:table xmlns:f="http://www.w3.org/furniture">
<f:name>Coffee table</f:table>
<f:width>20</f:width>
</f:table>
通过xmlns将此xml与某个命名空间相关联。
默认命名空间
如果每次在元素前面加f:或者h:是件很繁琐的事情,以下办法就可以省去命名空间的前缀:
xmlns="namespaceURI"
xml文档的解析
xml文档中的所有文本均会被解析,这是由于每个元素中可能嵌套其他元素。
<message>此处文本会被解析</message>
除非用CDATA来标识出不应该被解析的部分
CDATA部分以"<!CDATA["开始,以"]]>"结束。
<script>
<![CDATA[
function matchwo(a,b)
{
if (a < b && a < 0) then
{
return 1;
}
else
{
return 0;
}
}
]]>
</script>
xml编码
编码方式
xml需要编码为unicode编码。