一、认识XML

2019-05-19  本文已影响0人  guideEmotion

参考:尚学堂-XML技术视频

一 xml

1.1 简介

image.png

1.2 格式良好的xml

  1. 声明信息,用于描述xml的版本和编码方式
<?xml version="1.0" encoding="UTF-8"?>

2.xml有且仅有一个根元素
3.xml是大小写敏感的
4.标签成对的,而且要正确嵌套
5.属性值要要使用双引号

1.3 有效的xml

二 使用DTD

2.1 简介

Document Type Definition 文档类型定义

DTD可以分为两种,内部DTD,外部DTD

2.2 使用

2.2.1 内部DTD

<!DOCTYPE 根元素 [元素声明]>
<!ELEMENT 元素名(子元素[,子元素....])>

范例

<?xml version="1.0" encoding="UTF-8"?>
<!-- 声明DTD内部约束 -->
<!DOCTYPE books[
    <!ELEMENT books (book*)>
    <!ELEMENT book (name,author,price)>
    <!ATTLIST book id CDATA #REQUIRED>
    <!ELEMENT name (#PCDATA)>
    <!ELEMENT author (#PCDATA)>
    <!ELEMENT price (#PCDATA)>
]>
<books>
    <book id="01">
        <name>java编程</name>
        <author>zhuc</author>
        <price>120</price>
    </book>
    <book id="02">
        <name>厨房宝典</name>
        <author>小明</author>
        <price>20</price>
    </book>
</books>

注意点:

  1. 元素和(之间要有空格
  2. PCDATA和CTATA的区别

PCDATA
PCDATA 的意思是被解析的字符数据(parsed character data)。可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。PCDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。文本中的标签会被当作标记来处理,而实体会被展开。不过,被解析的字符数据不应当包含任何 & < > 字符;需要使用 & < > 实体来分别替换它们。

CDATA
CDATA 的意思是字符数据(character data)。CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。
几个实体引用字符:
< <
> >
& &
" "
' '

2.2.2 外部DTD

*1.创建一个dtd文件

<?xml version="1.0" encoding="UTF-8"?>
<!ELEMENT books (book*)>
<!ELEMENT book (name,author,price)>
<!ATTLIST book id CDATA #REQUIRED>
<!ELEMENT name (#PCDATA)>
<!ELEMENT author (#PCDATA)>
<!ELEMENT price (#PCDATA)>

2.创建一个文件

<?xml version="1.0" encoding="UTF-8"?>
<books>
    <book id="01">
        <name>java编程</name>
        <author>zhuc</author>
        <price>120</price>
    </book>
    <book id="02">
        <name>厨房宝典</name>
        <author>小明</author>
        <price>20</price>
    </book>
</books>

3.引入
格式

<!DOCTYPE 根元素 SYSTEM "文件名">
<?xml version="1.0" encoding="UTF-8"?>
<!-- 引入外部dtd文件 -->
<!DOCTYPE 根元素 SYSTEM "books.dtd">
<books>
    <book id="01">
        <name>java编程</name>
        <author>zhuc</author>
        <price>120</price>
    </book>
    <book id="02">
        <name>厨房宝典</name>
        <author>小明</author>
        <price>20</price>
    </book>
</books>

三 xml的命名空间

参考:http://www.w3school.com.cn/xml/xml_namespaces.asp

在 XML 中,元素名称是由开发者定义的,当两个不同的文档使用相同的元素名时,就会发生命名冲突。
当两个含有相同元素名的XML 文档被一起使用时,XML 解析器无法确定如何处理这类冲突。

3.1 使用前缀来避免命名冲突

例如:

<h:table>
   <h:tr>
   <h:td>Apples</h:td>
   <h:td>Bananas</h:td>
   </h:tr>
</h:table>

<f:table>
   <f:name>African Coffee Table</f:name>
   <f:width>80</f:width>
   <f:length>120</f:length>
</f:table>

现在,命名冲突不存在了,这是由于两个文档都使用了不同的名称来命名它们的 <table> 元素 (<h:table> 和 <f:table>)。
通过使用前缀,我们创建了两种不同类型的 <table> 元素。

3.2 使用命名空间(Namespaces)

<h:table xmlns:h="http://www.w3.org/TR/html4/">
   <h:tr>
   <h:td>Apples</h:td>
   <h:td>Bananas</h:td>
   </h:tr>
</h:table>

<f:table xmlns:f="http://www.w3school.com.cn/furniture">
   <f:name>African Coffee Table</f:name>
   <f:width>80</f:width>
   <f:length>120</f:length>
</f:table>

与仅仅使用前缀不同,我们为 <table> 标签添加了一个 xmlns 属性,这样就为前缀赋予了一个与某个命名空间相关联的限定名称。

3.3 XML Namespace (xmlns) 属性

XML 命名空间属性被放置于元素的开始标签之中,并使用以下的语法:

xmlns:namespace-prefix="namespaceURI"

当命名空间被定义在元素的开始标签中时,所有带有相同前缀的子元素都会与同一个命名空间相关联。
注释:用于标示命名空间的地址不会被解析器用于查找信息。其惟一的作用是赋予命名空间一个惟一的名称。不过,很多公司常常会作为指针来使用命名空间指向实际存在的网页,这个网页包含关于命名空间的信息。

3.4 默认的命名空间(Default Namespaces)

xmlns="namespaceURI"//没有了namespace-prefix

这个 XML 文档携带着某个表格中的信息:

<table xmlns="http://www.w3.org/TR/html4/">
   <tr>
   <td>Apples</td>
   <td>Bananas</td>
   </tr>
</table>

四 schema

参考:http://www.w3school.com.cn/schema/index.asp

XML Schema是DTD的替代者,更复杂,但功能也更强大
XML Schema 语言也称作 XML Schema 定义(XML Schema Definition,XSD)。

4.1 什么是 XML Schema?

XML Schema 是 DTD 的继任者
理由如下:

4.2 dtd对比schema

简单的xml文件

<?xml version="1.0"?>
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

DTD 文件

<!ELEMENT note (to, from, heading, body)>
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>

XML Schema

<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.w3school.com.cn"
xmlns="http://www.w3school.com.cn"
elementFormDefault="qualified">

<xs:element name="note">
    <xs:complexType>
      <xs:sequence>
    <xs:element name="to" type="xs:string"/>
    <xs:element name="from" type="xs:string"/>
    <xs:element name="heading" type="xs:string"/>
    <xs:element name="body" type="xs:string"/>
      </xs:sequence>
    </xs:complexType>
</xs:element>

</xs:schema>

对 XML Schema 的引用

<?xml version="1.0"?>
<note
xmlns="http://www.w3school.com.cn"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.w3school.com.cn note.xsd">

<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

4.3 元素

<schema> 元素

<schema> 元素是每一个 XML Schema 的根元素
<schema> 元素可包含属性。一个 schema 声明往往看上去类似这样:

<?xml version="1.0"?>
 
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.w3school.com.cn"
xmlns="http://www.w3school.com.cn"
elementFormDefault="qualified">

...
...
</xs:schema>

代码解释:

xmlns:xs="http://www.w3.org/2001/XMLSchema"

显示 schema 中用到的元素和数据类型来自命名空间 "http://www.w3.org/2001/XMLSchema"。同时它还规定了来自命名空间 "http://www.w3.org/2001/XMLSchema" 的元素和数据类型应该使用前缀 xs:


targetNamespace="http://www.w3school.com.cn" 

显示被此 schema 定义的元素 (note, to, from, heading, body) 来自命名空间: "http://www.w3school.com.cn"。


xmlns="http://www.w3school.com.cn" 

指出默认的命名空间是 "http://www.w3school.com.cn"。


elementFormDefault="qualified" 

指出任何 XML 实例文档所使用的且在此 schema 中声明过的元素必须被命名空间限定。

XSD 简易元素

简易元素指那些仅包含文本的元素。它不会包含任何其他的元素或属性。
不过,“仅包含文本”这个限定却很容易造成误解。文本有很多类型。它可以是 XML Schema 定义中包括的类型中的一种(布尔、字符串、数据等等),或者它也可以是您自行定义的定制类型。
您也可向数据类型添加限定(即 facets),以此来限制它的内容,或者您可以要求数据匹配某种特定的模式。

定义简易元素

<xs:element name="xxx" type="yyy"/>

简易元素的默认值和固定值

<xs:element name="color" type="xs:string" default="red"/>

<xs:element name="color" type="xs:string" fixed="red"/>

XSD 属性

简易元素无法拥有属性。假如某个元素拥有属性,它就会被当作某种复合类型。但是属性本身总是作为简易类型被声明的。

声明属性

<xs:attribute name="xxx" type="yyy"/>

属性的默认值和固定值同元素规则
可选的和必需的属性

<xs:attribute name="lang" type="xs:string" use="required"/>

4.4 XSD 限定 / Facets

限定(restriction)用于为 XML 元素或者属性定义可接受的值。对 XML 元素的限定被称为 facet
对值的限定
下面的例子定义了带有一个限定且名为 "age" 的元素。age 的值不能低于 0 或者高于 120:

<xs:element name="age">

<xs:simpleType>
  <xs:restriction base="xs:integer">
    <xs:minInclusive value="0"/>
    <xs:maxInclusive value="120"/>
  </xs:restriction>
</xs:simpleType>

</xs:element> 

等等

4.4 XSD 复合元素

有四种类型的复合元素:

定义
第一种: 通过命名此元素,可直接对"employee"元素进行声明,就像这样:

<xs:element name="employee">
  <xs:complexType>
    <xs:sequence>
      <xs:element name="firstname" type="xs:string"/>
      <xs:element name="lastname" type="xs:string"/>
    </xs:sequence>
  </xs:complexType>
</xs:element>

第二种:"employee" 元素可以使用 type 属性,这个属性的作用是引用要使用的复合类型的名称:

<xs:element name="employee" type="personinfo"/>

<xs:complexType name="personinfo">
  <xs:sequence>
    <xs:element name="firstname" type="xs:string"/>
    <xs:element name="lastname" type="xs:string"/>
  </xs:sequence>
</xs:complexType>

4.5 targetNamespace、xsi:schemaLocation等等

参考:https://blog.csdn.net/freelk/article/details/80869439

整理总结:

  1. targetNamespace:本XML Schema文档中定义的元素是属于targetNamespace属性指定的命名空间(URI)下的。一般和xmlns的uri相等
  2. xmlns:默认命名空间。
    xmlns和targetNamespace指定的命名空间一致时。在默认命名空间下使用的元素(如:type="booksType")就有了定义。
  3. xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"一般时固定的,作用:告知xml文档解析器,用某个schema实例来验证该xml文档。这个URI指向一个xsd文档,该xsd的targetNamespace的值就是这个URI
  4. xsi:schemaLocation
    其语法是:schemaLocation=“{namespaceURI} {xsd名称}”
    其作用是告知解析器,schemaLocation指定的命名空间下的元素要用该xsd的schema来约束。就像该属性的名称的字面意义,确定schema的定位。
    如果要让该schema起到作用,需要在xml中使xmlns的URI和该xsd文档的targetNamespace的URI相同,且在schemaLocation中,namespaceURI的值一定要和该xmlns相同,也就是和xsd文件的targetNamespace相同,这样,解析器才能准确的知道在该xmlns下的元素要遵循哪个schema。
    也就是:xmlns=schemaLocation=xsd的targetNamespace
    5.将namespace(命名空间),当作java中的package。我们要使用元素,必须确定一个元素的全名(namespace+元素名)。很多我们没加命名空间名,时因为有默认命名空间
上一篇下一篇

猜你喜欢

热点阅读