XML语法 XML文档结构 1 XML文档的元素 2 XML名称空间 3 正确的XML文档 4
1 XML文档结构 1.1 XML文档的组成 XML文档由两部份组成:即文档序文与文档根元素。序文部分包括必须有的XML声明语句以及可选的处理指令等;文档根元素则是一个可以包含多个嵌套子元素的顶层元素。整个文档以.xml为文件扩展名加以保存。
1.2 XML文档的声明 每个XML文档必须以一个文档声明语句开头,包括声明XML的版本号、所使用的字符集,以及是否为独立文档等信息。例如: <?xml version="1.0" encoding="GB2312" standalone="yes" ?>
1.3 XML文档的注释 XML文档中的注释语句以 <!-- 起始,以 --> 结束。在这两者之间,可以输入除了双连字符“--”之外任何想要说明的文字。
1.4 XML的处理指令 XML的处理指令简称PI,其用途是为XML解析器提供传送给应用软件或脚本程序的信息,也可以用来指定应用软件处理或显示文档的方法。 处理指令一般具有下列语法格式: <?目标程序名 指令 ?>
1.4 XML的处理指令 目标程序名 :是该指令被引导到的处理软件或脚本程序的名字。 指令:是被传送到处理软件或脚本程序的信息。 <?xml-stylesheet type="text/xsl" href=“ex3.xsl" ?>
2 XML文档的元素 2.1 XML元素的组成 一个XML元素由一个起始标记、一个结束标记,以及夹在这两个标记之间的数据内容所组成。其基本形式如下: <标记名>数据内容</标记名>
2.2 XML标记的命名 XML元素标记的命名规则如下: 标记名字必须以英文字母或下划线“_”开头,中文标记名称必须以汉字或下划线“_”开头。 在使用默认字符集的情况下,标记名称可由零个或多个字母、数字、句点“.”、连字符(-),或底划线“_”构成。
XML解析器对标记名称中的英文字母大小写是敏感的。 标记名称中不能含有空格。 冒号“:”被保留作为名称空间的分隔符,因而不能在普通标记名称中出现。
2.3 XML元素的类型 1.非空元素 绝大多数XML元素为非空元素,即在其起始标记和结束标记之间通常会有一定的内容,元素的内容也称为元素的数据,它可以是文本、也可以是该元素所包含的若干个子元素。
2.空元素 所谓空元素是指没有内容的元素,即在开始标记与结束标记之间既无数据内容也无属下的子元素。例如下面的元素: <RESUME></RESUME> 此种情况下,可将上面的空元素写成: <RESUME/>
2.4 XML元素的嵌套 XML规范指出:一个格式正确的XML文档必须明确地拥有一个唯一的顶层元素,该元素被称为文档元素或根元素,而其它所有的元素都被嵌套在这个元素之下。事实上,XML文档中几乎所有的元素都是以嵌套形式存在的。
一个包含若干个嵌套元素的元素被称为父元素(parent element);而一个直接包含在父元素之下的元素则称为该父元素的子元素(child element)、副元素(subelement),或父元素的嵌套元素。
2.5 XML元素的属性 在XML元素的起始标记中,可以包含一个或多个属性,用来对该元素的特征作进一步描述,或者用来存储和表示与这个元素相关的若干个数据。XML规范允许用户自己定义元素所具有的各种属性。
2.5.1 元素属性的定义 对于非空元素,其属性的定义格式如下: 2.5.1 元素属性的定义 对于非空元素,其属性的定义格式如下: <标记名 属性名="属性值" 属性名="属性值"...>数据内容</标记名> 对于空元素,属性的定义格式如下: <标记名 属性名="属性值" 属性名="属性值".../ >
3 XML名称空间 XML规范提供了名称空间机制,用来解决同一个XML文档中使用相同标记名而代表不同意义的元素所引起的冲突问题,以及在同一个XML文档中使用不同的标记语言集合而产生的的混淆问题。
3.1 名称空间的定义 XML文档中的名称空间是在某个元素的起始标记内进行定义的,定义名称空间及其对应标识符的语法格式如下: 3.1 名称空间的定义 XML文档中的名称空间是在某个元素的起始标记内进行定义的,定义名称空间及其对应标识符的语法格式如下: <标记名 xmlns:标识符="URI">
标记名:是用户要在其中定义命名空间的某个元素标记的名称. Xmlns:是定义名称空间时所使用的固定词语,与后面的标识符之间必须有冒号分割。 标识符:是用户为名称空间定义的对应标识名称 URI :统一资源标识符,通常只起一个标识的作用,并不是真的要从该网络资源得到什么,所以它的精确性并不重要,甚至可以根本就不存在。
3.2 默认名称空间 可将文档中使用较多的名称空间定义为默认名称空间,并设法将这个默认名称空间与某个元素及其子元素相关联。默认名称空间的定义格式如下。 <标记名 xmlns="URI"> 在某个元素的标记中定义的名称空间,即规定为是这个元素的默认名称空间,其涵盖范围包括该元素的所有子元素。
4 正确的XML文档 4.1 格式良好的XML文档 如果一个XML文档包含一个或多个元素,各元素都能正确地嵌套,并且在需要的情况下正确地使用了属性和实体参照,符合XML的基本语法规范,那么就可认为这个XML文档是格式良好的。
4.2 XML文档的应用 XML可以应用在金融、科研等各个领域。 CML是XML应用于描述化学的标记语言。 MATHML是XML应用于描述数学公式的标记语言。 用于电子商务的SOAP、用于无线通讯的WML、用于网络图像方面的SVG、用于多媒体的 SMIL等。
4.3 XML显示 IE5.0以上版本可以显示原始XML文档,如果需要象HTML那样显示XML文档中的数据,需要通过下面的方法: 使用 JavaScript 转换 XML文档,将XML数据捆绑到HTML元素 作为数据岛将XML文档嵌入HTML中 使用CSS显示XML文档 通过XMLDOM访问和管理XML中的数据 使用XSL转换和显示XML文档 。