xml简介
一、xml特征
大小写敏感
xml声明必须放在第一行
二、xml解析
三、xml约束
3.1 dtd约束
使用方法:1、复制约束文件 2、引用命名空间
比如说<web-app>,比如说<servlet>
3.2 Schema
和dtd的区别是将命名空间放在了dtd的内部
XML的主流约束方式
1 XML简介
1.1 XML与HTML
XML 是 Extensible Markup Language(可扩展标记语言)的缩写。
XML和HTML的区别:
HTML 是用于编写网页的标记语言,XML 是用于定义任意标记语言的元语言(通常把用于定义新语言的语言称作元语言,通过使用XML 可以定义出各种各样的新语言)。
XML本身并不会限定标签的种类,反倒是允许 XML 的使用者随心所欲地创建标签。也就是说,在“<”和“>”中的单词可以是任意的。这就是所谓的“可扩展”。在 HTML 中,我们只能使用由 HTML 定义出的那若干种标签,因此 HTML 是固定的标记语言。与此相对,XML 是可扩展的标记语言。1.2 XML中的约束
为XML标签设定命名空间:
XML 的数据是纯文本格式的,也就是说只包含字符。通常把遵循了 XML 的约束编写出的文档称为“XML 文档”;把保存着 XML 文档的文件称为“XML 文件”。举例:
1.3 XML的主要用途
- XML可以为信息赋予意义。
如下定义le
<productId>、<productName>、<price>
等标签,然后用它们表示商品编号、商品名称、价格等信息。程序加载了带有这些标签的文件后,就能够轻松地识别出商品编号、商品名称和价格了,因为信息的含义已经用这些标签标记出来了。
HTML 是给人看的,XML 是给计算机看的。
- XML是通用的数据交换格式。
W3C 的推荐标准是不依赖于特定厂商的通用规范。因此可以认为成为 W3C 推荐标准的 XML 是一种通用的数据交换格式。也就是说,如果某家厂商的某个应用程序把数据保存到了 XML 文件中,那么其他厂商的另一个应用程序就应该可以通过加载这个 XML 文件来使用数据。除此之外,XML 也可以在同一个厂商的不同应用程序之间交换数据。
XML的应用领域:
1.4 XML的完整格式
完整的 XML 文档包括 XML 声明、XML 实例和 DTD 三个部分。
所谓 XML 声明,就是写在 XML 文档开头的、形如 <?xml version="1.0" encoding="Shift_JIS"?> 的部分。XML实例是文档中通过标签被标记的部分。而 DTD 的作用是定义 XML 实例的结构。虽然也可以省略 DTD,但是通过 DTD 可以严格地检查XML 实例的内容是否有效。
与 DTD 相同,还有一个名为 XML Schema 的技术也可用于定义XML 实例的结构。在 XML 中,DTD 借用了可称得上是标记语言始祖的 SGML(Standard Generalized Markup Language,标准通用标记语言)语言的语法。而 XML Schema 是为了 XML 新近研发的技术,因此它可以对 XML 文档执行更严格地检查,例如检查数据类型或数字位数等。DTD 是 1996 年发布的 W3C 推荐标准,而 XML Schema 发布于 2001年。今后将成为主流的是崭新的 XML Schema,而不是古老的 DTD。1.5 XML解析组件
用于于处理 XML 文档的程序组件:比如已成为 W3C 标准的 DOM(Document Object Model,文档对象模型)以及由 XML-dev
社区开发的 SAX(Simple API for XML)。其实无论是 DOM 还是 SAX,都只是组件的规范,实际的组件是由某个厂商或社区提供的。
参考资料:
xml简介
一、xml特征
大小写敏感
xml声明必须放在第一行
二、xml解析
三、xml约束
3.1 dtd约束
使用方法:1、复制约束文件 2、引用命名空间
比如说<web-app>,比如说<servlet>
3.2 Schema
和dtd的区别是将命名空间放在了dtd的内部
XML的主流约束方式
转载于:https://www.cnblogs.com/Renyi-Fan/p/7750447.html
什么是 XML?
XML 指可扩展标记语言(EXtensible Markup Language)
XML 与 HTML 的简单比较
XML 是不作为的
XML 不会做任何事情。XML 被设计用来结构化、存储以及传输信息。
XML 仅仅是纯文本XML 没什么特别的。它仅仅是纯文本而已。有能力处理纯文本的软件都可以处理 XML。
XML 不是对 HTML 的替代
XML 是对 HTML 的补充。
XML 不会替代 HTML,理解这一点很重要。在大多数 web 应用程序中,XML 用于传输数据,而 HTML 用于格式化并显示数据。
对 XML 最好的描述是:
XML 是独立于软件和硬件的信息传输工具。
XML 无所不在
当我们看到 XML 标准突飞猛进的开发进度,以及大批的软件开发商采用这个标准的日新月异的速度时,真的是不禁感叹这真是令人叹为观止。
目前,XML 在 Web 中起到的作用不会亚于一直作为 Web 基石的 HTML。
XML 无所不在。XML 是各种应用程序之间进行数据传输的最常用的工具,并且在信息存储和描述领域变得越来越流行。
XML中的特殊字符
所有 XML 文档中的文本均会被解析器解析。
在处理XML数据时,特殊字符要特殊处理,不能和节点字符混淆。
在 XML 中,一些字符拥有特殊的意义。
如果你把字符 “<” 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始。
这样会产生 XML 错误:
<message>if salary < 1000 then</message>
为了避免这个错误,请用实体引用来代替 “<” if salary < 1000 thenML 中,有 5 个预定义的实体引用:
编码 | 对应字符 | 说明 |
---|---|---|
< ; | < | 小于 |
> ; | > | 大于 |
& ; | & | 和号 |
&apos ; | ’ | 单引号 |
" ; | “ | 引号 |
注释:在 XML 中,只有字符 ”<“ 和 ”&” 确实是非法的。大于号是合法的,但是用实体引用来代替它是一个好习惯。
CDATA区段
术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据(Unparsed Character Data)。
在 XML 元素中,“<” 和 “&” 是非法的。
“<” 会产生错误,因为解析器会把该字符解释为新元素的开始。
“&” 也会产生错误,因为解析器会把该字符解释为字符实体的开始。
某些文本,比如 JavaScript 代码,包含大量 “<” 或 “&” 字符。为了避免错误,可以将脚本代码定义为 CDATA。
CDATA 部分中的所有内容都会被解析器忽略。
CDATA 部分由 “
<![CDATA[
function matchwo(a,b)
{
if (a < b && a < 0) then
{
return 1;
}
else
{
return 0;
}
}
]]>
在上面的例子中,解析器会忽略 CDATA 部分中的所有内容.