web数据格式中关于:XML/HTML/JSON学习总汇

时间: 2017-11-15阅读: 330标签: json

大家都知道服务器端可以返回的数据格式,主要就是:XML、HTML、JSON,当我们做数据抓取,ajax请求的时候都需要熟悉它们的使用。这篇文章主要围绕三个核心概念来进行介绍。


XML

XML:可扩展标记语言,用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言,主要用于数据传输。

从语法上来讲,XML和HTML可以被归为一类,因为他们遵循的语法一致,只是在web中充当的角色和标签名称上有差异。  xml格式如下:

<?xml version="1.0" encoding="utf-8"?>
<note>
  <to>Fly63</to>
  <from>tony</from>
</note>

xml的第一行是xml的文档头声明,主要包含xml的版本、字符编码信息。之后的几行时xml文档的主题内容。该xml文件包含的内容信息均以标签对进行封装,每一个值都包括在起始标签  我们可以把理解为键值对的形式,只是键名都是头尾对称的标签,值为里面的内容。

XML的优点:1、通用的数据格式;2、不必把数据强加到已定义好的格式中,而是要为数据自定义合适的标记;3、利用DOM可以完全掌控文档。
XML的缺点:1、如果文档来自于服务器,就必须得保证文档含有正确的首部信息。若文档类型不正确,那么responseXML的值将是空的;2、当浏览器接收到长的XML文件后,DOM解析可能会很复杂。  



HTML

HTML:超文本标记语言,为“网页创建和其它可在网页浏览器中看到的信息”设计的一种标记语言,主要用于网页显示。

而html与xml的主要区别是,html有约定俗成的固定文档结构,有预定义的一系列固定标签。单纯的html仅仅是静态文本,浏览器的渲染是基于html文档中各级标签内所定义的属性

JSON是一种轻量级的数据交换格式。 它起源于JavaScript的数据对象,之后独立成为一种web较为流行的数据交换标准,JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++, C#, Java, JavaScript, Perl, Python等)。这些特性使JSON成为理想的数据交换语言。易于人阅读和编写,同时也易于机器解析和生成。

{
  "note":{
        "to":"Fly63",
        "from":"tony",
    }
}

json的语法,是非常明显的键值对(key-value),key不允许重复,且需以双引号包括,键值对中允许嵌套,值可以为字符(使用双引号或者单引号包括)、数值、布尔型(true\false)、数组([1,2,3,5])或者null。同级元素间以“,”隔开,花括号包含的的内容被称为对象,键值对中值也允许为对象。

json在某种程度上跟xml有点像,json也是只有一套语法标准,不存在固定的文档模板或者预定义标签(或者说键名),这样xml和json都可以用于书写自定义的数据对象。

xml由于是对称标签结构,而json仅适用“{”,“[”,“<”,“>”等标点符号来作为层级和标签起始点结构,所以json省去了大量冗余字符信息,这也是网络上争吵不断的关于xml和json孰优孰略的焦点之一。

JSON的优点:1、与XML很相似,但是更加灵巧;2、不需要从服务器端发送含有特定内容类型的首部信息。
JSON的缺点:1、语法过于严谨;2、代码不易读;3、eval函数存在风险。


总结:

HTML主要用于网页的显示,而xml和json主要用于数据的传输。XML相对于JSON而言是一种重量型的数据交换格式;而JSON是一种轻量型的数据交换格式,两个各有优缺点,孰轻孰重还要看具体的应用环境。