数据清洗|JSON格式
2019-01-21 本文已影响33人
5a41eb2ceec6
日拱一卒|数据挖掘004
格式、类型与编码(二)
一、文件格式
2.常见的文本文件格式
(2)JSON格式
JSON被称为半结构化数据,虽然名字里含有JavaScript字样,但并非只限于在JavaScript中使用。名字只是陈述了该类型被设计用于序列化JavaScript对象这个事实。
半结构化数据集的特点是数据的值都有其相应的属性标识,而且顺序无关紧要,有时甚至可以缺失某些属性。
JSON语法规则
JSON 语法是 JavaScript 语法的子集。
- 数据在名称/值对中
- 数据由逗号分隔
- 花括号保存对象
- 方括号保存数组
JSON对象
对象是一个无序的“‘名称/值’对”集合。
- 以“{” 开始,“}” 结束
- 每个“名称”后跟一个“:”
- “‘名称/值’ 对”之间使用“,”分隔
JSON数组
数组是值(value)的有序集合。
- 以“[”开始,“]”结束
- 值间使用“,”分隔
JSON值
值(value)可以是双引号括起来的字符串(string)、数值(number)、true、false、 null、对象(object)或者数组(array)。这些结构可以嵌套。
7对于JSON需要注意的有:
- 字符串值必须使用双引号进行封闭处理,因此,字符串内部的双引号也都必须用反斜线转义。
- 逗号不可以出现在数字类型的数据中,除非这个值被当作字符串使用并用引号封闭