和我一起学MongoDB(二)MongoDB的文档和数据类型
MongoDB的文档知识
JSON
JSON是一种基于JavaScript的数据格式规范,将数据用纯文本的模式结构化的表示出来
JSON格式是由对象(Object)和数组(Array)所组成的
对象使用大括号{}
来表示,而数组使用中括号[]
来表示
对象
对象是由键和值组成的,中间用冒号隔开。对象之间没有顺序性
{key1:value1,key2:value2}
其中,key为数据的键,value为值
在JSON数据中,“值”可以是字符串(string),数字(number),布尔值(Boolean)或空值(null)
- 字符串使用双引号表示,如"jason"
- 数字直接使用证书或浮点数,如100、100.1
- 布尔值使用true或者false
- 空值使用null
数组
数组是有顺序的,各元素之间用逗号隔开
"course":["english","history","mathematics"]
对象和数组的组合
通过对象和数据两种结构可以组合成复杂的数据结构,如:
{
"members": [
{
"FirstName": "Jason",
"LastName": "Chang",
"Email": "jason@mengkuo.com"
}
,
{
"FirstName": "Amber",
"LastName": "Cai",
"Email": "amber@mengkuo.com"
}
]
}
BSON
MongoDB基于JSON进行了改良,使用BSON格式进行存储
BSON和JSON同样是无模式化的存储形式,可以支持内嵌的文档以及数组
BSON的类型比JSON更全面,不过BSON一般在储存上会占用较多的空间。
文档
MongoDB的文档不需要事先申明表结构,也不用指明数据类型及字段是否对应。文档的结构与JSON、BSON类似,由对象和数组组成
原子性
MongoDB中,对于单个文档的操作是具有原子性的。
MongoDB3.6及之前的版本不支持多文档事务。到4.0版本,可以在副本集架构中实现多文档事务。在4.2版本中,实现了分布式架构的多文档事务。
MongoDB的数据类型
基本数据类型
MongoDB使用的是BSON文档格式,储存数据时会区分类型,每个类型都有其对应的数字。如果需要修改字段类型,必须依照对应的名称或数字来修改
BSON类型表
类型 | 对应数字 | 名称 | 备注 |
---|---|---|---|
Double | 1 | double | - |
String | 2 | string | - |
Object | 3 | object | - |
Array | 4 | array | - |
Binary data | 5 | binData | - |
Undefined | 6 | undefined | 弃用 |
ObjectId | 7 | objectId | - |
Boolean | 8 | bool | - |
Date | 9 | date | - |
Null | 10 | null | - |
Regular Expression | 11 | regex | - |
DBPointer | 12 | dbPointer | 弃用 |
JavaScript | 13 | javascript | |
Symbol | 14 | symbol | 弃用 |
JavaScript(with scope) | 15 | javascriptWithScope | - |
32-bit integer | 16 | int | - |
Timestamp | 17 | timestamp | - |
64-bit integer | 18 | long | - |
Decimal128 | 19 | decima | MongoDB3.4以后的新类型 |
Min Key | -1 | minKey | - |
Max Key | 127 | maxKey | - |
对象ID(ObjectId)
MongoDB文档中有一个自动生产的字段--_id
,此字段会被自动指定为一个不重复的值,如果不对其进行定义,则MongoDB的驱动程序在写入数据时会子生成一个类型为ObjectId的唯一值。
MongoDB默认用ObjectId作为主键,ObjectId由12byte的字符组成。
- 4byte UNIX时间戳
将以秒为单位的时间戳(ISOData().getTime()/1000)转成十六进制数字 - 3byte 运行MongoDB的机器
- 2byte 生成此id的进程
- 3byte 一个以随机数开始的计数器生成的值
由于ObjectID中嵌入了时间类型,可以通过它来获取文档的写入时间
> db.foo.findOne()._id.getTimestamp()
ISODate("2022-01-05T04:00:08Z")
子文档
文档本身为一组“键值对”,值的对象可以是许多类型数据的集合,当值的对象是一个文档时,我们称之为子文档
数组
MongoDB可以将数组作为一种数据类型赋值给某个字段。数组由零至多个元素组合而成,放在中括号[]中,元素间用逗号隔开,且每个元素可以是不同的数据类型,数组元素还可以是一个文档
MongoDB能够解读数组结构,并指导如何在数组内部有查询数据,这样就能够方便的对数组里面的内容进行筛选查询和创建索引
//创建含有数组的文档
db.foo.insertMany([
{id:"1",qty:125,lenWidth:[12,18]},
{id:"2",qty:500,lenWidth:[14,25]},
{id:"3",qty:180,lenWidth:[22,30]}
])
//查询lenWidth>20的数据
db.foo.find({"lenWidth":{$gt:20}})
//只要数据内任意一个元素的值大于20都符合条件,id为2和3的数据都会被查询出来
//查询lenWidth中第一个元素值大于20的数据(数组是从0开始的)
db.foo.find({"lenWidth.0":{$gt:20}})
//只有id为3的值会被查询出来
日期和时间
在MongoDB中,可以使用多种方法来创建时间
> Date() //取得字符串类型的日期
Wed Jan 05 2022 11:55:24 GMT+0800
> new Date() //取得日期对象类型的日期
ISODate("2022-01-05T03:56:13.240Z")
> ISODate() //取得日期对象类型的日期
ISODate("2022-01-05T03:56:19.049Z")
ISODate使用的是UTC时间,等同于使用GMT时间,而我们所在的地区使用的是北京时间GMT+0800,两者之间相差8个小时
可以使用new Date("<YYYY-mm-dd")的方法将字符串格式的日期转换为ISODate格式
> new Date("2022-01-05")
ISODate("2022-01-05T00:00:00Z")
MongoDB中所应用的日期类型(Date)实际上就是通过ISODate()构建的日期类型,因此与北京时间相差8个小时
var d1=Date()
> d1 instanceof Date //判断d1是否是日期数据类型
false
> var d2=new Date()
> d2 instanceof Date
true