Mongodb数据库教程
一. mongodb的介绍:
1.NoSQL最常用的解释是非关系型的数据库
2.关系型数据库比如MySQL和非关系型数据库比如mongodb的区别:
关系数据库很强大,但是它并不能很好的应付所有的应用场景。
MySQL的扩展性差,大数据下IO压力大, 表结构更改困难
而非关系型数据库易扩展,大数据量高性能,灵活的数据模型,可用性高
二. mongodb的安装:
Linux下mongodb的安装如下图:
三. mongodb基本操作:
1.mongodb的服务端启动命令:
查看帮助:mongod –help
启动:sudo service mongod start
停止:sudo service mongod stop
重启:sudo service mongod restart
查看是否启动成功:ps ajx|grep mongod
配置文件的位置:/etc/mongod.conf,
默认端⼝:27017
日志的位置:/var/log/mongodb/mongod.log
2.mongodb的客户端启动命令:
启动本地客户端:mongo
查看帮助:mongo –help
退出:exit或者ctrl+c
3.mongodb关于database的基础命令:
查看当前的数据库:db
查看所有的数据库:show dbs /show databases
切换数据库:use db_name
删除当前的数据库:db.dropDatabase()
4.mongodb关于集合的基础命令:
不手动创建集合:向不存在的集合中第一次加入数据时, 集合会被创建出来
手动创建结合:
db.createCollection(name,options)
db.createCollection("stu")
db.createCollection("sub", { capped : true, size : 10 } )
参数capped: 默认值为false表示不设置上限,值为true表示设置上限
参数size: 当capped值为true时, 需要指定此参数, 表示上限,当数据条数达到上限时,
会将之前的数据覆盖, 单位为字节
查看集合:show collections
删除集合:db.集合名称.drop()
5.mongodb的数据类型:
Object ID: 数据ID
String: 字符串, 最常用, 必须是有效的UTF-8
Boolean: 布尔值, true或false
Integer: 整数可以是32位或64位, 这取决于服务器
Double: 存储浮点值
Arrays: 数组或列表, 多个值存储到一个键
Object: 用于嵌入式的数据, 即值为一条数据
Null: 存储Null值
Timestamp: 时间戳, 表示从1970-1-1到现在的总秒数
Date: 存储当前日期或时间的UNIX时间格式
6.mongodb的使用注意点:
a.创建日期语句如下 :new Date('2017-12-20'),参数的格式为YYYY-MM-DD
b.每条数据都有一个属性, 为_id, 保证每条数据的唯一性
可以自己设置插入数据的_id值,如果没有提供,
那么MongoDB为每条数据提供了一个独特的_id, 类型为objectID
其中objectID是一个12字节的16进制数:
前4个字节为当前时间戳
接下来3个字节的机器ID
接下来的2个字节中MongoDB的服务进程id
最后3个字节是简单的增量值
7.mongodb关于数据的增删改查:
a.插入数据(增):
格式:db.集合名称.insert(document)
示例:db.stu.insert({name:'gj',gender:1})
db.stu.insert({_id:"20170101",name:'gj',gender:1})
注意:插入数据时, 如果不指定_id参数, MongoDB会为该数据分配一个唯一的ObjectId
b.删除数据(删):
格式:db.集合名称.remove(<query>,{justOne: <boolean>})
参数query:可选,删除的数据的条件
参数justOne:可选, 如果设为true或1, 则只删除一条, 默认false, 表示删除多条
c.更新(改):
格式:db.集合名称.update(<query> ,<update>,{multi: <boolean>})
参数query:查询条件
参数update:更新操作符
参数multi:可选, 默认是false,表示只更新找到的第一条记录, 值为true表示把满足条件的数据全部更新
示例: db.stu.update({name:'hr'},{name:'mnc'}) 更新一条
db.stu.update({name:'hr'},{$set:{name:'hys'}}) 更新一条
db.stu.update({},{$set:{gender:0}},{multi:true}) 更新全部
d.简单查询(查):
格式:db.集合名称.find()
四. mongodb数据查询:
1.数据查询:
方法find(): 查询
格式:db.集合名称.find({条件文档})
方法findOne():查询,只返回第一个
格式:db.集合名称.findOne({条件文档})
方法pretty(): 将结果格式化
格式:db.集合名称.find({条件文档}).pretty()
2.比较运算符:
等于: 默认是等于判断, 没有运算符
小于:$lt (less than)
小于等于:$lte (less than equal)
大于:$gt (greater than)
大于等于:$gte
不等于:$ne
示例:db.stu.find({age:{$gte:18}})
查询所有年龄大于等于18的数据
3.逻辑运算符:
and:在json中写多个条件即可
示例:查询年龄大于或等于18, 并且性别为true的学生:
db.stu.find({age:{$gte:18},gender:true})
or:使用$or, 值为数组, 数组中每个元素为json
示例:查询年龄大于18, 或性别为false的学生
db.stu.find({$or:[{age:{$gt:18}},{gender:false}]})
综合示例:查询年龄大于18或性别为男生, 并且姓名是郭靖
db.stu.find({$or:[{age:{$gte:18}},{gender:true}],name:'gj'})
4.范围运算符:
使用"$in", "$nin" 判断是否在某个范围内
示例:查询年龄为18、28的学生:
db.stu.find({age:{$in:[18,28]}})
5.正则表达式:
使用//或$regex编写正则表达式
示例:查询姓黄的学生:
db.stu.find({name:/^黄/})
db.stu.find({name:{$regex:'^黄'}})
6.limit和skip:
方法limit(): 用于读取指定数量的数据
格式:db.集合名称.find().limit(NUMBER)
示例:查询2条学生信息:
db.stu.find().limit(2)
方法skip(): 用于跳过指定数量的数据
格式:db.集合名称.find().skip(NUMBER)
示例:从第3条数据开始读取:
db.stu.find().skip(2)
7.自定义查询:
使用$where后面写一个函数, 返回满足条件的数据
示例:查询年龄大于30的学生:
db.stu.find({
$where:function() {
return this.age>30;}
})
8.投影:
在查询到的返回结果中, 只选择必要的字段
格式:db.集合名称.find({},{字段名称:1,...})
参数为字段与值, 值为1表示显示, 值为0不显
特殊: 对于_id列默认是显示的, 如果不显示需要明确设置为0
示例:db.stu.find({},{_id:0,name:1,gender:1})
9.排序:
方法sort(), 用于对集合进行排序
格式:db.集合名称.find().sort({字段:1,...})
参数1为升序排列
参数-1为降序排列
示例:根据性别降序, 再根据年龄升序
db.stu.find().sort({gender:-1,age:1})
10.统计个数:
方法count()用于统计结果集中数据条数
格式:db.集合名称.find({条件}).count()
db.集合名称.count({条件})
示例:db.stu.find({gender:true}).count()
db.stu.count({age:{$gt:20},gender:true})
11.消除重复:
方法distinct()对数据进行去重
格式:db.集合名称.distinct('去重字段',{条件})
示例:db.stu.distinct('hometown',{age:{$gt:18}})
五. mongdb聚合:
1.聚合的概念:聚合(aggregate)是基于数据处理的聚合管道,
每条数据通过一个由多个阶段(stage)组成的管道,
可以对每个阶段的管道进行分组、过滤等功能,
然后经过一系列的处理,输出相应的结果。
2.格式:
db.集合名称.aggregate({管道:{表达式}})
3.常用管道:
在mongodb中,数据处理完毕后, 通过管道进行下一次处理
常用管道如下:
$group: 将集合中的数据分组, 可用于统计结果
$match: 过滤数据, 只输出符合条件的数据
$project: 修改输出数据的结构, 如重命名、 增加、 删除字段、 创建计算结果
$sort: 将数据排序后输出
$limit: 限制聚合管道返回的数据条数
$skip: 跳过指定数量的数据, 并返回余下的数据
$unwind: 将数组类型的字段进行拆分
4.常用表达式:
处理输入数据并输出
语法:表达式:'$列名'
表达式:
$sum: 计算总和, $sum:1 表示以1倍计数
$avg: 计算平均值
$min: 获取最小值
$max: 获取最大值
$push: 在结果数据中插入值到一个数组中
$first: 根据资源数据的排序获取第一个数据
$last: 根据资源数据的排序获取最后一个数据
5.$group解析如下图:
6.$match解析:
注意:match和find的区别在于match是管道命令,
能将结果交给后一个管道,但是find不可以
7.$project解析:
8.$sort解析:
9.$limit和$skip解析:
六. 索引和备份:
1.创建索引:
意义:提高查询速度
注意点:在默认情况下创建的索引均不是唯一索引。
示例: a.创建唯一索引:
db.t1.ensureIndex({"name":1},{"unique":true})
b.创建唯一索引并消除重复:
db.t1.ensureIndex({"name":1},{"unique":true,"dropDups":true})
c.建立联合索引:
db.t1.ensureIndex({name:1,age:1})
d.查看当前集合的所有索引:
db.t1.getIndexes()
e.删除索引:
db.t1.dropIndex('索引名称')
2.数据的备份和恢复:
备份的语法:
mongodump -h dbhost -d dbname -o dbdirectory
参数:-h: 服务器地址, 也可以指定端口号
-d: 需要备份的数据库名称
-o: 备份的数据存放位置, 此目录中存放着备份出来的数据
恢复的语法:
mongorestore -h dbhost -d dbname --dir dbdirectory
参数:-h: 服务器地址
-d: 需要恢复的数据库实例
-dir: 备份数据所在位置
七. mongo和python交互:
使用pymongo模块:pip install pymongo