NoSQL

2021-02-28 本文已影响0人 Michelle_G

5.1NoSQL兴起的原因

1、关系数据库已经无法满足Web2.0的需求

主要表现在以下几个方面：

（1）无法满足海量数据的管理需求

（2）无法满足数据高并发的需求

比如微博粉丝数

（3）无法满足高可扩展性和高可用性的需求

a.mysql的主从服务器可以解决一部分问题，读写分离。

b.mysql又加入分库分表。但是有如下问题：

•复杂性：部署、管理、配置很复杂

•数据库复制：MySQL主备之间采用复制方式，只能是异步复制，当主库压力较大时可能产生较大延迟，主备切换可能会丢失最后一部分更新事务，这时往往需要人工介入，备份和恢复不方便

•扩容问题：如果系统压力过大需要增加新的机器，这个过程涉及数据重新划分，整个过程比较复杂，且容易出错

•动态数据迁移问题：如果某个数据库组压力过大，需要将其中部分数据迁移出去，迁移过程需要总控节点整体协调，以及数据库节点的配合。这个过程很难做到自动化

2、One size fits all 模型的局限性

“One size fits all”模式很难适用于截然不同的业务场景

关系模型作为统一的数据模型既被用于数据分析，也被用于在线业务(如银行交易系统)。但这两者一个强调高吞吐，一个强调低延时，已经演化出完全不同的架构。用同一套模型来抽象显然是不合适的

•Hadoop（hdfs + mapreduce）就是针对数据分析

•MongoDB、Redis等是针对在线业务，两者都抛弃了关系模型

3、关系数据库的关键特性无法发挥作用

关系数据库的关键特性包括【完善的事务机制】和【高效的查询机制】。但是这两个关键特性，到了Web2.0时代却成了鸡肋，因为：

（1）Web2.0网站系统通常不要求严格的数据库事务

（2）Web2.0并不要求严格的读写实时性

（3）Web2.0通常不包含大量复杂的SQL查询（不需要多表联合查询）：关系型数据库要满足第一第二第三范式，但NoSQL去结构化，用更多存储空间换取更好的查询性能

5.2 NoSQL与关系数据库的比较

总结

（1）关系数据库

优势：以完善的关系代数理论作为基础，有严格的标准，支持事务ACID四性，借助索引机制可以实现高效的查询，技术成熟，有专业公司的技术支持

劣势：可扩展性较差，无法较好支持海量数据存储，数据模型过于死板、无法较好支持Web2.0应用，事务机制影响了系统的整体性能等

（2）NoSQL数据库

优势：可以支持超大规模数据存储，灵活的数据模型可以很好地支持Web2.0应用，具有强大的横向扩展能力等

劣势：缺乏数学理论基础，复杂查询性能不高，大都不能实现事务强一致性，很难实现数据完整性，技术尚不成熟，缺乏专业团队的技术支持，维护较困难等

应用场景

关系数据库和NoSQL数据库各有优缺点，彼此无法取代

•关系数据库应用场景：电信、银行等领域的关键业务系统，需要保证强事务一致性

•NoSQL数据库应用场景：互联网企业、传统企业的非关键业务（比如数据分析）

采用混合架构

•案例：亚马逊公司就使用不同类型的数据库来支撑它的电子商务应用

•对于“购物篮”这种临时性数据，采用键值存储会更加高效

•当前的产品和订单信息则适合存放在关系数据库中

•大量的历史订单信息则适合保存在类似MongoDB的文档数据库中

5.4 NoSQL的四大类型

NoSQL数据库虽然数量众多，但是，归结起来，典型的NoSQL数据库通常包括键值数据库、列族数据库、文档数据库和图形数据库。

KV

KV的应用：键值数据库成为理想的缓冲层解决方案：

Redis有时候会被人们称为“强化版的Memcached” ：支持持久化、数据恢复、更多数据类型。

列族

文档

“文档”其实是一个数据记录，这个记录能够对包含的数据类型和内容进行【自我描述】。XML文档、HTML文档和JSON文档就属于这一类。

文档数据库比关系型数据库有更好的并发性：

•数据是不规则的，每一条记录包含了所有的有关“SequoiaDB”的信息而没有任何外部的引用，这条记录就是“自包含”的

•记录很容易完全移动到其他服务器，因为这条记录的所有信息都包含在里面了，不需要考虑还有信息在别的表没有一起迁移走

•同时，因为在移动过程中，只有被移动的那一条记录（文档）需要操作，而不像关系型中每个有关联的表都需要锁住来保证一致性，这样一来ACID的保证就会变得更快速，读写的速度也会有很大的提升