啥是分布式
1.什么叫分布式?
分布式就是一个大系统拆分成多个子系统,然后通过远程调用技术通信,通过服务治理,然后整合了多个中间件的东西。
分布式:一个系统的业务拆分多个子业务子系统,子系统分别部署在不同的服务器上(节点),这些节点是互通的,相互操作会有协同。
集群:相同的一个系统,部署在多个服务器上。
2.为什么要有分布式?
1)只有当单个节点的处理能力无法满足日益增长的计算、存储任务的时候,且硬件的提升(加内存、加磁盘、使用更好的CPU)高昂到得不偿失的时候,应用程序也不能进一步优化的时候,我们才需要考虑分布式系统。
2)提高整体架构的吞吐量,服务更多的并发和流量。大流量处理,通过集群技术把大规模并发请求的负载分散到不同的机器上。
3)提高系统的稳定性,让系统的可用性更高。关键业务保护。提高后台服务的可用性,把故障隔离起来阻止多米诺骨牌效应(雪崩效应),如果流量过大,需要对业务降级,以保护关键业务。
3.分布式常见的Java后台技术栈有哪些,分别应用在什么场景?
1)nginx:作用是反向代理和负载均衡。
2)rpc(远程过程调用):常见的rpc框架:轻量级的hessian, 阿里dubbo(当当dubbox), 新浪Motan, apache的Thrift,google的grpc, 百度的brpc, 腾讯的tars。
3)消息中间件
Kafka是LinkedIn开源的分布式发布-订阅消息系统,目前归属于Apache定级项目。Kafka主要特点是基于Pull的模式来处理消息消费,追求高吞吐量,一开始的目的就是用于日志收集和传输。0.8版本开始支持复制,不支持事务,对消息的重复、丢失、错误没有严格要求,适合产生大量数据的互联网服务的数据收集业务。
RabbitMQ是使用Erlang语言开发的开源消息队列系统,基于AMQP协议来实现。AMQP的主要特征是面向消息、队列、路由(包括点对点和发布/订阅)、可靠性、安全。AMQP协议更多用在企业系统内,对数据一致性、稳定性和可靠性要求很高的场景,对性能和吞吐量的要求还在其次。
RocketMQ是阿里开源的消息中间件,它是纯Java开发,具有高吞吐量、高可用性、适合大规模分布式系统应用的特点。RocketMQ思路起源于Kafka,但并不是Kafka的一个Copy,它对消息的可靠传输及事务性做了优化,目前在阿里集团被广泛应用于交易、充值、流计算、消息推送、日志流式处理、binglog分发等场景。
4)NoSQL
NoSQL是所有非关系型数据库的统称,在分布式系统中用到很多,主要用来提高QPS(query per second)。如redis、mongoDB。
参考:https://www.cnblogs.com/dudu0614/p/8821811.html
https://www.jianshu.com/p/1e86f615a187