每日一读-数千台服务器,千万用户量:居然之家两年云原生改造历程
2019-08-13 本文已影响0人
locoder
写在前面的话
Stay Hungry Stay Foolish!!!
每天进步一点点!!!
《每日一读》是博主每日学习的一篇文章所记录的笔记,大多数是提取文章中关键内容而成;文章类型不限,内容不限。
意义:培养自己的阅读能力,学习更多的知识
郑重声明:如果涉及到文章侵权深感抱歉,请及时联系我我会第一时间删除,谢谢!!
个人总结
组织
1967 年,马尔文·康威提出康威定律, 用一句话概况就是:“设计系统的架构受制于产生这些设计的组织的沟通结构。”
技术架构的重大的升级必然伴随着组织架构的调整,基本所有的公司都是自顶而下的驱动形式,组织架构的调整有利于减少重复造轮子,信息封闭等问题,这就类似运营SOA或中台战略,职责清晰化可以有效提升整体效率。
云原生
相信不少同学在工作的过程中也都有接触服务器相关的运维工作,尤其是初创公司,其特点比较明显:
- 没有标准的技术栈
- 缺少或没有运维人员
- 开发流程基本研发全程参与
其带来的缺陷也是很明显:
- 成本不可控
- 易出问题
- 不易维护
- 无法专注于业务
云计算时代的来临,通过云原生及当下相关的Serverless
、ServiceMesh
等技术架构,很好的解决了这些问题。
所以综合来看,云原生正在慢慢的改变传统技术架构,未来已来,技术人能做的唯有更好的去学习、适应新的架构;(ps:这里的新不是指的是云原生是新出现的事务)
正文
背景
- 技术栈相对传统:Scala和C++
- 单体应用架构
- 整体迭代速度慢,需求响应周期长
- 传统机房运维的问题:
- 稳定性:网络与软硬件设施不稳定
- 系统弹性:高峰扩容,低峰缩容,需要人工参与
- 高性能:CPU密集型,计算能力要求较高
- 服务器运维、网络成本高
目标
上云,专注核心业务,将基础设施相关的事项由云架构来解决
演进
- 组织架构调整及微服务改造:
Service Mesh
- 上云及云原生
- DevOps 实践
- 及时感知:节点运行状态
- 可触达:阶段问题单独解决,具备自愈能力
- 智能化运维:机器学习算法
云集群管理:
- 集群管理
- 网络管理
- 存储管理
- 镜像管理
实践效果
- 基础设施费用减半,在规模扩大的基础上,在基础设施上的投入还缩减了近
50%
; - 研发成本降低,整个团队
50%
以上的人员为研发和产品,在基础设施交付给阿里云之后,整个团队可以集中精力进行核心业务研发,交付速度大幅提升; - 系统可用性提高到
99.96%
,在人员及成本缩减的情况下,整体可用性却有了很大提升。 - 安全性提高,原来受限于整体架构,在达到
99%
之后,小数点之后的每一次提高的成本都是非线性的,而通过云原生改造,可以用相对经济的方式达到较高安全度。