SRE即站点可靠性工程,源于谷歌内部,最终走向社区,被业界所接受。其本身概念,简而言之,是以保证产线服务功能稳定为核心,从而逆向影响产品的测试,开发与设计。
提起SRE,有人说其是DevOps精神的延伸,但从业界的影响力上还远远不如DevOps渗透的群体那么广泛。究其原因,可能是因为更多的厂商更关注交付速度和质量,不甚关注线上运维的健康状况。也可能是因为大部分厂商不具备谷歌这种业务规模和用户体量,所以没有过多的把重点放在站点可靠性上面。
这本书本质上是一本谷歌内部孵化出来的武林秘籍,是对运维的各种历史性的总结,是一系列帖子的集合。书中为SRE指定了7个原则,即拥抱风险,使用服务等级目标,消除琐事,监控分布式系统,自动化,发布工程化,简单化。其中许多都是对运维文化的革命和最佳实践的总结。书中还以产线运维为出发点,倒推到产品设计,以7个层次解读了如何保证站点可靠性,并给出了明确的解决方法和案例展示。
谷歌以技术为核心,人才为基础,充分的发挥了应有尽有的工匠精神,保住了自己的客户,维护了自身应有的品牌效应。从另一个角度看,该书的英文版以及一些周边读物实际上已经免费在官网公开展示,谷歌能将自身发展出的实践与文化以这种方式传播,也是一种社会责任的体现,比起一些闭门造车的大厂,境界就不可同日而语了。
相关推荐
© 2023-2025 百科书库. All Rights Reserved.
发表评价