• 首页
        • 更多产品

          客户为中心的产品管理工具

          专业的软件研发项目管理工具

          简单易用的团队知识库管理

          可量化的研发效能度量工具

          测试用例维护与计划执行

          以团队为中心的协作沟通

          研发工作流自动化工具

          账号认证与安全管理工具

          Why PingCode
          为什么选择 PingCode ?

          6000+企业信赖之选,为研发团队降本增效

        • 行业解决方案
          先进制造(即将上线)
        • 解决方案1
        • 解决方案2
  • Jira替代方案
目录

站点可靠性工程的关键原则有哪些

站点可靠性工程的关键原则包括:1、应用程序监控,SRE 团队认同软件部署过程中错误在所难免;2、逐步实施更改,SRE 实践鼓励频繁发布较小的更改,以保持系统可靠性;3、通过自动化提高可靠性,SRE 使用的策略和流程将可靠性原则嵌入到交付管道的每个步骤中。

站点可靠性工程的关键原则有哪些?

以下是站点可靠性工程 (SRE) 的一些关键原则。

应用程序监控

SRE 团队认同软件部署过程中错误在所难免。该团队不会努力寻找完美的解决方案,而是根据服务水平协议 (SLA)、服务水平指标 (SLI) 和服务水平目标 (SLO) 来监控软件性能。在生产环境中部署应用程序后,会继续观察并监控性能指标。 

逐步实施更改

SRE 实践鼓励频繁发布较小的更改,以保持系统可靠性。SRE 自动化工具使用一致但可重复的流程来执行以下操作:

  • 减少变更带来的风险。
  • 提供反馈回路以测量系统性能。
  • 提高变更实施的速度和效率。

通过自动化提高可靠性

SRE 使用的策略和流程将可靠性原则嵌入到交付管道的每个步骤中。自动解决问题的一些策略包括:

  • 基于服务水平目标制定质量门槛,以便及早发现问题
  • 使用服务水平指标自动执行构建测试
  • 在软件开发之初做出确保系统弹性的架构决策
相关文章