SRE应急处置中的"六查"

人食五谷杂粮难免会生病,IT系统运行中也会难免有”头疼发热“,人生病了医生会望、闻、问、切一套操作,IT系统也一样,在SRE运维中可以运用 ”六查 “ —– 查关联关系、查变更信息、查操作记录、查告警信息、查性能数据、查机房工况来完成故障问题的定界定位。

一、查关联关系

先查看[……]

Read more

CMDB建设从调研到落地

近期着手参与了CMDB应用的相关工作,这里就CMDB整体的建设思路做个简单的小结。CMDB的建设整体过程,我大致根据自已参与的经验总结为几个阶段:前期技术架构调研—各CMDB使用方需求调研—形成目标功能—投入建设—形成能力—持续关注。

一、前期技术架构调研

[……]

Read more

ITIL运维流程管理

ITIL在网络管理中的体现目前主要有以下几个方面。

服务台

作为用户与IT部门的惟一连接点,服务台能够确保用户找到帮助其解决问题和请求的相关人员。服务台不仅负责处理事故、问题和客户的询问,同时还为其它活动和流程提供接口。包括客户变更请求、维护合同、服务级别管理、配置管理、可用性管理和持续性管理等[……]

Read more

运维标准化与流程化建设指南

当下企业很多都热衷于建设运维自动化、智能化,通过技术革新代替繁杂的手工运维,提高生产效率的同时最大程度的减少人为失误。但是如何建设自动化运维,在不同的企业有着不同的建设方法和技术栈,虽然大多是以Python为主。一般说来,企业的运维发展由起步到成熟,大致要经过三个大阶段:运维无序化、运维标准化和流程[……]

Read more

运维规范管理

运维框架

1.运维框架为什么要分层

  • 运维是面向团队而不是个人,分层能够让团队中每个人找到自己的工作的重点、明确运维的管理思路与目标。
  • 分层其实是将运维工作进行了逻辑上的拆解,形成了上下文。因此我们做的某些操作并不是孤立的,会牵扯到不同的层次,是可以有生命周期的。 例如:服务器上架,就涉及到以下[……]

    Read more