密码保护:https解包之ssldump

2019年9月21日 要查看留言请输入您的密码。

这是一篇受密码保护的文章,您需要提供访问密码:

分类: http/html/web 标签: ,

SRE运维(九)“面向对象”的监控

2020年10月9日 没有评论

一、SRE监控的目标

根据SRE监控的目的不同,可以将监控进行功能性分类,具体如下:

  • 在需要人工介入的情况下,发出告警;(对应SLO和健康度打分)
  • 调查及诊断这些问题;(根因智鉴)
  • 展示有关于系统的可视化信息;(运维大盘或监控大屏)
  • 获取有关资源使用率或服务健康度的趋势分析,用于制定长期的规划;(动态阈值分析)
  • 比较系统变更前后的行为,或者比较两个实验组的差异。(运维中台+变更或混沌测试)

当然上面的概念听起来估计是比较笼统的,这里我们一步[......]

Read more

分类: 协同敏捷自动化 标签:

SRE运维(八)监控数据源

2020年10月8日 没有评论

运维行业有句话:“无监控、不运维”,监控是及时发现现网问题的一种手段,并通过这种手段及时介入进行处理。不过在设备量不多的情况下,监控是比较容易处理的,我们可以配置的尽可能全,现网设备有个风吹草动,就可以让系统报出来,但设备随着1000台、1万台、10万台这样的规模上起来的时候,监控也就变得尤为困难了。

一、监控数据源

按我接触运维的时间线来说,流行的监控工具很多有cacti、Nagios、Ganglia、Zabbix、open-falcon、Prometheus等。不过无轮监控工具怎么变化,监控的数据源和监控的目的基本变化不是太大。监控的常见数据源有日志和指标(m[......]

Read more

分类: 协同敏捷自动化 标签:

SRE运维(七)错误预算和持续改进

2020年10月7日 没有评论

一、SLO目标与错误预算

SRE体系中的SLO制定有一个比较重要的原则就是需要获得利益干系者的认同。这些干系者包括但不限于产品经理、产品开发人员、运维人员。产品经理需要为用户负责,当SLO的指标值低于目标值时,显然会得不到用户的满意,不过产品经理也不能追求100%的SLO可靠性,这在上文中了有提到,因为这里要给产品开发人员和运维人员留错误预算。我们可以简单的用 SLO目标 + 错误预算 = 100% 这个公式表达错误预算和SLO目标值的关系。像我们日常提到的版本迭代、变更、故障处理(有影响用户使用体验的范围)都算在错误预算里的,其实际是SLO的反[......]

Read more

分类: 协同敏捷自动化 标签:

SRE运维(六)如何正确制定SLO

2020年10月6日 没有评论

SRE运维(五)从SLO开始

2020年10月5日 没有评论

SRE运维(四)SRE的组织闭环

2020年10月4日 没有评论

SRE运维(三)SRE黄金准则

2020年10月3日 没有评论

SRE运维(二)SRE与devops

2020年10月2日 没有评论

SRE运维(一)SRE起源

2020年10月1日 没有评论

统一任务管理cronsun

2020年9月21日 没有评论