03 容器集群 可观察性解决方案[编写中]

Metrics Logging Tracing

Peter Bourgon在2017年 Distributed Tracing Summit后发表的一篇博文,阐述了 Metrics、Logging、Tracing、三者的关系,三者并不是的孤立的存在, 如下图所示:


MTL.png

特别是运维一个线上的应用系统,在分析故障,性
能等问题,通常要综合相关各类指标来排查并解决问题,先从某Web系统上线发生异常这样一个场景来描述这个过程:

  1. 某个时间段,收到告警信息,告警信息显示某个API 最近出现较多的超时次数
  2. 系统上线前已经经过压测,并且配置了指标告警,运行日志采集等常规监控,当发生告警的时候,监控软件只能按照阈值的设定,将告警信息按照不同级别发送给运维人员
  3. 运维人员收到告警后,从告警指标只能判断异常现象发生

方案概述

基于公有云服务和Grafana Stack技术栈

流程图.jpg

日志系统

vector agent -> Loki -> grafana

  1. vector agent 的安装部署: https://www.jianshu.com/p/551c8483ea75
  2. Loki的安装部署:https://www.jianshu.com/p/f71576485021
  3. grafana的安装部署: https://www.jianshu.com/p/9e5057de67eb
截屏2021-08-10 下午1.54.09.png

监控系统

prometheus -> Cortex -> grafana

  1. Prometheus的安装部署 https://www.jianshu.com/p/f210707b9c07
  2. Cortex的安装部署 https://www.jianshu.com/p/39985a974000
    截屏2021-08-10 下午2.00.31.png

链路追踪

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 8,785评论 28 54
  • 人工智能是什么?什么是人工智能?人工智能是未来发展的必然趋势吗?以后人工智能技术真的能达到电影里机器人的智能水平吗...
    ZLLZ阅读 4,073评论 0 5
  • 首先介绍下自己的背景: 我11年左右入市到现在,也差不多有4年时间,看过一些关于股票投资的书籍,对于巴菲特等股神的...
    瞎投资阅读 5,896评论 3 8
  • ![Flask](data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAW...
    极客学院Wiki阅读 7,719评论 0 3

友情链接更多精彩内容