登录注册写文章

03 容器集群可观察性解决方案[编写中]

03 容器集群可观察性解决方案[编写中]

Metrics Logging Tracing

Peter Bourgon在2017年 Distributed Tracing Summit后发表的一篇博文，阐述了 Metrics、Logging、Tracing、三者的关系，三者并不是的孤立的存在, 如下图所示：

MTL.png

特别是运维一个线上的应用系统，在分析故障，性
能等问题，通常要综合相关各类指标来排查并解决问题，先从某Web系统上线发生异常这样一个场景来描述这个过程：

某个时间段，收到告警信息，告警信息显示某个API 最近出现较多的超时次数
系统上线前已经经过压测，并且配置了指标告警，运行日志采集等常规监控，当发生告警的时候，监控软件只能按照阈值的设定，将告警信息按照不同级别发送给运维人员
运维人员收到告警后，从告警指标只能判断异常现象发生

方案概述

基于公有云服务和Grafana Stack技术栈

流程图.jpg

日志系统

vector agent -> Loki -> grafana

vector agent 的安装部署： https://www.jianshu.com/p/551c8483ea75
Loki的安装部署：https://www.jianshu.com/p/f71576485021
grafana的安装部署: https://www.jianshu.com/p/9e5057de67eb

截屏2021-08-10 下午1.54.09.png

监控系统

prometheus -> Cortex -> grafana

Prometheus的安装部署 https://www.jianshu.com/p/f210707b9c07
Cortex的安装部署 https://www.jianshu.com/p/39985a974000

截屏2021-08-10 下午2.00.31.png

链路追踪

最后编辑于：2021.08.11 11:40:03

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

送你一个晚安故事
我是黑夜里大雨纷飞的人啊 1 “又到一年六月，有人笑有人哭，有人欢乐有人忧愁，有人惊喜有人失落，有的觉得收获满满有...
陌忘宇阅读 8,785评论 28赞 54
人工智能是什么?
人工智能是什么？什么是人工智能？人工智能是未来发展的必然趋势吗？以后人工智能技术真的能达到电影里机器人的智能水平吗...
ZLLZ阅读 4,073评论 0赞 5

如何在股灾来临时保持淡定？
首先介绍下自己的背景：我11年左右入市到现在，也差不多有4年时间，看过一些关于股票投资的书籍，对于巴菲特等股神的...
瞎投资阅读 5,896评论 3赞 8
Flask 用户指南
![Flask](data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAW...
极客学院Wiki阅读 7,719评论 0赞 3

友情链接更多精彩内容

赞1赞

赞赏

手机看全文