👁️ 可观测性三大支柱

系统出问题了怎么排查?靠这三样

可观测性三支柱

系统可观测性的三大支柱,每个都不可或缺 👇

📌 Logging(日志)

  • 记录系统中的离散事件(请求、数据库访问等)
  • 数据量最大
  • 常用 ELK(Elasticsearch + Logstash + Kibana)搭建日志平台
  • 关键:统一日志格式,方便关键词搜索

📌 Tracing(链路追踪)

  • 以请求为维度,追踪一个请求经过的所有服务
  • 比如:API网关 → 负载均衡 → 服务A → 服务B → 数据库
  • 用于定位系统瓶颈
  • OpenTelemetry 统一了三大支柱的框架

📌 Metrics(指标)

  • 系统的聚合信息:QPS、响应时间、延迟等
  • 原始数据存 InfluxDB 等时序数据库
  • Prometheus 拉取数据 + 告警规则
  • Grafana 展示 + 告警管理器发送通知

💡 日志告诉你”发生了什么”,追踪告诉你”在哪里慢了”,指标告诉你”整体状态如何”。三者缺一不可。

你们的可观测性方案是怎么搭的?👇


#可观测性 #日志 #监控 #Prometheus #Grafana #DevOps #运维