痛点:可观测性组件太多,运维成本比业务还高
典型的中大型 Kubernetes 集群里,可观测性栈长这样:
- Metrics: Prometheus + Grafana
- Logs: Fluentd/Filebeat → Elasticsearch → Kibana
- Traces: Jaeger/Zipkin + 各语言 SDK
三套系统、三种配置语法、三条数据管道。升级、扩容、故障排查都要分别处理。新服务接入时,开发要集成三种 SDK。运维花在"监控系统本身"的时间占比越来越高。
核心矛盾:可观测性的三大支柱(Metrics、Logs、Traces)本质上是同一个数据流的不同视角,却被...