Definition

Data Observability 是对数据新鲜度、分布、容量、Schema、血缘、质量规则和任务状态进行持续监控与诊断的能力。

Business Value

  • 在业务发现异常前识别数据延迟、空值突增、口径漂移和链路失败。
  • 缩短数据事故定位和恢复时间。
  • Data Agent Architecture 提供诊断上下文和证据。

Architecture / Flow

flowchart LR
  A["Metadata"] --> E["Observability Engine"]
  B["Quality Rules"] --> E
  C["Lineage"] --> E
  D["Scheduler Logs"] --> E
  E --> F["Alert / RCA / Playbook"]

Commercial Practice

优先监控核心表、核心指标和高价值报表。常见维度包括数据新鲜度、记录数、空值率、唯一性、分布漂移、Schema 变化、任务时长和下游影响。

Common Pitfalls

  • 告警太多但没有分级和 owner。
  • 只监控技术任务,不监控业务指标异常。
  • 没有把观测结果回写到知识库和复盘文档。

Interview Answer

数据可观测性解决的是数据平台“出问题太晚发现、发现后难定位”的问题。它把元数据、血缘、质量规则、调度日志和业务指标监控结合起来,让数据事故更早发现、更快恢复。