Scope

这张地图用于组织大数据全栈工程师的能力体系:从数据接入、批流计算、湖仓存储、调度运维,到治理、BI、数据服务和 DATA+AI Agent。

Core Concepts

Engineering Backbone

flowchart LR
  A["Source / CDC / Log"] --> B["Ingestion"]
  B --> C["Storage: Lake / Warehouse / Lakehouse"]
  C --> D["Compute: Batch / Stream"]
  D --> E["Modeling / Metrics"]
  E --> F["Serving: BI / API / Agent"]
  G["Governance"] -.-> B
  G -.-> C
  G -.-> D
  G -.-> E
  G -.-> F

Technology Map

Phase 2 Capability Cards

类型笔记用途
工程实践卡Data Pipeline SLA定义链路时效、质量、恢复和通知承诺
工程能力卡Data Observability监控新鲜度、质量、Schema、血缘和调度风险
治理支撑卡Data Lineage支撑影响分析、质量追踪和问题定位
AI 能力卡Text2SQL把工程链路和语义层暴露给受控查询助手

Practices

Questions

  • 如何解释批处理、流处理和流批一体的差异?
  • 如何定位 Kafka 到 Flink 到 OLAP 的端到端延迟?
  • 如何设计数仓分层并治理 ODS 直连报表?
  • 如何把数据平台能力转化为业务价值指标?

Outputs