《一文读懂数据仓库、数据中台、数据湖、数据平台与湖仓一体的本质区别与使用场景》_湖仓一体架构应用场景
数据仓库、数据中台、数据湖、数据平台、湖仓一体全解析
本文将深入讲解现代数据体系中几个关键概念:数据仓库、数据中台、数据湖、数据平台以及湖仓一体的含义、适用场景、技术架构和相互区别。适合从事大数据、数据治理、数仓建设、企业数据架构设计等方向的工程师、架构师参考学习。
一、数据仓库(Data Warehouse)
1.1 定义
数据仓库是用于支持决策分析的面向主题、集成的、相对稳定的、随时间变化的数据集合,通常以结构化数据为主。常采用 ETL 或 ELT 方式从业务系统中抽取数据,经过清洗、转换后进行建模。
1.2 典型特征
- 面向分析,不适合高并发写操作
- 数据建模复杂(如星型模型、雪花模型)
- 强 Schema,强调一致性
- 主要是结构化数据,存储成本高
1.3 使用场景
- 企业 BI 报表分析
- KPI 指标体系管理
- 监管、财务报表、销售分析等
- 日志、行为分析的聚合层
1.4 常见技术
Hive、Greenplum、ClickHouse、StarRocks、Snowflake、Teradata、Oracle DWH
二、数据中台(Data Middle Platform)
2.1 定义
数据中台是一套统一的、服务化的数据能力平台,强调 数据资产共享复用<