实时数仓分层介绍
ODS: 原始数据,日志和业务数据。可通过Kafka进行收集。DWD: 根据数据对象为单位进行分流,比如订单、页面访问等等。可存储在Kafka中。DIM: 维度数据。可存储在HBase中。DWM: 对于部分数据对象进行进一步加工,比如独立访问、跳出行为,也可以和维度进行关联,形成宽表,依旧是明细数据。DWS: 根据某个主题将多个事实数据轻度聚合,形成主题宽表。 可存储在Doris、ClickHou
·
ODS: 原始数据,日志和业务数据。可通过Kafka进行收集。
DWD: 根据数据对象为单位进行分流,比如订单、页面访问等等。可存储在Kafka中。
DIM: 维度数据。可存储在HBase中。
DWM: 对于部分数据对象进行进一步加工,比如独立访问、跳出行为,也可以和维度进行关联,形成宽表,依旧是明细数据。
DWS: 根据某个主题将多个事实数据轻度聚合,形成主题宽表。 可存储在Doris、ClickHouse、Elasticsearch中。
DM/ADS: 把Doris/ClickHouse中的数据根据可视化需进行筛选聚合。 一般不存储,进行MPP计算。
更多推荐
已为社区贡献3条内容
所有评论(0)