GeoMesa架构

GeoMesa架构GeoMesa支持多种可扩展的、基于云端的数据存储架构，包括Apache Accumulo, Apache HBased，Google Cloud Bigtable以及用于流计算的Apache Kafka 。同时GeoMesa还可以和Apache Storm一起处理流数据，并使用Spark进行空间分析。 GeoMesa架构如图1： GeoMesa和GeoS

HuFeiHu-Blog

9313人浏览 · 2017-07-23 10:38:08

HuFeiHu-Blog · 2017-07-23 10:38:08 发布

GeoMesa架构

GeoMesa支持多种可扩展的、基于云端的数据存储架构，包括Apache Accumulo, Apache HBased，Google Cloud Bigtable以及用于流计算的Apache Kafka 。同时GeoMesa还可以和Apache Storm一起处理流数据，并使用Spark进行空间分析。
GeoMesa架构如图1：

GeoMesa和GeoServer

GeoMesa以GeoServer插件的形式为GeoServer提供了读取GeoMesa表的功能。在GeoServer中，GeoMesa表作为一种数据源存在，通过GeoServer，用户可以通过WMS/WFS的形式访问GeoMesa的数据。
GeoMesa表作为数据源，如图2：

与GeoMesa集成

为了方便用户使用GeoMesa中存储的数据，GeoMesa通过实现GeoTools接口，提供了使用OGC标准服务接口访问数据的能力，实现的OGC标准有：

Web Feature Service (WFS)
Web Mapping Service (WMS)
Web Processing Service (WPS)
Web Coverage Service (WCS)

GeoMesa提供了多种导入数据的方式，包括GeoMesa命令行工具，Hadoop的map-reduce作业以及Apache Storm的实时数据流，如图3：

GeoMesa的查询流程图如图4，通过GeoMesa API或GeoTools API，查询操作从Accumulo中数据读出：

键值对存储和Z曲线

GeoMesa的数据存储使用 key-value数据库。key-value数据库是一种NoSQL数据库，其数据按照键值对的形式进行组织、索引和存储。 Accumulo，HBase和Google Cloud Bigtable对这些键进行排序，并可将它们存储在任意数量的节点（服务器）上。

当使用key-value数据库时，Key的良好设计可以使应用程序更高效的运行。与关系数据库不同的是，key-value数据库中会频繁的使用key进行查询。例如在订单数据库中，会以订单号作为key进行存储，当用户查询订单的时候，即可用通过订单号直接查询到订单数据并返回该条数据。Accumulo，HBase和Cloud Bigtable都是使用类似的机制进行工作，GeoMesa同样也是使用该机制来进行数据组织。GeoMesa根据时空数据的特点，实现了生成包含时空信息的Key的算法，算法的基本思想如图5：

图中的红线被称为空间填充曲线，又称为Z曲线。该线顺序访问每个单元格一次，并且能够保证访问次序的唯一性。
Z曲线也能用于高分辨率地图，如图6：

Z曲线上的每个点都可以赋予一个顺序值，通过这个顺序值，GeoMesa将经纬度表示为一个整数，这样就将二维数据降为一维数据，可以作为key-value数据库中的key使用。因为Z曲线支持多维数据，所以GeoMesa也支持将多维数据降为一维数据，作为key使用。

GeoMesa 索引

GeoMesa 索引的基本原理计算将三维（经度、纬度、时间）的数据按照Z曲线进行降维，得到一维数据作为Key使用，方便在key-value数据库中进行查询。
实际的Key结构比简单的键值对更复杂。在Accumulo中GeoMesa索引的结构如图7：

Kafka开源项目指南

Kafka开源项目指南提供详尽教程，助开发者掌握其架构、配置和使用，实现高效数据流管理和实时处理。它高性能、可扩展，适合日志收集和实时数据处理，通过持久化保障数据安全，是企业大数据生态系统的核心。

更多推荐

Kafka入门（一）概述、部署与API的简单使用

Kafka概述、部署与API的简单使用

Kafka开源项目指南

基于canal和kafka同步，实现binlog同步ElasticSearch

文章目录前言elasticsearch 安装canal安装canal-adapter 安装及配置mysql 安装zk及kafaka安装查看效果注意事项前言中间件版本elasticsearch7.5.2canal1.1.4client-adapter1.1.5-alpha-1zookeeper3.4.13kafka2.6.0mysql5.7.31elasticsearch 安装{"settings"

Kafka开源项目指南

基于 Iceberg 的湖仓一体架构在 B 站的实践

背景在B站，每天都有PB级的数据注入到大数据平台，经过离线或实时的ETL建模后，提供给下游的分析、推荐及预测等场景使用。面对如此大规模的数据，如何高效低成本地满足下游数据的分析需求，一直是我们重点的工作方向。我们之前的数据处理流程基本上是这样的：采集端将客户端埋点、服务端埋点、日志、业务数据库等数据收集到HDFS、Kafka等存储系统中，然后通过Hive、Spark、Fl...