Parquet / GeoParquet
2026年04月20日 16:40

GISBoxは、OSGB/GEOTIFF/RVTなどの複数のGISフォーマットでの編集をサポートし、3DTiles/Terrainへの変換や公開が可能なワンストップ3DGIS データ編集、変換、公開プラットフォームです。

概要

Parquet / GeoParquet は、列指向データ形式である Apache Parquet を基盤とし、地理空間データを効率的に保存・処理できるよう拡張したクラウドネイティブなデータ形式です。GeoParquet は地理空間情報を扱うためのメタデータ仕様を追加したもので、大規模な空間データをクラウド環境や分散処理基盤で高速に処理できるよう設計されています。主にビッグデータ分析、クラウドGIS、地理空間データレイクなどの環境で利用され、Open Geospatial Consortium(OGC)コミュニティでも注目されている次世代の地理空間データフォーマットの一つです。

データフォーマットの概要

GeoParquet は単一の .parquet ファイルとして保存されますが、その内部構造は複数の論理要素から構成されています。主な構成要素は以下のとおりです。

  • データカラム(Column Data):Parquet の特徴である列指向ストレージにより、各属性データが列単位で格納されます。これにより必要な列のみを読み込むことができ、大規模データの高速処理が可能になります。
  • Geometry カラム:GeoParquet では空間情報を格納する専用のカラムが定義されており、通常は WKB(Well-Known Binary)形式でジオメトリが保存されます。これによりポイント、ライン、ポリゴンなどの空間オブジェクトを効率的に管理できます。
  • Geo Metadata(geo メタデータ):GeoParquet の重要な要素であり、ファイル内のメタデータとして格納されます。座標参照系(CRS)、ジオメトリタイプ、バウンディングボックスなどの情報を定義し、GISソフトや分析ツールが空間データとして正しく解釈できるようにします。
  • Row Groups(行グループ):データは複数の行グループに分割されて保存されます。これにより分散処理や並列読み込みが可能となり、大規模な地理空間データの処理性能が向上します。
  • 圧縮エンコード:Parquet は Snappy、GZIP、ZSTD などの圧縮方式をサポートしており、データ容量を削減しつつ高速な読み書きを実現します。

長所

  1. クラウドネイティブな設計:GeoParquet はクラウドストレージやデータレイク環境に最適化されており、分散処理エンジンやビッグデータ基盤と高い互換性を持ちます。
  2. 高い読み込み性能:列指向ストレージ構造により、必要な属性列のみを読み込むことができるため、大規模データでも高速なクエリ処理が可能です。
  3. 圧縮効率が高い:効率的な圧縮アルゴリズムと列指向データ構造により、従来のシェープファイルなどと比較してデータ容量を大幅に削減できます。
  4. ビッグデータ分析との親和性:Apache Spark やクラウド分析基盤など、ビッグデータ処理ツールと直接連携できるため、大規模地理空間分析に適しています。
  5. オープン仕様:GeoParquet はオープン仕様であり、多くのGISツールやデータ分析プラットフォームでの利用が進んでいます。

短所

  1. GISソフトの対応がまだ限定的:比較的新しいフォーマットであるため、一部の従来型 GIS ソフトウェアでは直接サポートされていない場合があります。
  2. 人間が直接編集しにくい:バイナリ形式のため、CSV や GeoJSON のようにテキストエディタで直接編集することは困難です。
  3. リアルタイム編集用途には不向き:データは大規模バッチ処理や分析用途に最適化されており、頻繁な更新や編集が必要なデータ管理には適していない場合があります。
  4. GIS特有機能の制限:トポロジーや高度な空間インデックスなど、一部のGIS専用データベース機能は標準仕様では提供されていません。

応用シーン

GeoParquet は、大規模な地理空間データの保存と分析に適したフォーマットです。クラウドベースのGISシステムやデータレイク環境での空間データ管理に広く利用されており、都市データ、交通データ、環境観測データなどのビッグデータ分析に活用されています。また、分散処理基盤と組み合わせることで、膨大な空間データを効率的に処理することができるため、スマートシティ、リモートセンシング解析、地理ビッグデータ分析などの分野で注目されています。さらに、クラウドネイティブGISや次世代空間データプラットフォームにおいて、標準的なデータ交換フォーマットとして採用が進んでいます。

1. オンラインGeoParquetビジュアライザー。

ファイルの開き方

1. 最新バージョンのQGISのドラッグ&ドロップ機能を使用して、GeoParquetファイルを視覚化します。

関連 GIS ファイル

ASCAT

DRG

Feather / GeoArrow

ENVI .HDR + .DAT

参考

  1. https://bertt.wordpress.com/2022/12/20/geoparquet-geospatial-vector-data-using-apache-parquet/
  2. https://spatialists.ch/posts/2025/11/11-online-geoparquet-visualizer/
  3. https://mappinggis.com/2023/10/geoparquet-el-nuevo-formato-mas-rapido-y-mas-pequeno/