国土数値情報のファイル形式に
関する意見募集

現在の国土数値情報は、Shape 形式・GML 形式・GeoJSON 形式の大きく3 つのファイル形式でデータを整備・提供していますが、時代にあった新しいファイル形式での提供へ移行していくことを検討しています。
そこで、ユーザーの皆様から、国土数値情報のファイル形式について意見を募集します。

募集要項

募集期間
令和7年2月7日~令和7年2月28日

応募方法

投票フォーム

まずはこちらから。
国土数値情報として提供してほしいファイル形式を選んで投票してください。2問のみで、簡単に投稿できますので、是非ご回答ください。

GitHub

国土数値情報として提供してほしいファイル形式について、具体的なご意見をお寄せください(投稿方法)。
また、これまでに寄せられた意見もご覧いただけます。

  • 例)現在、A形式でダウンロード可能ですが、このままだと〇〇ができないため、B形式に自分で変換して〇〇に使っています。B形式で提供してもらえると手間が省けます。
  • 例)C形式は、〇〇といった特徴があるため、国土数値情報の〇〇データや〇〇データの提供に特に適しています。

※本取組では、実験的な取組として、ソフトウェア開発のプラットフォームとして世界中で広く使われているGitHubを通じて意見の募集を行います。投稿された意見はどなたでも閲覧できます。また、投稿された意見にコメントして、議論を深めることが可能です。GitHubでの意見募集を通じて、オープンな議論・意思決定の実現を目指します。

現在のファイル形式
ファイル形式 現状の課題
GML
  • GMLがXMLベースであり、データ構造が複雑であるため、取り扱いや処理が他のフォーマットに比べて手間がかかる。
  • GISを活用した実務で一般的に使用されるフォーマットではない。
  • 国土数値情報データ変換ツール(XML→シェープファイルへの変換ツール)は脆弱性が判明したため公開を停止しており、今後再開する予定はない。
  • GMLは、国際標準フォーマットではあるものの、XMLベースで階層的かつ複雑なデータ構造を持つため、実務で利用する場合は他のファイル形式への変換が必要になる。
  • 変換のためにサードパーティのツールを利用するか、手動での変換作業を行う必要がある。
シェープファイル
  • シェープファイルは、1つのデータセットに関連ファイル(.shp、.shx、.dbfなど)を複数必要とするため、データの管理が煩雑になる。
  • 文字コードは、UTF-8やShift-JIS等が混在する場合があり、機械判読を困難にする場合がある(とくに、日本語データを扱う場合)。
  • 列名の文字数上限が半角英数10文字までしか使用できない。
  • ファイルサイズの上限が2GBという制限がある。
  • 複数の関連ファイルを単一ファイルで管理できるようにする必要がある。
  • 文字コードはUTF-8で統一できるようにする必要がある。
  • 長い列名を使いたい場合の不便を解消する必要がある。
  • 大規模な地理空間データに適応させる必要がある。
GeoJSON
  • GeoJSONは、軽量で扱いやすく、とくにGISやWebGIS、Web地図アプリケーションでのデータ共有や可視化に広く利用されているが、JSON形式で記述されるため、大規模な地理空間データや高解像度のデータセットの処理には適していない。
  • GeoJSONは、基本的にWGS84(EPSG:4326)の座標系に基づいており、他の座標系を利用する場合には注意が必要である(多くのGISではWGS84以外の座標系をサポートしていないため、異なる座標系のデータを扱う際には変換が必要)。
  • 軽量で扱いやすい形式であるが、JSON形式のためファイルサイズが大きくなりやすく、大規模な地理空間データや高解像度データを効率よく扱うためには、データの圧縮や、別のフォーマットへの変換を行う必要がある。
  • WGS84(EPSG:4326)を基本とするため、他の座標系を使用する場合には適切な変換を行う必要がある。
今後、提供を検討しているファイル形式の候補
ファイル形式 特徴 利用適性
GeoJSON

地理空間情報を含むJSON形式。階層構造を持つが、ファイルサイズが大きくなりがち。

PythonのGeoPandasなどで直接読み込めるため扱いやすい。小~中規模データ向け。

FlatGeobuf

高速な読み書きが可能。空間インデックスを内包し、大規模データも効率的に処理可能。

GeoJSONのような汎用性を持ちながらも効率性が高く、PythonのGeoPandasで直接読み込めるため扱いやすい。

GeoParquet

列指向の構造で、大規模データ保存や部分読み取りに最適。パーティショニングや圧縮も可能。

大規模データの分析に優れ、GeoPandasやDuckDB(SQL)で読み込める。統計分析や機械学習においてスケーラブルな形式として適している。

GeoArrow

列指向フォーマットの一つで、高速かつ効率的なデータ操作が可能。

データ分析や機械学習において効果的で、PyArrowを用いた効率的なデータ処理が可能。

PMTiles

タイルベースの形式で、地理空間データのWeb表示に最適。

可視化やWebベースのデータ提供に便利。直接分析向けではない。WebGIS構築や結果の共有に向いている。

GeoPackage

スタンドアロンのデータベース形式で、空間・非空間データを統合可能。SQLiteに基づきクエリが容易。

取り扱いやすく、GDAL経由でPythonでも読み書き可能。データの整理や統合に便利で、分析用途でも柔軟に利用できる。

CityGML

3D都市モデルに特化したXMLベースの形式。建物や都市構造の高度な属性を含む。

XML形式でデータ量が大きく分析には不向き。3D Tiles等に変換することで、可視化やWebアプリケーションでの利用が容易になる。

サンプルデータ

以下のデータについて、国土数値情報のファイル形式の意見募集レポジトリで各形式のサンプルデータを提供しています。

  • 行政区域(ポリゴン)
  • 地価公示(ポイント)
  • 河川(ライン)

※サンプルデータは、国土数値情報ダウンロードサービスコンテンツ利用規約に従ってご利用ください。

GitHubへの投稿方法
  1. GitHubへの投稿には、アカウントが必要です。アカウントをお持ちでない方は、GitHubのアカウント作成ページにアクセスし、電子メール、パスワード、ユーザー名を入力してアカウントを作成してください。
  2. 国土数値情報のファイル形式の意見募集レポジトリから、すでに投稿されたissueが確認できます。投稿しようとする意見と同様の議論がすでに行われていないか確認してください。
  3. 既存のissueにコメントする場合、一覧から個別のissueをクリックし、「Add a comment」から意見を書き込み、Commentをクリックし、投稿します。
    コメントの書き込み方法
  4. 既存のissueにない論点の場合、「New issue」と書かれた緑のボタンをクリックします。
    既存のissueにない論点の場合
  5. 「Add a title」にご意見のタイトル、「Add a description」にご意見の内容を入力し、「Create」と書かれた緑のボタンをクリックして投稿します。
    タイトル、意見内容、投稿ボタンの説明
投稿上の注意点
  • 投稿された意見は、どなたでも閲覧できるようになります。個人情報は入力しないでください。
  • 可能な限り、具体的な使用事例や技術的な根拠を含めて意見を記載してください。
  • 議論は技術的な観点から建設的に行い、他の参加者に敬意を持って対応してください。
  • 本GitHubの運用に当たっては、国土交通省大臣官房広報課ソーシャルメディア利用方針を準用します。
  • 投稿された意見は、検討の上、今後の施策へ反映させていただきますが、全ての意見を採用することはできないことをあらかじめご承知おきください。

投票フォーム

下記フォームからご投票ください

国土数値情報として提供してほしいファイル形式について、具体的なご意見をお寄せください

お問い合わせ

地理空間情報課ラボに関してのお問い合わせは下記フォームよりご連絡ください