GBIFデータ検証ツール

GBIFデータ検証ツールを使用することで、データセットの潜在的な問題をチェックし、実際にデータを公開する前にGBIFで解釈されたバージョンをプレビューすることができます。

データ検証ツール

GBIFデータ検証ツールとは何ですか?

GBIFデータ検証ツールは、GBIF関連のデータセットを持っていれば誰もがそのデータセットに含まれるコンテンツの構文の正確性及び妥当性に関するレポートを受け取れるサービスです。検証ツールにデータを送信することによって、通常はGBIFで出版する際に関連して行われるデータの検証と解釈の処理を実行し、実際にデータを出版する前に、データについて生じる可能性のある問題を迅速に見つけ出すことができます。

どのように機能するのですか?

まず、次のどちらかの方法でデータセットファイルを検証ツールにアップロードします。
1)[ファイルを選択する]をクリックし、ローカルコンピュータ上のファイルを選択する。
2)ローカルフォルダからファイルをドラッグし[ここにドロップする」アイコンにドロップする。
インターネットからアクセスできるデータセットのファイルのURLを入力することもできます。これは特にデータセットが大きい場合に役立ちます。[送信」ボタンを押すと、検証ツールでデータセットファイルの処理が開始され、検証結果のページが表示されます。

データセットのサイズによっては、処理にしばらく時間を要します。新しい検証処理が開始されるごとに固有のジョブIDが発行されるため、ブラウザーのウインドウを開いたままにしておく必要はありません。データセットの処理に時間がかかっている場合は、IDを保存しておき(URLをブックマーク)、後からURLを使って検証ツールへ戻りレポートを表示してください。レポートは1か月間保存されるため、その間、いつでも戻って見ることができます。

指定できるファイルの形式は?

  • ZIP圧縮したダーウィンコア・アーカイブ (DwC-A)(「オカレンス」「タクソン」「イベント」のいずれかのコアデータを含む)
  • チェックリストオカレンスサンプルイベントのデータを含むIntegrated Processing Toolkit (IPT) のExcelテンプレート
  • 先頭行にダーウィンコアの項目名を含むシンプルなCSVファイル

検証レポートから得られる情報は?

処理が終わると、以下の情報を含む検証レポートが表示されます。

  • データセットの形式とGBIFによるインデックス作成の可否を示すシンプルなサインによる要約
  • GBIFのデータ解釈でデータセット中に検出された問題の要約
  • メタデータ、データセットコア、拡張データセット(該当する場合)のそれぞれで検出された問題の詳細
  • データ解釈が正常に行われたレコードの数
  • データセットで使用された項目の頻度

また、データセットがGBIF上で公開・登録されたときに表示されるように、メタデータをデータセットページのドラフトバージョンとして表示することもできます。

検証レポートを手に入れたら、次は何をすればいいですか?

検証ツールで「このデータセットではGBIFのインデックスを作成できません」と判定された場合は、GBIFでの出版を検討する前に、検証レポートで明らかになった問題に対処してください。また、グリーンのサインが表示され「このデータセットではGBIFのインデックスを作成できます」という場合でも、データの品質に影響を与えうる変換エラー等の結果がないか問題を慎重に精査してください。単純なタイプミスから大きな体系的な問題まで何らかのエラーを見つけて修正した場合は、データセットの送信を何度でもやり直してください。

技術的な詳細

GBIFのすべてのツールとソフトウェア同様に、データ検証ツールはオープンソースのプロジェクトです。詳細については、GitHubレポジトリでソースコードとドキュメントを入手することができます。