日本語版Linked Dataクラウド図

(2014-03-14追記): 2014-03-10版があります.

LODがどう発展してきたかを示すのによく使われている図として,LOD cloud diagram (以下本家図)があります.本家図は2011年9月11日版が最後なのですが,当時日本のデータセットとして入っているのはNDL Subjects (現Web NDL Authorities)だけでした.この2年間で日本語のLinked Dataの世界がかなり発展してきているので,今回それを把握するために日本語版Linked Dataクラウド図 (Japanese Linked Data Cloud Diagram)を描いてみました.図はCC-BYライセンスのもとで自由に使って頂いて構いません.

JLDC-2013-10-15

本家図に入るための条件は決まっており,2011年9月の段階では以下の通りです.

  1. http (https) URIsを参照解決可能でなければならない
  2. (content negotiationありかなしで) RDFデータへ参照解決可能でなければならない
  3. トリプル数が1,000以上でなければならない
  4. 図内に既にあるデータセットに50以上のRDFリンクで繋がっていなければならない
  5. RDFクローリングか,RDFダンプか,あるいはSPARQLエンドポイント経由で,データセット全体へのアクセスが可能でなければならない

以上の条件を満たした後に,datahubに所定の形式でデータセットを登録しなければなりません.

それに対して,日本語版Linked Data クラウド図は以下の緩い条件を採用しています.

  1. 日本語のラベルがある
  2. トリプル数が1,000以上でなければならない
  3. 図内に既にあるデータセットあるいはLODクラウドのデータセットへの10以上のRDFリンクがある
  4. http (https) URIを参照解決可能であるか,RDFダンプか,あるいはSPARQL Endpointを提供している

調査は独自にマニュアルで行っていますので,漏れもあるとおもいます.もし他に上記条件を満たすデータセットをご存知の場合はご連絡頂ければ幸いです.なお,今回外部へのRDFリンクがないデータセットは省いていますが,それらも含めた何かは作成したいと考えています.

参考までに,上記の図を本家図の条件に合うものだけに限定すると,次の図になります.特にLinked Dataの原則の一つであるhttp URIを参照解決可能であるかどうかで外れるものが多いです.

JLDC-2013-10-15-lod-criteria

オープンについて

いわゆるオープンデータにおける”オープン”はOpen Definitionをもとにしていますが,本家図は,多くの公開者が明示的なライセンスを付与していない現状を踏まえて,ネットワークからアクセス可能でかつ認証や支払い等を必要としないものならば採用するようにしています. (参考).日本語版Linked Dataクラウド図では,オープンライセンスのものは明示するようにしました.