ウィキデータ

ウィキデータ: Wikidata)はウィキメディア財団が提供する共同編集型のデータベース知識基盤)である。パブリックドメイン・ライセンスの下で、誰もが使用できるオープンデータを提供することを目的としている[4]ウィキメディア・コモンズがメディアファイルの格納場所を提供して他のウィキメディアプロジェクトがそれを利用する方法と同様に、データに対してこれを行う。ウィキデータはウィキベースソフトウェアを用いて稼働している[5]

ウィキデータ
URL
https://www.wikidata.org/[1]
タイプ
分野 限定なし
使用言語 多言語
閲覧 無料
登録 不要
資金 一般からの寄付[2]
営利性 非営利
設立 2012年10月29日 2012-10-29[3]
執筆者 ウィキデータ著者
編集委員 なし
査読制度 なし
現状 稼働中

コンセプト

スクリーンショット
トップページ
ウィキデータ項目「火星」にある文。値は他の項目やコモンズへのリンクとなっている。
フェーズ1での項目のレイアウト。ラベル(Label)、説明(Description)、別名(Aliases)、言語間リンク(Interwiki links)。
ウィキデータ登場以前のウィキペディアの記事中の言語間リンクのリスト(左)とその表示(右)。各言語版の各記事で個別に管理していたものがウィキデータに集中化された。
「リンクを編集」をクリックするとウィキデータ内の言語間リンクを編集できる。

項目

ウィキデータは、トピック、概念、オブジェクトなどを表す項目に焦点を当てたドキュメント指向データベースである。各項目は、「QID」と呼ばれる文字Qが先頭に付いた番号で一意に識別される。たとえば「政治」はQ7163である。これにより、項目に必要な基本情報を言語を問わずに入力することができる。

項目の名称となるラベルは重複が可能で、たとえば「ケンブリッジ」というラベルは、英国、米国、カナダの3つの都市の項目につけられている。それぞれは説明によって区別される。

項目はラベル、説明、別名、そして文で構成される。

ウィキデータ項目の図。ウィキデータで使用される最も重要な用語を示す。

項目への情報の追加は文を作成することで行われる。文はキーと値のペアとなるプロパティと値で構成されている。たとえば、「牛乳は白い」という文は、項目「牛乳」内でプロパティ「色」に値「白」を設定することで実現できる。

プロパティには複数の値が設定でき、たとえば、マリ・キュリーの「職業」プロパティには、「物理学者」と「化学者」の値を設定することができる[6]

値は、文字列、数値、メディアファイル、項目など、多くのデータ型を扱うことができ、プロパティには値がとりうるデータ型が設定される。たとえば、「公式Webサイト」というプロパティには、「URL」型の値が指定されている[7]。プロパティには、「制約」と呼ばれる、より複雑な規則を定義することもできる。たとえば、「首都」には「単一値制約」が設定されており、首都は1つしかないという現実を反映している。ただし、制約は違反してはならない規約というわけではなく、実際には、データの完全性などをチェックするための補助として扱われている[8]

また、「修飾子」を使用して、文に追加情報を付け加えて文の意味を絞り込むこともできる。たとえば、プロパティ「人口」に、「2011年時点」と文の適用範囲を限定したいときなどに修飾子を使用する。また、「情報源」を使用して、その文の内容の出典はどこかということを示すことも可能である[9]

語彙素

ウィクショナリーとの統合を開発する過程で、新しいエンティティタイプ、「語彙素」を導入した[10]。語彙素とは、言語学において語彙的意味の単位である。同様に、ウィキデータでの語彙素は、辞書学データの格納に適した構造を持つ項目になる。ウィキデータでは、ある言語の語彙素を、語形と語義とともに格納することができる[11]

スキーマ

2019年5月からShEx形式で記述されるエンティティタイプ、「スキーマ」を導入した[12]

歴史

このプロジェクトは、アレン人工知能研究所ゴードン・アンド・ベティ・ムーア財団、そしてグーグルから総額130万ユーロの寄付を受け設立された[13][14]。開発は主にウィキメディア・ドイツによって実施されており、最初の開発計画は3つのフェーズに分割された。

  1. 言語間リンクの一元化 - 異なる言語同士のウィキペディア記事間のリンク
  2. ウィキペディアの基礎情報ボックスのデータのための格納場所の提供
  3. ウィキデータのデータに基づいた一覧記事の作成および更新

初期の展開

ウィキデータは、ウィキメディア財団の2006年以降初めての新規プロジェクトとして、2012年10月29日に開始した[15][16][17]。当初は言語間リンクの一元化のみ利用可能で、項目を作成し、基本情報となるラベル、説明、別名と各言語版の記事へのリンクを入力することができた。

ウィキペディアの記事には、他言語版ウィキペディアに同じ主題の記事が存在する場合は、記事同士をつなぐ「言語間リンク」があった。この時点では、ウィキデータはその言語間リンクを格納した自己完結型リポジトリだった。各言語版ウィキペディアは、ウィキデータのデータにまだアクセスできず、言語間リンクを自身で管理していた。

2013年1月14日、ハンガリー語版ウィキペディアで、ウィキデータからの言語間リンクの提供が開始された[18]。その後、1月30日にヘブライ語版ウィキペディアイタリア語版ウィキペディアに、2月13日に英語版ウィキペディアに、3月6日に他のすべての言語版ウィキペディアへと展開された[19][20][21][22]。2013年9月13日にウィキメディア・コモンズにも言語間リンクが展開された[23]

文とデータ・アクセス

2013年2月4日、ウィキデータの項目に文が導入された。プロパティに指定できる値は、最初は項目とコモンズの画像のみの2種類に制限され、位置情報や日付などのその他の種類のデータ型は後に追加された。3月6日に、初めての新しいデータ型(文字列)が導入された[24]

2013年4月25日から5月27日にかけて、各言語版ウィキペディアに対してウィキデータのデータにアクセスする機能が段階的に提供された[25][26]

2015年9月15日、ウィキデータは、項目と直接関連していない項目のプロパティへの、いわゆる任意アクセスを有効化した。たとえば、「ベルリン」というウィキペディア記事から「ドイツ」に関するデータを読むことが可能になった[27]。2016年4月27日、ウィキメディア・コモンズで任意アクセスが有効となった[28]

クエリ・サービス

2015年9月7日、ウィキメディア財団はウィキデータ・クエリ・サービスを発表した[29]。これは、問合せ言語としてSPARQLを使用する。また、2018年11月の時点で、その他の方法でデータを検索できるツールが少なくとも26種類開発されている.[30]

評価と利用状況

2014年11月、ウィキデータは「その規模と備わったオープン性」に対してオープンデータ研究所からオープンデータ・パブリッシャー・アワードを受賞した[31]。2014年12月、Googleはウィキデータを支持し、自社のFreebaseを閉鎖しウィキデータにデータを移行することを発表。2016年5月にFreebaseは終了した[32]

2018年11月の時点で、ウィキデータの情報は英語版ウィキペディアの全記事の58.4%で使用されており、その大部分は外部識別子や位置座標である。全体としてウィキデータからのデータは、ウィキペディアのページの64%、ウィキボヤージュ記事の93%、ウィキクォートの34%、ウィキソースの32%、そしてウィキメディア・コモンズの27%で表示されている。その他のウィキメディアプロジェクトでの利用も推奨されている[33]

2018年11月の時点で、ウィキデータのデータを視覚化する外部ツールが少なくとも20種類[34]あり、ウィキデータに関して少なくとも100の論文が発表されている[35]。その重要性は多くの文化機関で認められている[36]

GLAMとの連携

図書館や美術館、博物館などいわゆるGLAMと連携する動きが高まっている。ウィキデータは無料、パブリック・ドメイン(CC0)という特徴から、各機関のデータセットのハブとしての役割を担うようになってきている。各組織は、それぞれのデータセットに一意の識別子を保持している。これらのIDをすべてウィキデータに追加することで、多数のソースのデータにシームレスにアクセスできるようになる[37]

2019年5月、アメリカ議会図書館はNAFとLCSHの約100万件にウィキデータへのリンクを追加し、標準データを統合すると発表した[38]

ロゴ

ウィキデータのロゴ上の縦線は「WIKI」をモールス符号で変換したものが含まれている[39]

脚注

  1. http://whois.domaintools.com/wikidata.org; アーカイブ日付: 26 12月 2020; アーカイブURL: https://web.archive.org/web/20201226104037/https://whois.domaintools.com/wikidata.org.
  2. 詳しくは寄付のページを参照のこと。
  3. https://blog.wikimedia.org/2013/04/25/the-wikidata-revolution/; 閲覧日: 14 11月 2018; 引用: Since Wikidata.org went live on 30 October 2012,.
  4. Catrin Schoneville (2012年3月30日). Data Revolution for Wikipedia”. Wikimedia Deutschland. 2018年1月30日閲覧。
  5. Wikibase — Home”. 2018年1月30日閲覧。
  6. Help:Statements”. 2019年9月20日閲覧。
  7. Help:Data type”. 2019年9月20日閲覧。
  8. Help:Property constraints portal”. 2019年9月20日閲覧。
  9. Help:Sources”. 2019年9月20日閲覧。
  10. First experiment of lexicographical data is out”. 2020年2月10日閲覧。
  11. Wikidata - Lexicographical data documentation”. 2019年9月20日閲覧。
  12. Shape Expressions arrive on Wikidata on May 28th”. 2020年2月10日閲覧。
  13. Dickinson, Boonsri (2012年3月30日). “Paul Allen Invests In A Massive Project To Make Wikipedia Better”. Business Insider. http://www.businessinsider.com/paul-allen-invests-in-wikidata-project-2012-3 2018年1月30日閲覧。
  14. Perez, Sarah (2012年3月30日). “Wikipedia’s Next Big Thing: Wikidata, A Machine-Readable, User-Editable Database Funded By Google, Paul Allen And Others”. TechCrunch. http://techcrunch.com/2012/03/30/wikipedias-next-big-thing-wikidata-a-machine-readable-user-editable-database-funded-by-google-paul-allen-and-others/ 2012年10月24日閲覧。
  15. Wikidata (Archived October 30, 2012, at WebCite)
  16. Pintscher, Lydia (2012年10月30日). “wikidata.org is live (with some caveats)”. wikidata-l mailing list.. http://lists.wikimedia.org/pipermail/wikidata-l/2012-October/001151.html 2012年11月3日閲覧。
  17. Roth, Matthew (2012年3月30日). “The Wikipedia data revolution”. Wikimedia Foundation. http://blog.wikimedia.org/2012/03/30/the-wikipedia-data-revolution/ 2018年1月30日閲覧。
  18. Pintscher, Lydia (2013年1月14日). First steps of Wikidata in the Hungarian Wikipedia”. Wikimedia Deutschland. 2015年12月17日閲覧。
  19. Pintscher, Lydia. Wikidata coming to the next two Wikipedias”. Wikimedia Deutschland. 2013年1月31日閲覧。
  20. Pintscher, Lydia (2013年2月13日). Wikidata live on the English Wikipedia”. Wikimedia Deutschland. 2013年2月15日閲覧。
  21. Pintscher, Lydia (2013年3月6日). Wikidata now live on all Wikipedias”. Wikimedia Deutschland. 2013年3月8日閲覧。
  22. “Wikidata ist für alle Wikipedien da” (German). Golem.de. http://www.golem.de/news/onlineenzyklopaedie-wikidata-ist-fuer-alle-wikipedien-da-1304-98941.html 2014年1月29日閲覧。
  23. Lydia, Pintscher (2013年9月23日). “Wikidata is Here!”. Commons:Village pump. https://commons.wikimedia.org/wiki/Commons:Village_pump/Archive/2013/10#Wikidata_is_here.21
  24. Pintscher, Lydia. Wikidata/Status updates/2013 03 01”. Wikimedia Meta-Wiki. Wikimedia Foundation. 2013年3月3日閲覧。
  25. Pintscher, Lydia (2013年3月27日). You can have all the data!”. Wikimedia Deutschland. 2013年3月28日閲覧。
  26. “Wikidata goes live worldwide”. The H. (2013年4月25日). オリジナルの2014年1月3日時点におけるアーカイブ。. https://web.archive.org/web/20140101031329/http://www.h-online.com/open/news/item/Wikidata-goes-live-worldwide-1849479.html
  27. Lydia, Pintscher (2015年9月16日). Wikidata: Access to data from arbitrary items is here
  28. Lydia, Pintscher (2016年4月27日). “Wikidata support: arbitrary access is here”. https://commons.wikimedia.org/wiki/Commons:Village_pump/Archive/2016/05#Wikidata_support:_arbitrary_access_is_here 2016年8月30日閲覧。
  29. Announcing the release of the Wikidata Query Service”. 2018年11月15日閲覧。
  30. Wikidata Query Data tools”. 2018年11月15日閲覧。
  31. First ODI Open Data Awards presented by Sirs Tim Berners-Lee and Nigel Shadbolt”. 2016年3月24日時点のオリジナルよりアーカイブ。2018年11月15日閲覧。
  32. From Freebase to Wikidata: The Great Migration (PDF)”. 2020年2月10日閲覧。
  33. Percentage of articles making use of data from Wikidata”. 2018年11月15日閲覧。
  34. Wikidata Tools - Visualize data”. 2018年11月15日閲覧。
  35. Scholia - Wikidata”. 2018年11月15日閲覧。
  36. International Semantic Web Conference 2018”. 2018年11月15日閲覧。
  37. ARL White Paper on Wikidata Opportunities and Recommendations (PDF)”. 2020年2月10日閲覧。
  38. Integrating Wikidata at the Library of Congress”. 2020年2月10日閲覧。
  39. commons:File talk:Wikidata-logo-en.svg#Hybrid. Retrieved 2016-10-06.

関連項目

外部リンク

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.