
ポール・アレンがWikidataに資金提供:Wikipedia編集者がより簡単情報入力できるようにするプロジェクト
ジョン・クック著

マイクロソフトの共同創業者ポール・アレンにとって、ここ数週間は実に忙しい日々だった。ポートランド・トレイルブレイザーズの売却に関する噂を鎮圧することから、ジェームズ・キャメロン監督の歴史的な潜水艦による太平洋最深部への航海をライブツイートするために脳科学に3億ドルを寄付することまで、59歳の億万長者にとって、この活動は目まぐるしいほど多忙だった。
そうそう、この中で、アレンが個人情報窃盗の被害者だったことが分かりました。
アレン氏は現在、自身の資金の一部を「Wikidata」という新しいプロジェクトに投入している。これは、Wikipediaの様々なページ間で情報の更新を容易にすることを目的としています。この新しいプロジェクトは、Wikimediaのドイツ語支部から派生したもので、ある編集者がWikipediaのページに変更を加えるだけで、そのトピックに関連する様々な言語のページに反映されるようになります。
仕組みは以下のとおりです:
Wikipediaの記事には、国の人口や俳優の出身地など、コンピュータでは理解しにくい事実や他の記事との関連性が含まれていることがよくあります。Wikidataでは、こうした情報をコンピュータで処理できる形式で入力できます。つまり、機械は情報を様々な言語で提供したり、リストやグラフなどのデータの概要を作成したり、現在では自動で回答することが難しい質問に答えたりできるのです。
Wikidata の最終的な目標は、情報のための共通データ リポジトリを作成することです。
アレン人工知能研究所を通じてこのプロジェクトに寄付を行っているアレン氏に加え、GoogleとIntelの共同創業者であるゴードン・ムーア氏もこの取り組みを支援している。最初の助成金は170万ドルで、Wikidataの開発は来月から開始される予定だ。
新しいプロジェクトに関するプレスリリースは次のとおりです。
国際的なウィキメディア運動のドイツ支部であるウィキメディア・ドイツは、ウィキデータという新しいウィキメディア・プロジェクトの開発を開始しています。ウィキデータは、世界中の知識を共同編集できるデータベースを提供します。その最初の目標は、フリー百科事典であるウィキペディアのすべての記事で使用できる、構造化されたデータの共通ソースで、280を超える言語版ウィキペディアをサポートすることです。例えば、ウィキデータを使用すれば、公共の関心を引く人物の生年月日はすべてのウィキペディアで使用でき、管理も1か所で済みます。さらに、ウィキデータのすべての情報と同様に、生年月日はウィキペディアの外でも自由に使用できます。ウィキデータの背後にある共通ソースの原則により、ウィキペディアの記事内の一貫性と品質が向上し、より小規模な言語版での情報の利用可能性が高まることが期待されます。同時に、ウィキデータは、ウィキペディアで作業する何万人ものボランティアのメンテナンス作業を軽減します。
ウィキメディア・ドイツCEOのパベル・リヒター氏は、ウィキデータのパイオニア精神について次のように述べています。「これは画期的なプロジェクトです。ウィキデータは、40の国際ウィキメディア支部の一つがこれまでに実施した中で最大の技術プロジェクトです。ウィキメディア・ドイツは、このプロジェクトを通じて世界最大の百科事典のデータ管理を大幅に改善できることを大変嬉しく思っており、尽力しています。」
ウィキメディア・プロジェクト以外にも、このデータは多くの外部アプリケーション、特に科学分野、電子政府、そして様々な方法でデータを利用するアプリケーションにおけるデータの注釈付けや関連付けに役立つことが期待されています。データは無料のクリエイティブ・コモンズ・ライセンスの下で公開されます。
Wikidataの初期開発は、130万ユーロという多額の寄付によって賄われており、その半分はアレン人工知能研究所[ai](2)からの助成によるものです。同研究所は、人工知能の進歩を加速させる可能性のある長期的な研究活動を支援しており、マイクロソフトの共同創業者であるポール・G・アレンによって2010年に設立されました。アレンは25年以上にわたり、慈善活動と科学技術の発展に貢献してきました。
「ウィキデータはシンプルかつスマートなアイデアであり、ウィキペディアの進化における独創的な次のステップです」と、アレン人工知能研究所副所長のマーク・グリーブス博士は述べています。「百科事典データの公開、提供、そして世界中の利用者による利用方法を変革するでしょう。ウィキデータは、私たちが長年サポートしてきたセマンティック技術を基盤とし、科学的発見のペースを加速させ、世界にとって驚異的な新たなデータリソースを創出するでしょう。」
Wikidata の初期資金の 4 分の 1 は、Gordon and Betty Moore 財団の科学プログラムを通じて寄付されています。
「これは科学にとって重要です」と、ゴードン・アンド・ベティ・ムーア財団の科学プログラム担当官、クリス・メンツェル氏は述べています。「ウィキデータは、ウィキペディアをベースに重要なデータサービスを提供するだけでなく、研究者にとって使いやすくダウンロード可能なソフトウェアツールとなり、増大する科学データの管理と価値向上を支援します。」
Google社はWikidataへの資金提供の4分の1を提供しています。クリス・ディボナ氏(オープンソース担当ディレクター)は次のように述べています。「Googleの使命は、世界中の情報を誰もがアクセスでき、利用できるようにすることです。そのため、膨大な量の構造化データを誰もが利用できるようにすることを目指したWikidataプロジェクトに参加できることを大変嬉しく思います。」
Wikidataは3つのフェーズに分けて開発されます。第1フェーズは2012年8月までに完了する予定です。このフェーズでは、Wikipediaの異なる言語版間のリンクを一元管理します。第2フェーズでは、編集者がWikidataにデータを追加・利用できるようになります。第2フェーズの成果は2012年12月に公開される予定です。第3フェーズ(最終フェーズ)では、Wikidataのデータに基づいてリストやグラフを自動的に作成できるようになります。これにより、Wikidataの初期開発プロセスは終了します。
ウィキメディア・ドイツは初期開発を行い、その後、プロジェクトの運用と保守をウィキメディア財団に引き継ぎます。これは2013年3月までに完了する予定です。8名の開発者チームは、デニー・ヴランデシック博士が率いています。ヴランデシック博士はカールスルーエ工科大学からウィキメディア・ドイツに移籍し、オックスフォード大学のマルクス・クロッチ博士と共に、セマンティック・メディアウィキ・プロジェクトの共同創設者です。このプロジェクトは、ここ数年間ウィキデータの目標を追求してきました。ウィキデータに関する提案は、EUプロジェクトRENDERの財政支援を受けて作成されました。ウィキメディア・ドイツもこのプロジェクトにユースケースパートナーとして参加しています。