医療統計学:オープンデータ

統計学セミナー

医療統計学:オープンデータ

 

オープンデータ

 

オープンデータ(Open Data)とは、特定のデータが、一切の著作権、特許などの制御メカニズムの制限なしで、全ての人が望むように利用・再掲載できるような形で入手できるべきであるというアイデアです。

 

オープンデータ運動のゴールは、オープンソース、オープンコンテント、オープンアクセスなどの、他の「オープン」運動と似ています。オープンデータを支える哲学は古くから確立されているが(マートン・テーゼのように)、「オープンデータ」という言葉自体は、インターネットやワールドワイドウェブの興隆、特に、Data.govのようなオープンデータガバメントイニシアティブによって、近年一般的になってきました。

 

オープンデータの概念は新しいものではありません。しかし、形式的な定義は新しいです。Open Definitionによる形式化は、「オープンデータとは、自由に使えて再利用もでき、かつ誰でも再配布できるようなデータのことです。従うべき決まりは、せいぜい「作者のクレジットを残す」あるいは「同じ条件で配布する」程度である」という命題として要約できます。

 

オープンデータではよく、地図、ゲノム、コネクトーム、化合物、数学や自然科学の数式、医療のデータや実践、バイオサイエンスや生物多様性などのテキストでない素材に焦点が当てられます。商業的な価値があったり、価値のある業績にまとめられることがあるため、よく問題が発生します。データのアクセスや再利用は、公共的にも私的にも組織によってコントロールされます。コントロールはアクセスや再利用への、アクセス制限、ライセンス、著作権、特許や利用料などを通じてなされます。

 

オープンデータの支援者は、これらの制限は公共的な利益に反し、またこれらのデータは一切の制限や課金なしで手に入れられるべきだと主張しています。さらに、データをさらなる許可を要求することなく再利用でき、とはいえ再利用(創造や派生的な成果のような)の形式がライセンスによってコントロールされてよいことが重要です。
オープンデータへのニーズの典型的な描写は、以下のようなものです。

 

データの作者は、しばしば所有権、ライセンス、再利用について述べる必要性について議論しません。例えば、多くの科学者が、彼らの作業から生じた出版されたデータが彼らのコントロール下にあると考えず、論文誌を公刊するということは、暗黙にデータをコモンズに公表することだと考えています。しかし、ライセンスの不足は、データセットの状態を特定することを難しくし、オープンの精神によって提供されたデータの使用を制限するかもしれません。この不確かさのため、IEEEのような公的、私的な組織が、出ているデータを集め、著作権によって制限し、再販することも可能になっています。

 

ConnollyのToward Open Data (2005, v.i.)は、2つの引用を載せています。
私のデータを返して(Jon Bosak circa 1997)
私は、どのアプリケーションの顧客でも、入力したデータは自分のものだとずっと信じていました。

 

オープンデータの主なソース
オープンデータはあらゆるソースを起源とできます。この節では、多くのオープンデータを公開する(もしくは、少なくとも公開が議論されている)いくつかのフィールドを列挙します。

 

科学におけるオープンデータ

 

科学データのオープン・アクセスの概念は、1957-58年の国際地球観測年の準備の中で、世界資料センターの形をとって、組織的に確立されました。国際科学連合評議会(現国際科学会議)は、いくつかの世界資料センターをデータの紛失のリスクを最小化してデータへの入手可能性を最大化するために設立し、さらに1955年にデータはマシン・リーダブルな状態で入手できるべきだと推奨しました。

 

オープンサイエンスデータ運動がインターネットよりずっと先行していたにもかかわらず、高速で遍在するネットワークはオープンサイエンスデータの文脈を著しく変えました。データを公開、取得することが、非常に低価格で時間がかからないようになったのです。

 

2004年に、先進国を含むOECD加盟国の全ての科学担当大臣が、公的資金によるアーカイブデータは公的に利用可能であるべきと本質的に述べる宣言に署名しました。加盟国のデータを提供する機関の要求と集中的な議論を受け、OECDは2007年にOECD Principles and Guidelines for Access to Research Data from Public Funding as a soft-law recommendationを発表しました。

 

科学におけるオープンデータの例:
data.uni-muenster.de - 2011年に設立された、ドイツのミュンスター大学の科学データに関するオープンデータ
linkedscience.org/data - 2011年に設立された、Linked Dataの形式で提供される科学データ

 

政府におけるオープンデータ

 

いくつかの国は、収集したデータの一部を配布するウェブサイトを作成した。それはオープンデータに向けた文化や、オープンガバメントデータを作成、整理するための、地方政府との共同作業のプロジェクトに向けたコンセプトです。200以上の地方、地域、国のオープンデータのカタログが、オープンな情報源のdatacatalogs.orgプロジェクト上で利用可能です。datacatalogs.orgは、世界中のデータカタログの網羅的なリストになることを目指しています。

 

有名な例:
Data.gov - 2009年5月に設立された、アメリカ政府のオープンデータのウェブサイト
Data.gov.uk - 2009年9月に設立された、イギリス政府のオープンデータのウェブサイト
data.govt.nz - 2009年11月に設立された、政府主導のニュージーランド政府のデータをクリエイティブ・コモンズの下で公開するウェブサイト。NZ GOALでさらに詳細に定義されています。
data.norge.no - 2010年4月に設立された、ノルウェー政府のオープンデータのウェブサイト
geodata.gov.gr - 2010年7月21日に設立された、国のイニシアティブとして行われているギリシャのオープンガバメントの地理空間情報のデータ
opengovdata.ru - 2010年に設立された、OpenGovData Russia Catalog。非営利。
Data.gov.au - 2011年3月に設立された、オーストラリア政府のオープンデータのウェブサイト
Data.gov.ma - 2011年4月に設立された、モロッコ政府のオープンデータのウェブサイト.
Data.gc.ca - 2011年3月に設立された、カナダ政府のオープンデータのウェブサイト
data.belgium.be - ベルギー政府のオープンデータのウェブサイト
opendata.go.ke - 2011年7月に設立された、ケニア政府のオープンデータのウェブサイト
data.overheid.nl - 2011年10月に設立された、オランダ政府のオープンデータのウェブサイト
Rotterdam Open Data Store - 2012年8月に設立された、ロッテルダム地方政府のオープンデータのウェブサイト
datos.gob.cl - 2011年9月に設立された、チリ政府のオープンデータのウェブサイト
data.gov.it - 2011年10月に設立された、イタリア政府のオープンデータのウェブサイト

datos.gob.es - 2011年10月に設立された、スペイン政府のオープンデータのウェブサイト
datos.gub.uy - 2011年11月に設立された、ウルグアイ政府のオープンデータのウェブサイト
data.gouv.fr - 2011年12月に設立された、フランス政府のオープンデータのウェブサイト
dados.gov.br - 2011年12月に設立された、ブラジル政府のオープンデータのウェブサイト
www.opendata.ee - エストニア政府のオープンデータのウェブサイト
dados.gov.pt - ポルトガル政府のオープンデータのウェブサイト
date.gov.md - モルドバ政府のオープンデータのウェブサイト
data.gov.in - 2012年に設立された、インド政府のオープンデータのウェブサイト
data.wien.gv.at - 2011年に設立された、ウィーン州政府のオープンデータのウェブサイト

 

オープンデータ戦略の推進

 

 近年、公共データの活用促進、すなわち「オープンデータ」の推進により、行政の透明性・信頼性の向上、国民参加・官民協働の推進、経済の活性化・行政の効率化が三位一体で進むことが期待されています。 ここでは、オープンデータの意義、その内容、我が国政府の取組、総務省の取組及び自治体の取組について紹介します。

 

オープンデータとは

 

政府において、オープンデータとは、「機械判読に適したデータ形式で、二次利用が可能な利用ルールで公開されたデータ」であり「人手を多くかけずにデータの二次利用を可能とするもの」のことを言います。

 

ここでは、オープンデータの意義、目的等について説明します。

 

オープンデータの意義・目的

 

「オープンデータ」と言えるための条件
オープンデータの5つの段階とデータ形式
政府全体の取組

 

オープンデータは、国・地方自治体全てに関わることから、政府が一体となった取組が求められます。
ここでは、政府、特に、高度情報通信ネットワーク社会推進戦略本部(IT総合戦略本部)の取り組みについて紹介します。

 

全体像

 

IT総合戦略本部における取組
電子行政オープンデータ戦略(平成24年7月4日)
電子行政オープンデータ実務者会議(平成24年12月〜)
世界最先端IT国家創造宣言(平成25年6月14日(平成26年6月24日改定))
総務省の取組

 

総務省では、情報通信を所管する官庁として、オープンデータ流通環境の整備を推進しています。
具体的には、(1)オープンデータ実証実験、(2)オープンデータ流通推進コンソーシアム及び(3)総務省保有情報のオープンデータ化の取組の3本柱で取り組んでおり、ここでは、その内容について紹介します。

 

全体像

 

オープンデータ実証実験(平成24年度実証実験/平成25年度実証実験/平成26年度実証実験)
オープンデータ流通推進コンソーシアム
総務省保有情報のオープンデータ化
情報通信白書・情報通信統計データベースのオープンデータ化
統計におけるオープンデータの高度化
地方公共団体・海外における取組

 

地方公共団体・海外における取組について、平成25年版及び平成26年版情報通信白書で紹介しています。

 

地方自治体における先行的取組事例(平成25年版情報通信白書)
鯖江市と横浜市の取組について紹介しています。
地方公共団体・民間における取組事例(平成26年版情報通信白書)
静岡県や流山市の取組のほか、Where Does My Money Go?(税金はどこへ行った)などについて紹介しています。
海外におけるオープンデータに対する戦略的取組(平成25年版情報通信白書)
米国と英国の取組について紹介しています。
海外における取組(平成26年版情報通信白書)
米国と英国の取組について紹介しています。

 

もっと勉強したい方は⇒統計学入門セミナー

 

統計学セミナー

医療統計学は、自己学習ではどうしても時間がかかってしまい効率悪くなりがちです。本セミナー受講により、医療統計学の理論だけでなく実際の作業をどう進めるかなど、具体的な方法を伝授します。これにより、医療統計学の理解が倍増すること間違いなし!この機会にぜひご活用ください。



HOME プロフィール 統計セミナー 出張相談サービス お問い合わせ