日本の官公庁は、様々な調査を通じて国民生活に関係するデータを持っています。
私は、何か仕事で新しい企画などを検討するときには経済産業省が公開しているデータをみたりしますし、金融庁の公開しているデータもみたりもします。
国土交通省の地価データなんてものもみたりします。
とにかく官公庁には色々な統計情報があるのですが、いかんせん使いづらいです。
公開データによっては画像で提供されていたりするので、そのままではシステムで利用できないということも良くあります。
そんなおりに以下のニュースをみつけました。
官民データ活用共通プラットフォーム協議会のほか、データ流通推進協議会や日本IT団体連盟など5団体が2020年12月にも、データガバナンスの推進組織「dataex.jp」を設立する。このほど設立準備協議会を設置し、会長に東京大学の越塚登教授、事務局に日立製作所とNTTデータ経営研究所が就いた。dataex.jpには日立や富士通、NEC、NTTデータ、東大などが参画する見込みで、まずは会員数で2000団体を目指す。
随分前から、官公庁が持っているデータを使い易くするということで様々な団体が活動をしているようですが、あまり状況がよくなっているようには感じておりませんでした。
また、過去に国勢調査では不正もありましたし、データの信憑性が危ぶまれることもありますが、それでもまとまったデータが得られる官公庁サイトは結構重宝しています。
今回日本のデータに関わる5団体が協力するということと、名だたるIT会社が連携するということで、自分たちの利害に重きをおかずに本当の意味でデータの利活用を考えてくれるのであればこれは喜ばしいことです。
できれば調査した結果を加工したデータではなく、加工前の生データが手に入るようになることを望みます。
集計された加工データも調査結果の概要を理解する上では重要です。
一方で統計情報が加工されているとデータの見方が固定化されてしまうこともあるので、加工データと加工前のデータの双方が提供されることが理想です。
あとは、データ収集の方法などが正しく開示されることも重要ですね。
毎年同じ基準でデータ収集ができないこともありますので、そういった年度で違いが出るような条件はかならず明確にしてほしいところです。
その違いを踏まえて、利用者側はデータの活用方法を検討することができます。
あとは、データ毎の項目定義を開示してくれれば良いですね。
似たような調査があったとしても項目定義が違うということが明確になっていれば、データの見方も変わります。
あまり難しいことを考えずに、上に書いたようなことに対応してくれれば、後はデータの利用者側でいかようにも対応可能です。
データカタログとか作るとかに変に労力をかける必要はないと思いますが、本団体が収集・提供するデータへのアクセス権をどのように定義するかは検討が必要でしょうね。
現状、官公庁系の情報はインターネットを通して誰でも参照可能です。
一方で誰でもアクセスして本当に良いデータなのかということには疑問もあります。
政府が集めたデータであれば、国民の税金で当該データ収集を行ったため、国民は観る権利があると考えらえれます。
しかし、Webサイトで公開されるということは全世界からのアクセスも可能となるため、国民以外もこれらの情報へはアクセスできます。
日本の情報を赤裸々に海外に公開している状況を是とするかは今後検討の必要が高まるかもしれません。
先日以下の記事で書いた本を読んだため、少しデータ公開について過敏になっているようには思いますが、安全について考えることは良いことだと思いますのでその点は議論を深めてほしいところですね。
とにかく「dataex.jp」については、今後の動向に注目したいです。