第3章 異分野データ連携の課題と提言

異分野データ連携のケーススタディを踏まえ、本章では今後取り組むべき技術的、社会的な課題を整理し、それらに対する提言を行う。

3–1 横断的データ利活用のための基盤技術開発

データ形式やAPIの共通化

異分野データをスケーラブルに統合・分析し分野横断的な価値を創出する上で、データを利活用するプラットフォームにおいてデータの構造(シンタックス)や意味(セマンティクス)を共通化したり互換性をもたせることは極めて重要である。特に、実世界を反映した異分野のデータを地理空間上で連携させるためには、データの位置情報を規定する測地系を適切に扱う必要がある。そのため、データの測地系を規定する項目をメタデータに明示的に指定し、プラットフォーム上で測地系の相互変換を可能にすることがデータ連携の利便性向上につながる。また、ベクタ形式かラスタ形式かという根本的な違いに加え、GeoJson、shp、xml、Geotiffなどのデータ構造、テキストや画像やPDFなど多種多様なデータを扱えるようにするため、プラットフォーム上でデータ構造を変換する機能や、画像やPDFなどのデータに対して位置情報を付与する機能などが必要になる。さらに、複雑で巨大な地理空間情報を地域ごとに手軽に扱えるよう空間的に内挿化したりデータ分割する効率的な技術を確立することや、時空間的な変化を有する動的なデータを手軽に扱えるようにするためのAPIなども重要である。こうした実世界データを分野横断的に分析するためには、実世界で発生する様々な事象(イベント)に関する情報を統一的なスキーマで抽象化し、多種多様なデータから実世界の人、モノ、コトに関するイベント情報を抽出し時空間的・意味的な相関関係を発見、予測する技術が必要となる。

データを一元的に検索、入手可能とする一方、情報自体をプラットフォーム運用者に渡すかどうかは選択可能とするために、情報へのリンクのみをプラットフォームに登録するなどして、著作権等知的財産の取扱いに関する懸念に配慮することが求められる。

安心・安全なデータ利活用のための技術

メタデータを充実させ、未知の第三者から入手したデータが何処で生成され、どれくらいの時間にわたり、また何を表すのか、といった素性を詳細に明らかにすることは重要である。例えば、各値がどのようなセンサーで計測されたのか、センサーはキャリブレーションされていたのか、またセンサーの検出限界値はどの程度か、といった事項を明らかにすることによってデータそのもののクオリティを明示できるようにする。また、未知の第三者から入手したデータがどこで生成され、どのような加工を施され、どのような経路をたどってきたものなのか、といった過程を詳細に明らかにできるトレーサビリティ技術や、未知の第三者から入手したデータが本物であり、一切の改竄を含まないことを証明するデータの真贋性保証技術も必要である。

流通を迅速に促すようなデータライセンス、特に公共データについては可能な限りオープンであるべきだが、プライバシー保護は最優先でなされるべきであることは論をまたない。一方で、秘匿化手法の違いにより、情報の利活用の可能性は大きく異なることは念頭に置かれるべきである。今後、IoTの発展により、リアルタイムに極力近いタイミングでの情報流通が可能になることに鑑みると、現時点での秘匿化が十分ではなくなり、取得から公開までの時間に応じて秘匿化の手法を考慮する必要が出てくる。さらに、IoT ではデータの送受信がユーザの介在なしに行われる場合が多いことから、ユーザ自らがデータの提供をコントロールできる機能を提供することが求められる。

また、実世界を反映したデータ利活用においては、データが表す実空間情報に関するコンセンサスの形成も重要である。例えば、地理情報では必ず縮尺が定められており、その縮尺の範囲内では正しい情報であるが、その縮尺を超えた領域での利用については保証されるものではない。また地理情報は作成された瞬間から古いものとなっていき、古い情報もその情報が必要な人にとっては正しく価値がある情報であるが、現時点の情報を必要とする者にとっては誤解を招くものとなる。加えて、情報を作成したものは情報の用途を想定した上で作成するが、その用途を超えた範囲での情報の利用は保証し得ない。こうしたデータが示す情報の有効性についてコンセンサスを形成するための仕組みが必要となる。

スケーラブルなデータ取得・流通・利活用技術の開発

IoT利用、人による参加型センシング、あるいはウェブページからの仮想センシングといった手法のどれを活用するにせよ、データソースの多様化・豊富化によって、より大規模なデータ収集を実現する必要がある。そのために、エッジ、フォグ、クラウドコンピューティングを有効に連携させ、各種処理を最適実行した上で、センサーデータの検索等の高度なオペレーションを実現する必要がある。またアプリケーションからの要求と流通データとの間で、更新の頻度や量などをマッチングさせる技術も必要である。

ビッグデータかつリアルタイムデータの際にすべてのデータをプラットフォーム上にコピーするまたはデータの流通にプラットフォームを必ず介在させることは、プラットフォームの運用費用の面から現実的ではない。そのために、データ自体を登録するだけでなく、データへのリンクを登録することも可能とし、リアルタイムデータやビッグデータに関しては、リンク経由でアクセスすることでプラットフォームに負荷をかけずにデータ流通を可能にすることも必要となる。

マルチスケール、マルチモーダル、マルチメディアなデータ取得収集に対応すべく、データ統合、検索、分析、可視化等においてもスケーラブルな利活用技術の開発が求められる。例えば、2.1節における環境対策支援のケースでは、衛星やライダー観測などを使って取得された大気環境データをもとに、大気モデルによるシミュレーションを用いて地球規模から市町村、道路レベルまでの環境変化をスケーラブルに予測する技術を開発し、広域な環境変化を加味しつつ生活空間の局所的な環境変化を数時間~数日前に予測できるようにすることに取り組んでいる。

3–2 IoT社会に向けたデータ連携基盤の構築

社会システムとデータ連携基盤の統融合

様々なモノや人がつながるIoT社会に向け、これまでのようにオープンデータにより情報資産を共有するだけでなく、データの取得・生成から、収集・分析、フィードバックや行動支援に至るまで、都市や地域全体でデータを有機的に流通させ、データ利活用を通じた社会システムの最適化・効率化を図ることが期待される。データ利活用により社会システムの効率化・最適化を実現するには、データの取得、分析、行動支援をIoT上で有機的に連携させることが重要である。例えば、生活空間に役立つスケールでの環境変化の早期探知や予測、環境変化と様々なリスクの相関を場所・時間毎に学習・予測、早期探知と連動しリスクを効果的に回避・軽減する行動支援、行動支援に沿った実空間データの効果的な収集を繰り返し行うことで、環境変化に適応してIoTシステムをスパイラル的に最適化・効率化することが可能になると考えられる。

自治体や企業等様々なステークホルダーの生産する高付加価値情報により、住民や滞在者の生活の質(QoL)を向上させてくれる街や都市の実現を目指し、実空間情報を含むオープンデータの利活用への期待が高まっている。従来のスマートシティで目指されている都市エネルギーや交通渋滞の解消といったシティオフィスの視点からの都市リソースの最適化機能だけでなく、実空間情報を含むオープンデータの利活用を進めることによって、住民の視点からも、住民のQoLの向上に資するサービスや災害時の安心・安全の保障のためのサービスといった付加価値の高いサービスを容易に実現可能となるソーシャルビッグデータ利活用基盤が重要となってきている。

様々な主体が様々な目的で整備している情報の有効活用や流通促進を図るため、利用者が必要となる地理空間情報や関連する情報がワンストップで検索入手できる仕組みが必要である。国や県などで公開されているオープンデータ以外にも民間企業から提供されている有償コンテンツが広く取り扱われていることから、プラットフォーム上でオンライン決済や購入相談を行なうデータ・マーケット・プレイス機能、データプレビューやマップ機能といった諸機能を通じてクラウド上で操作を可能とすることが考えられる。有償コンテンツの多くは、携帯電話位置情報等に基づくメッシュでの混雑度データや、カープローブ情報等による通行実績データといった時空間単位での動的データであり、これらを政府機関から提供される基盤的な主題図と合わせることで、多種多様なG空間情報のデータ特質を、専門家以外でも直感的に把握することができるようにすることが重要である。

さらに、非常時・平時の両方でデータを利活用できるようにすることも重要である。例えば、2.6節の人流データの場合、災害時には気象データ等と連携させ緊急対応や避難誘導等に活用する一方、平時にはイベント情報等と連携させ商店街や自治体が地域活性化のために活用できるようにすることで、センサーの設置やデータ取得に対する地域住民の理解が得られやすくなり、結果として継続的なデータの収集・更新が可能になりデータの価値を高めることにつながっている。

データ流通から価値流通へのシフト

実空間から直接的に情報を獲得するセンシング技術は情報第一次産業と位置付けられ、第三者から情報を仕入れてそれを処理・加工し新たな情報を生産するのが情報第二次産業である。近年では機械学習技術の発達によってそのような産業の基礎が整いつつあることから、今後は、課金を伴った実空間情報の流れを創出し、実空間に関するデジタル情報を財として流通させるプラットフォームが必須となる。こうしたプラットフォームを実現するには、国、自治体、国、企業、個人など、それぞれのステークホルダーの間でデータの提供とその利活用による対価の関係を構築し相互にインセンティブを持たせることが重要である。

3–3 課題解決指向なデータ利活用

データ駆動型の課題解決

オープンデータの普及に伴い様々なデータを利活用できる機会は増えつつあるものの、未だデータを使ってみるレベルに留まっているのが現状である。課題解決プロセスとデータ利活用プロセスを連携させ、様々なデータを課題解決に積極的に役立てていくことが今後ますます重要になる。

自治体に散在している地域情報は、データ駆動型の地域政策立案の基礎資料としての価値を有しており、産官学民で蓄積されている地理空間情報と組み合わせることで、有効活用することを可能とする。加えて、現在、国レベルでも進められているオープンデータ2.0や、官民データ活用推進基本法をめぐる議論など、今後ますます地方自治体に散在する公共データの利用価値は高まり、これらの公的データの多くがよりオープンに流通されイノベーションを起こす起爆剤になることが期待されている。さらに、大規模災害の頻発する我が国において、データ駆動型の地域政策を多様な主体が迅速に取り組むことが求められている。

また、データ利活用を課題解決における価値を重視した方向に調整、発展させていくことも重要である。例えば、2.1節のゲリラ豪雨対策支援の事例では、センサーデータ解析によるゲリラ豪雨早期探知の正確性の水準等の更なる向上はもちろんのこと、行政の限られた人員で効果的な対策を行うためには、豪雨の発生だけではなくその結果生じる様々なリスクも予測することが重要である。また、2.2節における道路保全業務の支援では、専用検査車による精密な路面状況の検査だけでなく、公用車に搭載した加速度センサーを用いて車種に依存せず日常的に路面性状データを取得し、エリアごとの路面状態を評価・集計し路面の劣化状況を可視化することも業務全体の最適化・効率化にとって有用である。こうした取り組みを成功させるためには、データ保有者自身が認識する小さな課題から始めて、スモールスタートで信頼関係を構築し、然る後にデータ保有者が気づいていなかった利用方法へと発展させることが重要である。例えば、2.3節の事例では、運送事業者やバス事業者の主要な課題は安全運転であったため、運転者の解析からスタートし信頼関係を構築した上で、徐々に公共性のある道路の危険性分析へと展開していくことができた。こうした利活用を成功させるためには、データ保有者の持つ課題に興味を持ち、データ解析を行うことができる研究機関とのマッチングをサポートする組織の介在が必要である。また、大規模なデータの蓄積とそれを活用したサービス基盤技術の開発を可能にするためには、研究機関、メーカーとその顧客企業の3社が密に連携をとることが大切である。研究機関にとっては、普通では扱えないような大規模な実データを用いて学術的成果の実証実験が行えるメリットがあり、メーカーには今後の製品開発に活かせる知見が得られるというメリットがある。顧客企業には、実際の顧客サービスに実験結果が活用できるというメリットがあり、各組織に相互にメリットのある連携が組めていることが成功の鍵となる。

データ利活用を介した協働促進による課題解決

これまでのようにデータを一方的に公開するだけではなく、ガバメント2.0に見られるように、コミュニティ全体で積極的にデータを共有し課題解決に取り組むことが重要である。例えば、2.4節の「みなレポ」システムにおける取組では、市職員の行政業務に関わる都市データの「収集」と「理解」を、市職員が持つスマートフォンやタブレット端末を通じて市職員自身が収集するとともに、収集したデータのラベル付けを行なってもらい、蓄積されたデータに対してリアルタイムな分析を行う。これにより、これまでデータ化がなされていなかった市職員の業務上の発見・知識をビッグデータとして知の情報財とし、収集したデータを業務関係者で迅速に共有することで行政業務の効率化を行うと共に、蓄積されたデータを分析し知識とすることで新たに発生した事象に対する理解・対応を瞬時に行うことを目指している。その他、2.2節の事例では、各自治体が保有する数十~数百台規模の公用車の走行データをカーシェアリングに活用し、市民サービス、社会基盤施設の価値を高める取り組みが進められている。