Upgrade to Pro — share decks privately, control downloads, hide ads and more …

オープンデータの基礎知識

 オープンデータの基礎知識

デジタルツインとそれを活用したエコシステム形成のために必要なオープンデータに関して改めて基礎知識をまとめました。
神CSV、シン・オープンデータ5スターなどの初出しネタも満載。

Sayaka Ishizuka

March 09, 2020
Tweet

More Decks by Sayaka Ishizuka

Other Decks in Technology

Transcript

  1. オープンデータの基礎知識

    View Slide

  2. プロフィール
    本業:横浜市経済局成長戦略推進部新産業創造課ICT専任職
    (局内外におけるICT活用に関するアドバイス、研修などを担当)
    副業:総務省地域情報化アドバイザー、ユニバーサルメニュー普及協会研究員
    サードプレイス:Code for Japan/Code for YOKOHAMA、よこはまYYラボ
    番外:地方公務員が本当にすごい!と思う地方公務員アワード2017受賞
    GovInsider アジアでGovtechを推進する女性55人
    石塚 清香 -Sayaka Ishizuka-

    View Slide

  3. 2
    街にどんなデータが隠れていますか?

    View Slide

  4. 3
    街にどんなデータが隠れていますか?
    電力使用量
    イベント
    飲食店
    車両通行量
    輸出入
    客船入港数
    人口
    立地企業数
    パーソントリップ
    インバウンド
    MICE
    ゴミ収集
    宿泊者数
    工業生産
    公共交通
    水道使用量
    DSM/DEM
    BIM
    都市デザイン
    医療機関
    救命救急
    文化・芸術
    消費活動

    View Slide

  5. 4
    現実世界に溢れるデータを電脳世界で再現する(デジタルツイン)
    エコシステム形成にフィジカル空間を活用
    テクノロジーを漠然と受容することなく、社会実装を強く意識して、国民生活・経済活動の質向上
    のために能動的かつ積極的に活用し、産業競争力の強化、社会課題の解決に役立てる

    View Slide

  6. エコシステム形成にフィジカル空間を活用
    5
    そのためにはサイバー空間側に「データをきちんと送る」ことが重要
    Point!

    View Slide

  7. エコシステム形成にフィジカル空間を活用
    6

    View Slide

  8. エコシステム形成にフィジカル空間を活用
    7
    サイバー空間側のサービスを駆動させるために
    行政も保有情報(データ)を「社会の公共財」として開放
    Open Data

    View Slide

  9. オープンデータとは
    8
    様々なサービスに行政が保有するデータを使えるよう「開放」すること

    View Slide

  10. オープンデータとは
    9
    公開=Publish
    Open=開放
    自由な出入りを許すこと
    使用を許すこと
    様々な主体にデータを使ってもらいたいという思想のもと、より前向きな意味の
    「オープン(開放)」を使用
    ➢ データを活用した課題解決プロセスの創造
    ➢ 協働による社会変革活動の展開

    View Slide

  11. オープンデータ=オープンガバナンスの第一歩
    10

    View Slide

  12. オープンガバナンスとは
    11
    Code for Japan 関治之氏スライドより抜粋(https://speakerdeck.com/codeforjapan/detahuo-yong-togong-chuang
    行政側のオープン化と、市民側の積極的な課題解決への関与をもって
    達成する、社会全体の新しい統治プロセス体系

    View Slide

  13. オープンガバナンスの例
    12
    東京都が新型コロナウイルス感染症対策サイトの
    ソースコードをGitHubにオープンソースとして公開

    View Slide

  14. オープンガバナンスの例
    13
    東京都が新型コロナウイルス感染症対策サイトの
    ソースコードをGitHubにオープンソースとして公開
    2020年3月4日のGitHubリポジトリ開設から4日で
    ✓ 1010コミット
    ✓ 68人のコントリビューター(貢献者)
    ✓ 341のイシュー提示(うち229がクローズ)
    ✓ 451のプルリクエスト(うち362がクローズ)
    ※2020年3月8日7:00現在

    View Slide

  15. オープンガバナンスの例
    14
    なんと!あの有名な台湾のデジタル大臣
    オードリー・タン氏も参戦
    オープンソース万歳

    View Slide

  16. オープンデータと言える条件(1)
    15
    二次利用を許可することを明示
    「クリエイティブコモンズライセンス」
    「この条件を守れば私の作品を自由に使って構いません。」
    という意思表示をするためのツール

    View Slide

  17. オープンデータと言える条件(1)
    16
    オープンデータあるある①
    「オープンデータが改ざんされたらどうするんですか!」
    元データ
    (WEB等)
    悪意のある
    引用
    出典なし
    出典表示
    義務なし
    ファクトチェックできない
    元データ
    (オープンデータ)
    悪意のある
    引用
    出典あり
    出典表示
    義務あり
    ファクトチェックできる
    情報の受け手
    オープンデータは危険性ではなく安全性を高めるための仕組み。

    View Slide

  18. オープンデータと言える条件(2)
    17
    (構造化データ)
    機械可読できる形式であること
    コンピューターは「ちゃんと教えないと
    仕事ができない」ツールだから。
    ✓ どこがイベント名称?
    ✓ どこが日付?
    ✓ どこが対象?
    なんで?
    ???

    View Slide

  19. オープンデータと言える条件(2)
    18
    オープンデータあるある②
    使用前のデータ供養(クレンジング)で力尽きる
    この状態(非構造化)から
    この状態(構造化)にするのが
    クレンジング
    サイバー空間で使えるデータをきちんと送るために、「データの質」に
    も目を向けましょう。

    View Slide

  20. オープンデータと言える条件(2)
    19
    ここの大多数がクレンジング
    作業が必要なデータでは使い
    物になりません。
    最初から電脳世界で扱える
    データのカタチにすることを
    意識してください。
    電脳世界
    現実世界

    View Slide

  21. 5スター・オープンデータ
    20
    段階 公開の状態 データ形式
    ★ オープンライセンスでデータを公開 PDF、JPG
    ★★ コンピュータで処理可能なデータを公開 XLS、DOC
    ★★★ オープンに利用できるフォーマットでデータを公開 XML、CSV
    ★★★★ Web標準(RDF等)のフォーマットでデータを公開 RDF
    ★★★★★ 他へのリンクを入れたデータ(LOD)を公開 Linked-RDF
    編集不可
    編集可
    機械可読
    https://5stardata.info/en/
    オープンデータを機械可読の
    しやすさでランク付け
    ここが問題

    View Slide

  22. なにが起こったか
    21
    神CSVの量産
    神EXCELならぬ

    View Slide

  23. 5スター・オープンデータ
    22
    「XLS(EXCELで扱う形式)
    ではダメだから、CSVにすればいいのね~」
    で、こうなる。

    View Slide

  24. 5スター・オープンデータ
    23
    誰でもできる神CSVの作り方
    ①神EXCELを作ります。セル結合、セル内改行など存分に使いましょう。
    ②[ファイル]⇒[名前を付けて保存]⇒「CSV形式」を選択⇒保存
    ただよう「そうじゃない感」

    View Slide

  25. 提案します
    24
    シン・5スターオープンデータ
    段階 公開の状態 アクション
    ★ 誰でも使ってね!という想いを表そう CCライセンスをつけて出す
    ★★ PDFを卒業してみよう 元データをそのまま出す
    ★★★ ちょっとコンピューターの気持ちになってみよう 構造化データ
    ★★★★ もっといろんなデータとつなげて使ってほしい!
    共通化された語彙を使う
    XML、RDFで出す
    ★★★★★ ワールドワイドにデータをつなげたい! Linked-RDFで出す
    各組織におけるオープンデータへの理解度とデータ運用
    マネジメントのレベルに応じて段階を決める

    View Slide

  26. まとめ
    25
    ➢ 現実世界には色々なデータがあふれている
    ➢ 現実世界にあふれるデータを再現した電脳世界(デジタルツイン)
    を活用して、様々なエコシステムを形成する
    ➢ 行政が持つ情報(データ)もデジタルツインで「社会の公共財」
    として使えるように開放(オープンデータ化)しよう
    ➢ オープンデータによって「透明化・参加・協働」の流れが駆動し、
    市民参加を実現できる
    ➢ 機械可読の正しい形を知った上でオープンデータにしよう

    View Slide

  27. Thank you!!
    本スライドのうち、クリエイティブコモンズライセンスの表示があるスライド
    については、以下のクレジットを入れていただくことで二次利用が可能です。
    © Sayaka Ishizuka :2020

    View Slide