第9-10回情報学総論

 第9-10回情報学総論

059fb717431a8cd2b509ffebc57d905a?s=128

Y. Yamamoto

June 23, 2020
Tweet

Transcript

  1. ビッグデータ × ITイノベーション 山本 祐輔 第9-10回情報学総論(2020.6.24) 情報学部 行動情報学科 yamamoto@inf.shizuoka.ac.jp

  2. ビッグデータって、聞いたことある? Q.

  3. ࣾձͰ͸Ϗοάσʔλ͕ྲྀߦ͍ͬͯΔʂ 画像は「NHKのクローズアップ現代」より

  4. ͱ͋Δ΢ΣϒσβΠϯͷݱ৔ʹͯ Q. どちらのボタンが消費者好みのデザインか? ৄࡉΛݟΔ ৄࡉΛݟΔ

  5. Ϗοάσʔλ࣌୅ҎલͳΒ Q. どちらのボタンが消費者好みのデザインか? デザイナー ターゲットユーザは20代だから おしゃれなデザインが好きなはず… ৄࡉΛݟΔ ৄࡉΛݟΔ シンプルなものよりも見栄えがよい ボタンが良いと思うが…

    プロが経験・知見をもとに方向性(仮説)を決定
  6. ࠶౓࣭໰ Q. どちらのボタンが消費者好みのデザインか? Click Click < 消費者の反応を集めれば デザインの方向性を決定することが可能 ৄࡉΛݟΔ ৄࡉΛݟΔ

  7. https://response.jp/article/2020/04/20/333782.html アプリユーザの位置情報を用いた コロナ禍中の移動量変化の分析

  8. https://www.google.com/covid19/mobility/

  9. ؖࠃͰͷϏοάσʔλ׆༻ࣄྫ http://policytransfer.metropolis.org/case-studies/owl-bus-based-on-big-data-technology 夜間の携帯電話発信情報と交通情報を大量に集めて ニーズが把握しにくい夜間のバスの運行ルートを決定

  10. By Eric Fischer, https://www.flickr.com/photos/walkingsf/5912385701/in/album-72157627140310742/ Ϗοάσʔλͷ͢͝͞: Fruit of BigData データを超大量に集めると 今まで分からなかったことが

    浮かび上がってくる
  11. Ϗοάσʔλ෼ੳ vs. ैདྷͷσʔλ෼ੳ ビッグデータ の分析 仮説発見 従来型の データ分析 仮説検証 (統計的検定・アンケート調査etc.)

    ビッグデータを見れば 「風が吹けば桶屋が儲かる」的価値を発見できる (ルール,モデルの構築)
  12. ༷ʑͳυϝΠϯͰ஫໨͞ΕΔϏοάσʔλ 農業 医療 交通 製薬 観光 防災 気象 広告 流通

    教育 ICT スポーツ 報道 効率化・コスト削減 ビジネスモデルの創造 付加価値の向上 ITへの意識 ビッグデータ
  13. σβΠϯ΁ͷϏοάσʔλ׆༻ྫ • 画像とテキストを与えれるとウェブサイトを自動生成 • 訪問者の行動・反応を解析してデザインを修正 The Grid https://thegrid.io/

  14. The Grid: AI Websites That Design Themselves https://www.youtube.com/watch?v=OXA4-5x31V0

  15. ࿩͍ͨ͜͠ͱ ビッグデータとは何か? なぜ今、ビッグデータなのか? ビッグデータを活用するためには? Q1. Q2. Q3.

  16. ビッグデータとは何か? 1

  17. ϏοάσʔλͱϏδωε *1 鈴木良介著「ビッグデータビジネスの時代」(平成23年11月) *2 McKinsey Global Institute “Big data: The

    next frontier for innovation, competition, and productivity”(平成23年5月) ビッグデータ ビッグデータビジネス ビッグデータを用いて社会・経済の問題解決や、業務の付加価値 向上を行う、あるいは支援する事業 • 事業に役立つ知見を導出するためのデータ • 典型的なDBソフトウェアが把握し、蓄積し、運用し、分析できる 能力を超えたサイズのデータ • 多くの部門において、数十テラバイトから数ペタバイトの範囲
  18. ϏοΫσʔλͷಛ௃3V Volume Velocity Variety データの量が圧倒的に多い データの発生・更新頻度が大きい データの発生源、データの種類が多様

  19. 3V͕ඞཁʹͳΔέʔεྫ: ঎඼ͷਪન 商品A 商品B 商品C 商品D 商品E 山本 • •

    佐藤 • • • 鈴木 • • 伊藤 • • ? Q. 伊藤さんに商品Eを推薦すべきか? A. 購買履歴が類似するユーザの商品を推薦すればよい アイデア • 5つの商品の購買履歴でユーザの好みが分かるか? • 好みが似ているユーザを探すのに3人でよいのか?
  20. ޷ΈΛৄࡉʹௐ΂Δʹ͸ 商品 A 商品 B 商品 C 商品 D 商品

    E F G H I J K L M N O P 山本 • • • • • 佐藤 • • • • • 鈴木 • • • • • • 伊藤 • • ? • • • データの種類を増やす
  21. ޷Έ͕߹͏ਓΛௐ΂Δʹ͸ 商品 A 商品 B 商品 C 商品 D 商品

    E F G H I J K L M N O P 山本 • • • • • 佐藤 • • • • • 鈴木 • • • • • • 伊藤 • • ? • • • 斎藤 • • • • 田中 • 加藤 • • 玉置 • 祇園 • • • • • • 東 • • 河端 • • 烏丸 • • デ ! タ の 量 を 増 や す
  22. ޷Έ͕߹͏ਓΛௐ΂Δʹ͸ 商品 A 商品 B 商品 C 商品 D 商品

    E F G H I J K L M N O P 山本 • • • • • 佐藤 • • • • • 鈴木 • • • • • • 伊藤 • • ? • • • 斎藤 • • • • 田中 • 加藤 • • 玉置 • 祇園 • • • • • • 東 • • 河端 • • 烏丸 • •
  23. ৘ใਪનʹϏοάσʔλΛ׆༻͢ΔAmazon

  24. "QQMF8BUDI͕ूΊΔσʔλ https://www.forbes.com/sites/davidphelan/2018/03/22/apple-watch-plus-cardiogram-can-spot-abnormal-heart-rhythm-better-than-ekg-band-study-says/#46eaba3f4671

  25. https://www.forbes.com/sites/davidphelan/2018/03/22/apple-watch-plus-cardiogram-can-spot-abnormal-heart-rhythm-better-than-ekg-band-study-says/#46eaba3f4671 "QQMF8BUDI͕ूΊΔσʔλ 安静時心拍数 心拍変動 スタンド時間 歩行/走行距離 昇降距離 転倒回数 位置情報 環境音レベル変化

  26. https://www.forbes.com/sites/davidphelan/2018/03/22/apple-watch-plus-cardiogram-can-spot-abnormal-heart-rhythm-better-than-ekg-band-study-says/#46eaba3f4671 "QQMF8BUDI͕ूΊΔσʔλ 安静時心拍数 心拍変動 スタンド時間 歩行/走行距離 昇降距離 転倒回数 位置情報 環境音レベル変化

    多種多様で膨大なデータが随時収集されている
  27. Ϗοάσʔλ & AI Λ׆༻ͨ͠ҩྍܥελʔτΞοϓͷຄڵ https://www.cbinsights.com/research/artificial-intelligence-startups-healthcare/

  28. 5PQ5XJUUFSOPO&OHMJTIMBOHVBHFTJO-POEPO http://www.theguardian.com/news/datablog/interactive/2012/oct/25/twitter-languages-london-top-ten

  29. ビッグデータの用途 http://www.theguardian.com/news/datablog/interactive/2012/oct/25/twitter-languages-london-top-ten セグメント分析 パターン発見 関連性分析 例外検出 最適アクション決定 将来予測

  30. ࠷దΞΫγϣϯܾఆ: ೶ۀ x Ϗοάσʔλ ワインの品質をビッグデータで高めるFruition Science • ブドウの木に取り付ける 特殊センサーを開発 •

    モニタリング結果から最適な 水あげ量、タイミングを予測 • 木の状態、天気、土湿度、 木の配置などをモニタリング http://www.wired.com/2012/10/mf-fruition-sciences-winemakers/all/
  31. Predictive Policing 犯罪が発生する前に、犯罪現場に警察官を送り込む http://www.nytimes.com/2011/08/16/us/16police.html?_r=0 • 米国サンタクルーズ市警と UCLAとの共同研究 • 犯罪の種類や発生時間、 発生場所などのデータから

    犯罪発生予測モデルを構築 - 犯罪レポート1万1000件/年 - 電話通報記録10万5000件/年 http://itpro.nikkeibp.co.jp/atcl/watcher/14/334361/080100020/?ST=bigdata&P=2 • 電子化された犯罪レポート
  32. কདྷ༧ଌ: ഑ૹ x Ϗοάσʔλ * 画像はhttp://www.mbaskool.com/business-articles/operations/10043-anticipatory-shipping-evolution-in-e-commerce.html * Method and system

    for anticipatory package shipping , US 8615473 B2 注文される確率の高い商品を特定し 発注される前に商品を出荷し始める
  33. なぜ今、ビッグデータなのか? 2

  34. Ϗοάσʔλ͕஫໨͞Ε࢝Ίͨཧ༝ ビッグデータ技術のコモディティ化 情報爆発時代の到来 研究者・ハイテク企業の技術が一般人でも利用可能に 圧倒的なスピードで生成され続けるデータ

  35. Ϗοάσʔλ͕஫໨͞Ε࢝Ίͨཧ༝ ビッグデータ技術のコモディティ化 情報爆発時代の到来 研究者・ハイテク企業の技術が一般人でも利用可能に 圧倒的なスピードで生成され続けるデータ

  36. ৘ใരൃ࣌୅ͷ౸དྷ 38

  37. ৘ใരൃ࣌୅ͷ౸དྷ 39 2010年までにの生成されたデジタルデータの量は 過去発行された紙書籍のデータ量の約1800万倍!! 1ZB(1兆GB) ≒ 988EB(2010) Data volume of

    paper (〜2010) × 1.8 × 107 = Volume of digital data (〜2010)
  38. (出典)情報通信審議会ICT基本戦略ボード「ビッグデータの活用に関するアドホックグループ」資料 ༷ʑͳछྨͷϏοάσʔλ

  39. Ϗοάσʔλ͕஫໨͞Ε࢝Ίͨཧ༝ ビッグデータ技術のコモディティ化 情報爆発時代の到来 研究者・ハイテク企業の技術が一般人でも利用可能に 圧倒的なスピードで生成され続けるデータ

  40. ٕज़ͷίϞσΟςΟԽ for Ϗοάσʔλ 収集技術 蓄積・処理技術 分析技術

  41. ϏοάσʔλऩूͷͨΊͷηϯαʔσόΠεͷීٴ http://itpro.nikkeibp.co.jp/article/Active/20130401/467581/

  42. iPhoneதͷηϯαʔσόΠε • GPS • マイク • 近接センサー • ジャイロセンサー •

    輝度センサー • 電子コンパス • 加速度センサー • 歩数センサー • 指紋センサー • カメラ
  43. ϞϊͷΠϯλʔωοτʢInternet of Thing, IoTʣ モノがインターネットに接続することで 超大規模なデータがリアルタイムに収集可能に http://special.nikkeibp.co.jp/ts/article/ad0c/163883/

  44. ஝ੵɾूੵٕज़ͷਐԽ データの量 デ ! タ の 複 雑 さ "

    多 様 性 # ఆܕԽ͞Εͨ ۀ຿σʔλ Ϗοάσʔλ ʢେྔ ଎͍ ෳࡶʣ
  45. ஝ੵɾूੵٕज़ͷਐԽ データの量 デ ! タ の 複 雑 さ "

    多 様 性 # Ϗοάσʔλ ʢେྔ ଎͍ ෳࡶʣ 関係データベース ◦ 定型データ処理は高速 × データへの柔軟性が低い × スケーラビリティが低い ◦ データの一貫性
  46. ஝ੵɾूੵٕज़ͷਐԽ データの量 デ ! タ の 複 雑 さ "

    多 様 性 # 関係データベース ◦ 定型データ処理は高速 × データへの柔軟性が低い NoSQL ◦ 複雑・大量データの蓄積に最適化 × 集計処理が弱い × スケーラビリティが低い ◦ データの一貫性
  47. ஝ੵɾूੵٕज़ͷਐԽ データの量 デ ! タ の 複 雑 さ "

    多 様 性 # NoSQL ◦ 複雑・大量データの蓄積に最適化 × 集計処理が弱い 関係データベース ◦ 定型データ処理は高速 × データへの柔軟性が低い × スケーラビリティが低い ◦ データの一貫性 MapReduce NoSQLにマッチする 大規模分散技術でカバー
  48. Ϗοάσʔλॲཧٕज़ͷίϞσΟςΟԽ 商用クラウドプラットフォーム 分散 処理 機械 学習 ビッグ3が利用するビッグデータ基盤を 一般人も手軽に利用することが可能に データ 管理

  49. ༷ʑͳϏοάσʔλ෼ੳٕज़ 機械学習 情報検索 自然言語・画像・音声処理 データからパターンを学習し、未知データに対して予測を行う技術 データの中から意図に沿った情報を見つけ出す技術 自然言語・画像・音声の構造・意味を分析する技術 データマイニング データの中から未知の知識を抽出する技術

  50. (PPHMFࣗಈ૸ߦं YϏοάσʔλ http://www.google.com/selfdrivingcar/

  51. ༷ʑͳηϯαʔΛར༻ http://www.google.com/selfdrivingcar/ • 対象物までの距離 • 前方の車の速度 走行距離 車の動きと傾き 周囲(360度)の映像 GPS位置情報

  52. ສΩϩҎ্ͷ૸ߦཤྺσʔλΛ࢖͍ਓ޻஌ೳΛߏங http://www.google.com/selfdrivingcar/ 物体認識 走行経路最適化 パターン分類 車体制御 イベント予測 ビッグデータ × 機械学習

  53. ࣗಈ૸ߦͷ࠷ઌ୺ https://www.youtube.com/watch?v=CqSDWoAhvLU

  54. Ϗοάσʔλ͕࠷΋׆͖Δٕज़ meets BigData!! ?

  55. Ϗοάσʔλ͕࠷΋׆͖Δٕज़ meets BigData!! Deep Learning

  56. AI! ਓ޻஌ೳ! σΟʔϓϥʔχϯά!! ???? 画像出典:NHKスペシャル「AIに聞いてみた どうすんのよ!? ニッポン」 歗⫷⳿ⰩIUUQTXXXBNB[PODPKQEQ#+::$(% 58

  57. ϋΠϓαΠΫϧ 2018ٕज़ͷ੒ख़౓ͱࣾձతద༻౓ͷؔ܎ https://www.gartner.com/smarterwithgartner ディープラーニング Mixed Reality Augmented Reality

  58. ϋΠϓαΠΫϧ2019 https://www.gartner.com/smarterwithgartner

  59. ਓ޻஌ೳ(AI) 人工知能 強いAI 弱いAI (Artificial Intelligence) ➂꟦ך״ֲז荈䠐陎׾䭯׍➂꟦ך ״ֲז濼腉׾׮׏ג⡲噟ָ〳腉ז堣唒 ➂꟦ך濼涸Ⳣ椚ך♧鿇׾垷⦺ׅ׷ 暴㹀㉏겗鍑寸㐻

    ・ 現在行われているAI研究の大半は弱いAIの研究 ⿫罋➂䊨濼腉灇瑔IUUQTXXXBJHBLLBJPSKQXIBUTBJ"*SFTFBSDIIUNM ・ 強いAI研究の成果(e.g. 推論)も人間の知能には遠く及ばず 61
  60. ਓ޻஌ೳͷݚڀτϐοΫ 人工知能 推論 探索 機械学習 知識表現 ˘ 教師あり学習 教師なし学習 強化学習

    ٥ؙٓأةؚٔٝ ٥ر٦ة㖇簭 ٥ⴓ겲 ٥㔐䌓 62
  61. ڭࢣ͋Γֶशɿ෼ྨ໰୊ 歗⫷⳿ⰩIUUQTKBXJLJQFEJBPSHXJLJعةةذت؎ 全長が25cmくらいで,長く伸びた白いヒレ. 白い体に2本の黒い帯.背びれが黄色い. この特徴がある魚は「ハタタテダイ」! 対象を分類する特徴を機械にどう学習させるか? 63

  62. ڭࢣ͋Γֶशʢ1/2ʣ סּ ـٔ 달 뎕 大量のラベル付データ 堣唒㷕统 ،ٕ؞ٔؤي ӧӧך識別に必要となる 特徴と分類ルール

    歗⫷⳿ⰩIUUQTKQNBUIXPSLTDPNIFMQEFFQMFBSOJOHFYBNQMFTWJTVBMJ[FGFBUVSFTPGBDPOWPMVUJPOBMOFVSBMOFUXPSLIUNM 全長が25cmくらいで, 長く伸びた白いヒレ. 白い体に2本の黒い帯. 背びれが黄色い. これは「ハタタテダイ」 大量のラベル(答え)付データを与えて ラベルを分類する特徴とルールを抽出(学習)する 64
  63. ڭࢣ͋Γֶशʢ2/2ʣ סּ ـٔ 달 뎕 大量のラベル付データ 堣唒㷕统 ،ٕ؞ٔؤي 歗⫷⳿ⰩIUUQTKQNBUIXPSLTDPNIFMQEFFQMFBSOJOHFYBNQMFTWJTVBMJ[FGFBUVSFTPGBDPOWPMVUJPOBMOFVSBMOFUXPSLIUNM 大量のラベル(答え)付データを与えて

    ラベルを分類する特徴とルールを抽出(学習)する ➂꟦ָ椚鍑דֹ׷䗳銲כזְ ӧӧך識別に必要となる 特徴と分類ルール 65
  64. ਺ཧతʹߟ͑Δ෼ྨ໰୊ʢ1/2ʣ X 0 Y ? ▲ •と×のデータ集合が与えられたときに, 未知の2次元データが•か×をどう分類する? Q.

  65. ਺ཧతʹߟ͑Δ෼ྨ໰୊ʢ2/2ʣ X 0 Y ? ▲ •と×のデータを2分するような直線を見つける A. 直線より上側なら「×」 直線より上側なら「•」

    ax+by+c=0
  66. σΟʔϓϥʔχϯάʢ1/3ʣ リンゴ スイカ バナナ ドリアン 計算機 ?

  67. σΟʔϓϥʔχϯάʢ2/3ʣ … … … … … リンゴ スイカ バナナ ドリアン

    … ピクセル 毎の色コード 255 28 果物の確率 0 1 0 0 人間にはよく分からない特徴
  68. σΟʔϓϥʔχϯάʢ3/3ʣ … … … … … リンゴ スイカ バナナ ドリアン

    … ピクセル 毎の色コード 60 28 果物の確率 0.2 0.6 0 0 人間にはよく分からない特徴 ◦◦だったら△△になって,△△だったら□□ で… という果てしない数値ルールを学習する
  69. Deep Learning vs Non-deep learning Shallow Deep 表現力が小さい 表現力が大きい 学習が簡単

    学習が難しい
  70. TensorFlow Playground https://playground.tensorflow.org/

  71. LINNE LENS 歗⫷⳿ⰩIUUQTHMPCBMTRVBSFDPNCMPHMJOOFMFOT@EJTQMBZ@GJTI@JOGP 73

  72. 74

  73. IBM Watson 書籍や百科事典など超大量のデータから構築した 知識ベースから正解を探し出す質問応答システム https://www.youtube.com/watch?v=WFR3lOm_xhE

  74. IBM Watson https://www.youtube.com/watch?v=WFR3lOm_xhE

  75. GAN (Generative Adversarial Network) 深層学習を用いたコンテンツの生成 https://thispersondoesnotexist.com

  76. Cycle GAN Jun-Yan Zhu*, Taesung Park*, Phillip Isola, Alexei A.

    Efros: “Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks”, ICCV 2017. ターゲット画像に特定の特徴量(例:服装)を付与する 画像(動画)加工が可能に
  77. Style GAN Yildirim, Gokhan, et al. "Generating High-Resolution Fashion Model

    Images Wearing Custom Outfits." Proceedings of the IEEE International Conference on Computer Vision Workshops. 2019. ターゲット画像に任意の特徴量(例:服装)を加味した 画像生成が可能に
  78. Deep Fake using GAN https://www.youtube.com/watch?v=gLoI9hAX9dw

  79. Qosmo – ܈ूͷಈ͖΍ଐੑΛೝ஌͢ΔAI DJ

  80. GPT2 – OpenAIͷจॻੜ੒ݴޠϞσϧ おそらく当代最高のアメリカ人小説家であり短編作家、 アーネスト・ヘミングウェイがニューヨークに来ることは めったにない。ほとんどの時間をハヴァナから約15km離 れたフィンカ・ヴィヒアの農場で、妻、9人の使用人、52匹 の猫、16匹の犬、数百羽の鳩、3頭の牛と過ごしている。 柵までの道を歩いていくと、戦前にフィンカ・ヴィヒアをよく 訪れていた、太った犬が見えた。犬は本館に向かって道を

    走り、そばには同じ名前の手のひらサイズの牛が立ってい た。前庭には赤いグレイヴィーソースの水たまりができてい て、ヘミングウェイは庭用の椅子に腰を下ろした。 Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language models are unsupervised multitask learners. OpenAI Blog, 1(8), 9.
  81. ؔ܎ͳ͍Α͏Ͱؔ܎͋Δ༨ஊɿ αϧͷࣗࡱΓ https://ja.wikipedia.org/wiki/サルの自撮り 写真家のDavid Slaterは自身の カメラを三脚に設置し,サルが 自撮りをできるような工夫をした. 工夫の甲斐あって,サルの自撮り 写真の回収に成功.Davidはその 写真を発表し,注目を集めた.

    ところが,複数のウェブメディアが サルは法律上の人でないため, 写真に著作権はないと主張し, 当該写真はパブリックドメインの 扱いとして,写真を自サイトに公開. その後,Davidと各種団体は 法廷闘争に…
  82. AIஶ࡞෺͸อޢର৅ͱͨ͠ํ͕Α͍͔ʁ AI著作物は著作権保護対象と するべきか?保護対象としたとき、 著作権は誰にあるのか? Q.

  83. ビッグデータを活用するには? 3

  84. Ϗοάσʔλ x ITΠϊϕʔγϣϯʹ޲͚ͨ՝୊ ビッグデータのリテラシー向上 ビッグデータの価値やつきあい方、本当に分かっていますか? ビッグデータを集めるデザイン データが無ければビッグデータは始まらない… ビッグデータとプライバシー 価値あるビッグデータも利用が進むように制度整備が必要…

  85. Ϗοάσʔλ x ITΠϊϕʔγϣϯʹ޲͚ͨ՝୊ ビッグデータのリテラシー向上 ビッグデータの価値やつきあい方、本当に分かっていますか? ビッグデータを集めるデザイン データが無ければビッグデータは始まらない… ビッグデータとプライバシー 価値あるビッグデータも利用が進むように制度整備が必要…

  86. Ϧςϥγʔ໰୊1: Ϗοάσʔλ׆༻ʹର͢Δཧղෆ଍ これからはエビデンスベースの 行動が大事だって言うしね! ちょっとびっぐデータってやつ を考えてみてよ! 流行に反応する上司 なんだよ、この提案。データから 顧客のニーズが浮かび上がる!? 嘘でしょ!そんなのできたら苦労

    しねぇよ。証拠持ってこいや! ビッグデータを 理解できない上司 組織にビッグデータ活用を浸透させるためにも 上層部にビッグデータの考え方を理解させる必要あり
  87. 21ੈلʹ࠷΋஫໨͞ΕΔ৬ۀͰ͋ΔσʔλαΠΤϯεਓࡐ https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/

  88. Ϧςϥγʔ໰୊2: σʔλαΠΤϯεਓࡐ 深い統計処理・機械学習、データ処理の訓練を受けた大学卒業生の数(2008) 圧倒的に不足している日本のデータサイエンス人材 http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation

  89. ೔ຊͰ΋2017೥ʹશࠃॳͷʮϏοάσʔλʯֶ෦͕ઃཱ΁ http://www.nhk.or.jp/kansai-news/20150706/5846391.html

  90. Ϗοάσʔλ x ITΠϊϕʔγϣϯʹ޲͚ͨ՝୊ ビッグデータのリテラシー向上 ビッグデータの価値やつきあい方、本当に分かっていますか? ビッグデータを集めるデザイン データが無ければビッグデータは始まらない… ビッグデータとプライバシー 価値あるビッグデータも利用が進むように制度整備が必要…

  91. ϏοάσʔλΛऩू͢Δ࢓૊ΈͷσβΠϯ͕ॏཁ ビッグデータ 新たな価値 うちの会社にはありません! どうやって集めたらいいの?

  92. ྫɿഏ͕Μͷը૾਍அΛߦ͏Enlitic 画像出典:https://www.cbinsights.com/blog/ai-startups-fighting-cancer/ 大量の肺の画像データから、 肺がんとそうでない画像パターンを発見

  93. ύλʔϯͷֶशʹ͸େྔͷσʔλඞཁ

  94. ϏοάσʔλΛऩू͢Δ࢓૊ΈͷσβΠϯ͕ॏཁ ビッグデータ 新たな価値 うちの会社にはありません! どうやって集めたらいいの? • 製品/サービスにセンサーを溶け込ませる • データ収集を意識して製品/サービスを作る Hints

  95. ྫ2: ΫϘλࣾͷʮίϝͷඒຯ͕͠͞෼͔ΔʯίϯόΠϯ 画像はhttp://www.nakakyushu-kubota.co.jp/voice/2014/09/24/0933.html

  96. 画像はhttp://www.nakakyushu-kubota.co.jp/voice/2014/09/24/0933.html ྫ2: ΫϘλࣾͷʮίϝͷඒຯ͕͠͞෼͔ΔʯίϯόΠϯ タンパク/水分含量センサー • 収量センサー •

  97. ྫ2: ΫϘλࣾͷʮίϝͷඒຯ͕͠͞෼͔ΔʯίϯόΠϯ 画像はhttps://ksas.kubota.co.jpより データ収集とサービスが連動することで正の循環が生まれる

  98. Ϗοάσʔλ x ITΠϊϕʔγϣϯʹ޲͚ͨ՝୊ ビッグデータのリテラシー向上 ビッグデータの価値やつきあい方、本当に分かっていますか? ビッグデータを集めるデザイン データが無ければビッグデータは始まらない… ビッグデータとプライバシー 価値あるビッグデータも利用が進むように制度整備が必要…

  99. JR౦೔ຊɺSUICA ͷར༻σʔλΛൢച! 画像はhttps://www.jreast.co.jp/card/thankspoint/より 20歳の女性 ・7月7日10時10分にA駅で乗車 ・7月7日11時10分にB駅で下車 ・7月8日8時0分にC駅で乗車…

  100. 画像はhttps://www.jreast.co.jp/card/thankspoint/より JR౦೔ຊɺSUICA ͷར༻σʔλΛൢച • 販売対象データは首都圏約1800駅での 利用履歴データ • 約4300万件のSUICAが対象 • 提供データは「乗車履歴」「年齢」「性別」

    「SUICA IDを分からないようにしたID」
  101. 個人情報を懸念する批判から 一時販売停止へ… 匿名加工情報は個人情報なのか?

  102. 個人情報 生存する個人の情報であって、次のいずれかに該当するもの 1. 当該情報に含まれる氏名、生年月日その他の記述で作られる 記録により、特定の個人を識別することができるもの 2. 個人識別符号が含まれるもの 例:マイナンバー、パスポート番号、DNA、指紋 プライバシー情報 •

    他人にみだりに知られたくない情報 • 法律上は「プライバシー権」という規定はない ݸਓ৘ใͱϓϥΠόγʔ৘ใ
  103. 画像は右より抜粋:https://data.wingarc.com/privacy-infographic-4897

  104. վਖ਼ݸਓ৘ใอޢ๏ͷϙΠϯτ for Ϗοάσʔλར׆༻ଅਐ 特定の個人を識別することができず、元の形に 戻すことができない「匿名加工情報」であれば、 一定の条件の下、本人の同意なしに 第三者に提供できる 画像は右より抜粋:https://data.wingarc.com/privacy-infographic-4897

  105. ๨ΕΒΕΔݖར • 第3者が収集し,ウェブに公開した個人に関する情報はプライバシ ー侵害になる可能性がある • 一方で,「表現の自由」や「知る権利」の侵害の可能性もある ウェブにおけるプライバシー保護に関する権利 https://www.sbbit.jp/article/cont1/34759 EU(ヨーロッパ連合)のGDPR 米国カリフォルニア州のCCPA

    https://cookie-script.com/all-you-need-to-know-about-ccpa.html 国内法・国外法に対応したビッグデータサービスを 構築する必要あり
  106. データを超大量に集めれば 見えなかった価値が浮かび上がる 量が質に転換!! ビッグデータ活用に向けた課題 • 組織にビッグデータの活用意識を浸透させるべし • ビッグデータを集める仕組みを作るべし • 改正個人情報保護法、プライバシー問題に対処すべし

    • データサイエンスに必要な要素と人材を理解すべし ·ͱΊ