第9-10回情報システム設計論2020

 第9-10回情報システム設計論2020

059fb717431a8cd2b509ffebc57d905a?s=128

Y. Yamamoto

June 23, 2020
Tweet

Transcript

  1. ビッグデータ × ITイノベーション 山本 祐輔 情報システム設計論(2020.6.23 & 6.30) 情報学部 行動情報学科

    yamamoto@inf.shizuoka.ac.jp
  2. ビッグデータって、聞いたことある? Q.

  3. ࣾձͰ͸Ϗοάσʔλ͕ྲྀߦ͍ͬͯΔʂ 画像は「NHKのクローズアップ現代」より

  4. ͱ͋Δ΢ΣϒσβΠϯͷݱ৔ʹͯ Q. どちらのボタンが消費者好みのデザインか? ৄࡉΛݟΔ ৄࡉΛݟΔ

  5. Ϗοάσʔλ࣌୅ҎલͳΒ Q. どちらのボタンが消費者好みのデザインか? デザイナー ターゲットユーザは20代だから おしゃれなデザインが好きなはず… ৄࡉΛݟΔ ৄࡉΛݟΔ シンプルなものよりも見栄えがよい ボタンが良いと思うが…

    プロが経験・知見をもとに方向性(仮説)を決定
  6. ࠶౓࣭໰ Q. どちらのボタンが消費者好みのデザインか? Click Click < 消費者の反応を集めれば デザインの方向性を決定することが可能 ৄࡉΛݟΔ ৄࡉΛݟΔ

  7. https://response.jp/article/2020/04/20/333782.html アプリユーザの位置情報を用いた コロナ禍中の移動量変化の分析

  8. https://www.google.com/covid19/mobility/

  9. ؖࠃͰͷϏοάσʔλ׆༻ࣄྫ http://policytransfer.metropolis.org/case-studies/owl-bus-based-on-big-data-technology 夜間の携帯電話発信情報と交通情報を大量に集めて ニーズが把握しにくい夜間のバスの運行ルートを決定

  10. By Eric Fischer, https://www.flickr.com/photos/walkingsf/5912385701/in/album-72157627140310742/ Ϗοάσʔλͷ͢͝͞: Fruit of BigData データを超大量に集めると 今まで分からなかったことが

    浮かび上がってくる
  11. Ϗοάσʔλ෼ੳ vs. ैདྷͷσʔλ෼ੳ ビッグデータ の分析 仮説発見 従来型の データ分析 仮説検証 (統計的検定・アンケート調査etc.)

    ビッグデータを見れば 「風が吹けば桶屋が儲かる」的価値を発見できる (ルール,モデルの構築)
  12. ༷ʑͳυϝΠϯͰ஫໨͞ΕΔϏοάσʔλ 農業 医療 交通 製薬 観光 防災 気象 広告 流通

    教育 ICT スポーツ 報道 効率化・コスト削減 ビジネスモデルの創造 付加価値の向上 ITへの意識 ビッグデータ
  13. σβΠϯ΁ͷϏοάσʔλ׆༻ྫ • 画像とテキストを与えれるとウェブサイトを自動生成 • 訪問者の行動・反応を解析してデザインを修正 The Grid https://thegrid.io/

  14. The Grid: AI Websites That Design Themselves https://www.youtube.com/watch?v=OXA4-5x31V0

  15. ࿩͍ͨ͜͠ͱ ビッグデータとは何か? なぜ今、ビッグデータなのか? ビッグデータを活用するためには? Q1. Q2. Q3.

  16. ビッグデータとは何か? 1

  17. ϏοάσʔλͱϏδωε *1 鈴木良介著「ビッグデータビジネスの時代」(平成23年11月) *2 McKinsey Global Institute “Big data: The

    next frontier for innovation, competition, and productivity”(平成23年5月) ビッグデータ ビッグデータビジネス ビッグデータを用いて社会・経済の問題解決や、業務の付加価値 向上を行う、あるいは支援する事業 • 事業に役立つ知見を導出するためのデータ • 典型的なDBソフトウェアが把握し、蓄積し、運用し、分析できる 能力を超えたサイズのデータ • 多くの部門において、数十テラバイトから数ペタバイトの範囲
  18. ϏοΫσʔλͷಛ௃3V Volume Velocity Variety データの量が圧倒的に多い データの発生・更新頻度が大きい データの発生源、データの種類が多様

  19. 3V͕ඞཁʹͳΔέʔεྫ: ঎඼ͷਪન 商品A 商品B 商品C 商品D 商品E 山本 • •

    佐藤 • • • 鈴木 • • 伊藤 • • ? Q. 伊藤さんに商品Eを推薦すべきか? A. 購買履歴が類似するユーザの商品を推薦すればよい アイデア • 5つの商品の購買履歴でユーザの好みが分かるか? • 好みが似ているユーザを探すのに3人でよいのか?
  20. ޷ΈΛৄࡉʹௐ΂Δʹ͸ 商品 A 商品 B 商品 C 商品 D 商品

    E F G H I J K L M N O P 山本 • • • • • 佐藤 • • • • • 鈴木 • • • • • • 伊藤 • • ? • • • データの種類を増やす
  21. ޷Έ͕߹͏ਓΛௐ΂Δʹ͸ 商品 A 商品 B 商品 C 商品 D 商品

    E F G H I J K L M N O P 山本 • • • • • 佐藤 • • • • • 鈴木 • • • • • • 伊藤 • • ? • • • 斎藤 • • • • 田中 • 加藤 • • 玉置 • 祇園 • • • • • • 東 • • 河端 • • 烏丸 • • デ ! タ の 量 を 増 や す
  22. ޷Έ͕߹͏ਓΛௐ΂Δʹ͸ 商品 A 商品 B 商品 C 商品 D 商品

    E F G H I J K L M N O P 山本 • • • • • 佐藤 • • • • • 鈴木 • • • • • • 伊藤 • • ? • • • 斎藤 • • • • 田中 • 加藤 • • 玉置 • 祇園 • • • • • • 東 • • 河端 • • 烏丸 • •
  23. ৘ใਪનʹϏοάσʔλΛ׆༻͢ΔAmazon

  24. "QQMF8BUDI͕ूΊΔσʔλ https://www.forbes.com/sites/davidphelan/2018/03/22/apple-watch-plus-cardiogram-can-spot-abnormal-heart-rhythm-better-than-ekg-band-study-says/#46eaba3f4671

  25. https://www.forbes.com/sites/davidphelan/2018/03/22/apple-watch-plus-cardiogram-can-spot-abnormal-heart-rhythm-better-than-ekg-band-study-says/#46eaba3f4671 "QQMF8BUDI͕ूΊΔσʔλ 安静時心拍数 心拍変動 スタンド時間 歩行/走行距離 昇降距離 転倒回数 位置情報 環境音レベル変化

  26. https://www.forbes.com/sites/davidphelan/2018/03/22/apple-watch-plus-cardiogram-can-spot-abnormal-heart-rhythm-better-than-ekg-band-study-says/#46eaba3f4671 "QQMF8BUDI͕ूΊΔσʔλ 安静時心拍数 心拍変動 スタンド時間 歩行/走行距離 昇降距離 転倒回数 位置情報 環境音レベル変化

    多種多様で膨大なデータが随時収集されている
  27. Ϗοάσʔλ & AI Λ׆༻ͨ͠ҩྍܥελʔτΞοϓͷຄڵ https://www.cbinsights.com/research/artificial-intelligence-startups-healthcare/

  28. ビッグデータの用途 http://www.theguardian.com/news/datablog/interactive/2012/oct/25/twitter-languages-london-top-ten セグメント分析 パターン発見 関連性分析 例外検出 最適アクション決定 将来予測

  29. Predictive Policing 犯罪が発生する前に、犯罪現場に警察官を送り込む http://www.nytimes.com/2011/08/16/us/16police.html?_r=0 • 米国サンタクルーズ市警と UCLAとの共同研究 • 犯罪の種類や発生時間、 発生場所などのデータから

    犯罪発生予測モデルを構築 - 犯罪レポート1万1000件/年 - 電話通報記録10万5000件/年 http://itpro.nikkeibp.co.jp/atcl/watcher/14/334361/080100020/?ST=bigdata&P=2 • 電子化された犯罪レポート
  30. কདྷ༧ଌ: ഑ૹ x Ϗοάσʔλ * 画像はhttp://www.mbaskool.com/business-articles/operations/10043-anticipatory-shipping-evolution-in-e-commerce.html * Method and system

    for anticipatory package shipping , US 8615473 B2 注文される確率の高い商品を特定し 発注される前に商品を出荷し始める
  31. なぜ今、ビッグデータなのか? 2

  32. Ϗοάσʔλ͕஫໨͞Ε࢝Ίͨཧ༝ ビッグデータ技術のコモディティ化 情報爆発時代の到来 研究者・ハイテク企業の技術が一般人でも利用可能に 圧倒的なスピードで生成され続けるデータ

  33. Ϗοάσʔλ͕஫໨͞Ε࢝Ίͨཧ༝ ビッグデータ技術のコモディティ化 情報爆発時代の到来 研究者・ハイテク企業の技術が一般人でも利用可能に 圧倒的なスピードで生成され続けるデータ

  34. ৘ใരൃ࣌୅ͷ౸དྷ 39

  35. ৘ใരൃ࣌୅ͷ౸དྷ 40 2010年までにの生成されたデジタルデータの量は 過去発行された紙書籍のデータ量の約1800万倍!! 1ZB(1兆GB) ≒ 988EB(2010) Data volume of

    paper (〜2010) × 1.8 × 107 = Volume of digital data (〜2010)
  36. (出典)情報通信審議会ICT基本戦略ボード「ビッグデータの活用に関するアドホックグループ」資料 ༷ʑͳछྨͷϏοάσʔλ

  37. Ϗοάσʔλ͕஫໨͞Ε࢝Ίͨཧ༝ ビッグデータ技術のコモディティ化 情報爆発時代の到来 研究者・ハイテク企業の技術が一般人でも利用可能に 圧倒的なスピードで生成され続けるデータ

  38. ٕज़ͷίϞσΟςΟԽ for Ϗοάσʔλ 収集技術 蓄積・処理技術 分析技術

  39. ϏοάσʔλऩूͷͨΊͷηϯαʔσόΠεͷීٴ http://itpro.nikkeibp.co.jp/article/Active/20130401/467581/

  40. iPhoneதͷηϯαʔσόΠε • GPS • マイク • 近接センサー • ジャイロセンサー •

    輝度センサー • 電子コンパス • 加速度センサー • 歩数センサー • 指紋センサー • カメラ
  41. ϞϊͷΠϯλʔωοτʢInternet of Thing, IoTʣ モノがインターネットに接続することで 超大規模なデータがリアルタイムに収集可能に http://special.nikkeibp.co.jp/ts/article/ad0c/163883/

  42. ஝ੵɾूੵٕज़ͷਐԽ データの量 デ ! タ の 複 雑 さ "

    多 様 性 # ఆܕԽ͞Εͨ ۀ຿σʔλ Ϗοάσʔλ ʢେྔ ଎͍ ෳࡶʣ
  43. ஝ੵɾूੵٕज़ͷਐԽ データの量 デ ! タ の 複 雑 さ "

    多 様 性 # Ϗοάσʔλ ʢେྔ ଎͍ ෳࡶʣ 関係データベース ◦ 定型データ処理は高速 × データへの柔軟性が低い × スケーラビリティが低い ◦ データの一貫性
  44. ஝ੵɾूੵٕज़ͷਐԽ データの量 デ ! タ の 複 雑 さ "

    多 様 性 # 関係データベース ◦ 定型データ処理は高速 × データへの柔軟性が低い NoSQL ◦ 複雑・大量データの蓄積に最適化 × 集計処理が弱い × スケーラビリティが低い ◦ データの一貫性
  45. ஝ੵɾूੵٕज़ͷਐԽ データの量 デ ! タ の 複 雑 さ "

    多 様 性 # NoSQL ◦ 複雑・大量データの蓄積に最適化 × 集計処理が弱い 関係データベース ◦ 定型データ処理は高速 × データへの柔軟性が低い × スケーラビリティが低い ◦ データの一貫性 MapReduce NoSQLにマッチする 大規模分散技術でカバー
  46. Ϗοάσʔλॲཧٕज़ͷίϞσΟςΟԽ 商用クラウドプラットフォーム 分散 処理 機械 学習 ビッグ3が利用するビッグデータ基盤を 一般人も手軽に利用することが可能に データ 管理

  47. ༷ʑͳϏοάσʔλ෼ੳٕज़ 機械学習 情報検索 自然言語・画像・音声処理 データからパターンを学習し、未知データに対して予測を行う技術 データの中から意図に沿った情報を見つけ出す技術 自然言語・画像・音声の構造・意味を分析する技術 データマイニング データの中から未知の知識を抽出する技術

  48. (PPHMFࣗಈ૸ߦं YϏοάσʔλ http://www.google.com/selfdrivingcar/

  49. ༷ʑͳηϯαʔΛར༻ http://www.google.com/selfdrivingcar/ • 対象物までの距離 • 前方の車の速度 走行距離 車の動きと傾き 周囲(360度)の映像 GPS位置情報

  50. ສΩϩҎ্ͷ૸ߦཤྺσʔλΛ࢖͍ਓ޻஌ೳΛߏங http://www.google.com/selfdrivingcar/ 物体認識 走行経路最適化 パターン分類 車体制御 イベント予測 ビッグデータ × 機械学習

  51. ࣗಈ૸ߦͷ࠷ઌ୺ https://www.youtube.com/watch?v=CqSDWoAhvLU

  52. Ϗοάσʔλ͕࠷΋׆͖Δٕज़ meets BigData!! ?

  53. Ϗοάσʔλ͕࠷΋׆͖Δٕज़ meets BigData!! Deep Learning

  54. AI! ਓ޻஌ೳ! σΟʔϓϥʔχϯά!! ???? 画像出典:NHKスペシャル「AIに聞いてみた どうすんのよ!? ニッポン」 歗⫷⳿ⰩIUUQTXXXBNB[PODPKQEQ#+::$(% 59

  55. ϋΠϓαΠΫϧ 2018ٕज़ͷ੒ख़౓ͱࣾձతద༻౓ͷؔ܎ https://www.gartner.com/smarterwithgartner ディープラーニング Mixed Reality Augmented Reality

  56. ϋΠϓαΠΫϧ2019 https://www.gartner.com/smarterwithgartner

  57. ਓ޻஌ೳ(AI) 人工知能 強いAI 弱いAI (Artificial Intelligence) ➂꟦ך״ֲז荈䠐陎׾䭯׍➂꟦ך ״ֲז濼腉׾׮׏ג⡲噟ָ〳腉ז堣唒 ➂꟦ך濼涸Ⳣ椚ך♧鿇׾垷⦺ׅ׷ 暴㹀㉏겗鍑寸㐻

    ・ 現在行われているAI研究の大半は弱いAIの研究 ⿫罋➂䊨濼腉灇瑔IUUQTXXXBJHBLLBJPSKQXIBUTBJ"*SFTFBSDIIUNM ・ 強いAI研究の成果(e.g. 推論)も人間の知能には遠く及ばず 62
  58. ਓ޻஌ೳͷݚڀτϐοΫ 人工知能 推論 探索 機械学習 知識表現 ˘ 教師あり学習 教師なし学習 強化学習

    ٥ؙٓأةؚٔٝ ٥ر٦ة㖇簭 ٥ⴓ겲 ٥㔐䌓 63
  59. ڭࢣ͋Γֶशɿ෼ྨ໰୊ 歗⫷⳿ⰩIUUQTKBXJLJQFEJBPSHXJLJعةةذت؎ 全長が25cmくらいで,長く伸びた白いヒレ. 白い体に2本の黒い帯.背びれが黄色い. この特徴がある魚は「ハタタテダイ」! 対象を分類する特徴を機械にどう学習させるか? 64

  60. ڭࢣ͋Γֶशʢ1/2ʣ סּ ـٔ 달 뎕 大量のラベル付データ 堣唒㷕统 ،ٕ؞ٔؤي ӧӧך識別に必要となる 特徴と分類ルール

    歗⫷⳿ⰩIUUQTKQNBUIXPSLTDPNIFMQEFFQMFBSOJOHFYBNQMFTWJTVBMJ[FGFBUVSFTPGBDPOWPMVUJPOBMOFVSBMOFUXPSLIUNM 全長が25cmくらいで, 長く伸びた白いヒレ. 白い体に2本の黒い帯. 背びれが黄色い. これは「ハタタテダイ」 大量のラベル(答え)付データを与えて ラベルを分類する特徴とルールを抽出(学習)する 65
  61. ڭࢣ͋Γֶशʢ2/2ʣ סּ ـٔ 달 뎕 大量のラベル付データ 堣唒㷕统 ،ٕ؞ٔؤي 歗⫷⳿ⰩIUUQTKQNBUIXPSLTDPNIFMQEFFQMFBSOJOHFYBNQMFTWJTVBMJ[FGFBUVSFTPGBDPOWPMVUJPOBMOFVSBMOFUXPSLIUNM 大量のラベル(答え)付データを与えて

    ラベルを分類する特徴とルールを抽出(学習)する ➂꟦ָ椚鍑דֹ׷䗳銲כזְ ӧӧך識別に必要となる 特徴と分類ルール 66
  62. ਺ཧతʹߟ͑Δ෼ྨ໰୊ʢ1/2ʣ X 0 Y ? ▲ •と×のデータ集合が与えられたときに, 未知の2次元データが•か×をどう分類する? Q.

  63. ਺ཧతʹߟ͑Δ෼ྨ໰୊ʢ2/2ʣ X 0 Y ? ▲ •と×のデータを2分するような直線を見つける A. 直線より上側なら「×」 直線より上側なら「•」

    ax+by+c=0
  64. σΟʔϓϥʔχϯάʢ1/3ʣ リンゴ スイカ バナナ ドリアン 計算機 ?

  65. σΟʔϓϥʔχϯάʢ2/3ʣ … … … … … リンゴ スイカ バナナ ドリアン

    … ピクセル 毎の色コード 255 28 果物の確率 0 1 0 0 人間にはよく分からない特徴
  66. σΟʔϓϥʔχϯάʢ3/3ʣ … … … … … リンゴ スイカ バナナ ドリアン

    … ピクセル 毎の色コード 60 28 果物の確率 0.2 0.6 0 0 人間にはよく分からない特徴 ◦◦だったら△△になって,△△だったら□□ で… という果てしない数値ルールを学習する
  67. Deep Learning vs Non-deep learning Shallow Deep 表現力が小さい 表現力が大きい 学習が簡単

    学習が難しい
  68. TensorFlow Playground https://playground.tensorflow.org/

  69. LINNE LENS 歗⫷⳿ⰩIUUQTHMPCBMTRVBSFDPNCMPHMJOOFMFOT@EJTQMBZ@GJTI@JOGP 74

  70. 75

  71. IBM Watson 書籍や百科事典など超大量のデータから構築した 知識ベースから正解を探し出す質問応答システム https://www.youtube.com/watch?v=WFR3lOm_xhE

  72. IBM Watson https://www.youtube.com/watch?v=WFR3lOm_xhE

  73. GAN (Generative Adversarial Network) 深層学習を用いたコンテンツの生成 https://thispersondoesnotexist.com

  74. Cycle GAN Jun-Yan Zhu*, Taesung Park*, Phillip Isola, Alexei A.

    Efros: “Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks”, ICCV 2017. ターゲット画像に特定の特徴量(例:服装)を付与する 画像(動画)加工が可能に
  75. Style GAN Yildirim, Gokhan, et al. "Generating High-Resolution Fashion Model

    Images Wearing Custom Outfits." Proceedings of the IEEE International Conference on Computer Vision Workshops. 2019. ターゲット画像に任意の特徴量(例:服装)を加味した 画像生成が可能に
  76. Deep Fake using GAN https://www.youtube.com/watch?v=gLoI9hAX9dw

  77. Qosmo – ܈ूͷಈ͖΍ଐੑΛೝ஌͢ΔAI DJ

  78. GPT2 – OpenAIͷจॻੜ੒ݴޠϞσϧ おそらく当代最高のアメリカ人小説家であり短編作家、 アーネスト・ヘミングウェイがニューヨークに来ることは めったにない。ほとんどの時間をハヴァナから約15km離 れたフィンカ・ヴィヒアの農場で、妻、9人の使用人、52匹 の猫、16匹の犬、数百羽の鳩、3頭の牛と過ごしている。 柵までの道を歩いていくと、戦前にフィンカ・ヴィヒアをよく 訪れていた、太った犬が見えた。犬は本館に向かって道を

    走り、そばには同じ名前の手のひらサイズの牛が立ってい た。前庭には赤いグレイヴィーソースの水たまりができてい て、ヘミングウェイは庭用の椅子に腰を下ろした。 Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language models are unsupervised multitask learners. OpenAI Blog, 1(8), 9.
  79. ؔ܎ͳ͍Α͏Ͱؔ܎͋Δ༨ஊɿ αϧͷࣗࡱΓ https://ja.wikipedia.org/wiki/サルの自撮り 写真家のDavid Slaterは自身の カメラを三脚に設置し,サルが 自撮りをできるような工夫をした. 工夫の甲斐あって,サルの自撮り 写真の回収に成功.Davidはその 写真を発表し,注目を集めた.

    ところが,複数のウェブメディアが サルは法律上の人でないため, 写真に著作権はないと主張し, 当該写真はパブリックドメインの 扱いとして,写真を自サイトに公開. その後,Davidと各種団体は 法廷闘争に…
  80. AIஶ࡞෺͸อޢର৅ͱͨ͠ํ͕Α͍͔ʁ AI著作物は著作権保護対象と するべきか?保護対象としたとき、 著作権は誰にあるのか? Q.

  81. ビッグデータを活用するには? 3

  82. Ϗοάσʔλ x ITΠϊϕʔγϣϯʹ޲͚ͨ՝୊ ビッグデータのリテラシー向上 ビッグデータの価値やつきあい方、本当に分かっていますか? ビッグデータを集めるデザイン データが無ければビッグデータは始まらない… ビッグデータとプライバシー 価値あるビッグデータも利用が進むように制度整備が必要…

  83. Ϗοάσʔλ x ITΠϊϕʔγϣϯʹ޲͚ͨ՝୊ ビッグデータのリテラシー向上 ビッグデータの価値やつきあい方、本当に分かっていますか? ビッグデータを集めるデザイン データが無ければビッグデータは始まらない… ビッグデータとプライバシー 価値あるビッグデータも利用が進むように制度整備が必要…

  84. Ϧςϥγʔ໰୊1: Ϗοάσʔλ׆༻ʹର͢Δཧղෆ଍ これからはエビデンスベースの 行動が大事だって言うしね! ちょっとびっぐデータってやつ を考えてみてよ! 流行に反応する上司 なんだよ、この提案。データから 顧客のニーズが浮かび上がる!? 嘘でしょ!そんなのできたら苦労

    しねぇよ。証拠持ってこいや! ビッグデータを 理解できない上司 組織にビッグデータ活用を浸透させるためにも 上層部にビッグデータの考え方を理解させる必要あり
  85. 21ੈلʹ࠷΋஫໨͞ΕΔ৬ۀͰ͋ΔσʔλαΠΤϯεਓࡐ https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/

  86. Ϧςϥγʔ໰୊2: σʔλαΠΤϯεਓࡐ 深い統計処理・機械学習、データ処理の訓練を受けた大学卒業生の数(2008) 圧倒的に不足している日本のデータサイエンス人材 http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation

  87. ೔ຊͰ΋2017೥ʹશࠃॳͷʮϏοάσʔλʯֶ෦͕ઃཱ΁ http://www.nhk.or.jp/kansai-news/20150706/5846391.html

  88. Ϗοάσʔλ x ITΠϊϕʔγϣϯʹ޲͚ͨ՝୊ ビッグデータのリテラシー向上 ビッグデータの価値やつきあい方、本当に分かっていますか? ビッグデータを集めるデザイン データが無ければビッグデータは始まらない… ビッグデータとプライバシー 価値あるビッグデータも利用が進むように制度整備が必要…

  89. ϏοάσʔλΛऩू͢Δ࢓૊ΈͷσβΠϯ͕ॏཁ ビッグデータ 新たな価値 うちの会社にはありません! どうやって集めたらいいの?

  90. ྫɿഏ͕Μͷը૾਍அΛߦ͏Enlitic 画像出典:https://www.cbinsights.com/blog/ai-startups-fighting-cancer/ 大量の肺の画像データから、 肺がんとそうでない画像パターンを発見

  91. ύλʔϯͷֶशʹ͸େྔͷσʔλඞཁ

  92. ϏοάσʔλΛऩू͢Δ࢓૊ΈͷσβΠϯ͕ॏཁ ビッグデータ 新たな価値 うちの会社にはありません! どうやって集めたらいいの? • 製品/サービスにセンサーを溶け込ませる • データ収集を意識して製品/サービスを作る Hints

  93. ྫ2: ΫϘλࣾͷʮίϝͷඒຯ͕͠͞෼͔ΔʯίϯόΠϯ 画像はhttp://www.nakakyushu-kubota.co.jp/voice/2014/09/24/0933.html

  94. 画像はhttp://www.nakakyushu-kubota.co.jp/voice/2014/09/24/0933.html ྫ2: ΫϘλࣾͷʮίϝͷඒຯ͕͠͞෼͔ΔʯίϯόΠϯ タンパク/水分含量センサー • 収量センサー •

  95. ྫ2: ΫϘλࣾͷʮίϝͷඒຯ͕͠͞෼͔ΔʯίϯόΠϯ 画像はhttps://ksas.kubota.co.jpより データ収集とサービスが連動することで正の循環が生まれる

  96. Ϗοάσʔλ x ITΠϊϕʔγϣϯʹ޲͚ͨ՝୊ ビッグデータのリテラシー向上 ビッグデータの価値やつきあい方、本当に分かっていますか? ビッグデータを集めるデザイン データが無ければビッグデータは始まらない… ビッグデータとプライバシー 価値あるビッグデータも利用が進むように制度整備が必要…

  97. JR౦೔ຊɺSUICA ͷར༻σʔλΛൢച! 画像はhttps://www.jreast.co.jp/card/thankspoint/より 20歳の女性 ・7月7日10時10分にA駅で乗車 ・7月7日11時10分にB駅で下車 ・7月8日8時0分にC駅で乗車…

  98. 画像はhttps://www.jreast.co.jp/card/thankspoint/より JR౦೔ຊɺSUICA ͷར༻σʔλΛൢച • 販売対象データは首都圏約1800駅での 利用履歴データ • 約4300万件のSUICAが対象 • 提供データは「乗車履歴」「年齢」「性別」

    「SUICA IDを分からないようにしたID」
  99. 個人情報を懸念する批判から 一時販売停止へ… 匿名加工情報は個人情報なのか?

  100. 個人情報 生存する個人の情報であって、次のいずれかに該当するもの 1. 当該情報に含まれる氏名、生年月日その他の記述で作られる 記録により、特定の個人を識別することができるもの 2. 個人識別符号が含まれるもの 例:マイナンバー、パスポート番号、DNA、指紋 プライバシー情報 •

    他人にみだりに知られたくない情報 • 法律上は「プライバシー権」という規定はない ݸਓ৘ใͱϓϥΠόγʔ৘ใ
  101. 画像は右より抜粋:https://data.wingarc.com/privacy-infographic-4897

  102. վਖ਼ݸਓ৘ใอޢ๏ͷϙΠϯτ for Ϗοάσʔλར׆༻ଅਐ 特定の個人を識別することができず、元の形に 戻すことができない「匿名加工情報」であれば、 一定の条件の下、本人の同意なしに 第三者に提供できる 画像は右より抜粋:https://data.wingarc.com/privacy-infographic-4897

  103. ๨ΕΒΕΔݖར • 第3者が収集し,ウェブに公開した個人に関する情報はプライバシ ー侵害になる可能性がある • 一方で,「表現の自由」や「知る権利」の侵害の可能性もある ウェブにおけるプライバシー保護に関する権利 https://www.sbbit.jp/article/cont1/34759 EU(ヨーロッパ連合)のGDPR 米国カリフォルニア州のCCPA

    https://cookie-script.com/all-you-need-to-know-about-ccpa.html 国内法・国外法に対応したビッグデータサービスを 構築する必要あり
  104. データサイエンティストになるには? 4

  105. ʢ࠶ܝʣ21ੈلʹ࠷΋஫໨͞ΕΔ৬ۀͰ͋ΔσʔλαΠΤϯεਓࡐ https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/

  106. ෆ଍͢ΔϏοάσʔλ෼ੳਓࡐ

  107. ٸϐονͰ੔උ͞ΕΔσʔλαΠΤϯεڭҭ؀ڥ

  108. None
  109. データサイエンティストには どんなスキル・知識が求められるか? Q.

  110. データサイエンス = 機械学習? = 統計学? = プログラミング?

  111. データサイエンス = 機械学習? = 統計学? = プログラミング? = 計算機科学!!

  112. データ分析に必要な データを収集・構築する データ 構築 前処理 アルゴリズム 適用 評価・分析 σʔλղੳɾ׆༻ͷϓϩηε アルゴリズムを走らせるために

    データをクリーニング,統合,変形 種々のアルゴリズムの 適用・開発 構築したモデルの評価, データマイニングした知見の分析
  113. • データベース • センサーネットワーク データ 構築 前処理 アルゴリズム 適用 評価・分析

    σʔλαΠΤϯεʹඞཁͱͳΔεΩϧ • データラングリング • 自然言語処理 • 音声・画像処理 • 機械学習 • データマイニング • 分散処理 ▪ 必ず必要となる専門スキル ▪ オプションとして必要となる専門スキル 専門スキルを支えるための基本スキル • データ構造 • プログラミング • 線形代数学 • 離散数学 • 数理・統計
  114. • データベース • センサーネットワーク データ 構築 前処理 アルゴリズム 適用 評価・分析

    σʔλαΠΤϯεʹඞཁͱͳΔεΩϧ • データラングリング • 自然言語処理 • 音声・画像処理 • 機械学習 • データマイニング • 分散処理 ▪ 必ず必要となる専門スキル ▪ オプションとして必要となる専門スキル 専門スキルを支えるための基本スキル • データ構造 • プログラミング • 線形代数学 • 離散数学 • 数理・統計 一般人が考えるデータサイエンスはこれ
  115. データ分析に必要な データを収集・構築する データ 構築 前処理 アルゴリズム 適用 評価・分析 σʔλղੳɾ׆༻ͷϓϩηε アルゴリズムを走らせるために

    データをクリーニング,統合,変形 種々のアルゴリズムの 適用・開発 構築したモデルの評価, データマイニングした知見の分析 データ解析の8割は「データ構築と前処理」
  116. https://biz.trans-suite.jp/15958 https://jp.depositphotos.com/ https://ecotopia.earth/article-134/ 情報系学部を卒業して 憧れのデータサイエンティスト として就職!! 期待の新人 データサイエンティスト 職場にはビッグデータ活用という 概念がなく,データ分析できる

    状況ではない. 職場にデータがない or ゴミデータの山 σʔλαΠΤϯε͕ఆண͠ͳ͍اۀͷݱ࣮ データ分析は勉強したが,データ 収集・構築なんて習っていない
  117. σʔλαΠΤϯεͷෆ౎߹ͳਅ࣮ https://tjo.hatenablog.com/entry/2018/04/02/190000 o 同僚・上司からの期待感が 現実とマッチしない o 社内政治が最優先される o データに関わるもの全てを 扱う何でも屋扱いされる

    o 他の事業から孤立した チームで働かされる
  118. σʔλαΠΤϯε͸Ͳ͜ʹ͋Δʁ 機械学習 計算機科学 データ分析の対象 となる分野 数学 統計学 データサイエンス Jeff Ulman,

    “Data Science: Is It Real?”より
  119. ֶशϞσϧͷߏஙɾධՁͷࣗಈԽ΋͋Δఔ౓AIʹ͓೚ͤͰ͖Δ 学習モデルの構築・評価にはもはや人間は必要ない?

  120. σʔλαΠΤϯε࡞ۀͷ෼୲ͱ৬छ https://www.oreilly.com/ideas/data-engineers-vs-data-scientists データサイエンティスト データエンジニア 高度な数学・統計知識 機械学習 高度な分析技術 高度なプログラミング データベース データパイプライン

    分散処理
  121. σʔλαΠΤϯε࡞ۀͷ෼୲ͱ৬छ https://www.oreilly.com/ideas/data-engineers-vs-data-scientists データサイエンティスト データエンジニア 高度な数学・統計知識 機械学習 高度な分析技術 高度なプログラミング データベース データパイプライン

    分散処理 機械学習エンジニア データラングリング 機械学習の運用 機械学習のチューニング
  122. データを超大量に集めれば 見えなかった価値が浮かび上がる 量が質に転換!! ビッグデータ活用に向けた課題 • 組織にビッグデータの活用意識を浸透させるべし • ビッグデータを集める仕組みを作るべし • 改正個人情報保護法、プライバシー問題に対処すべし

    • データサイエンスに必要な要素と人材を理解すべし ·ͱΊ
  123. レポート課題 5

  124. ՝୊಺༰ あなたは現在就職活動中であるとする.あなたは,採用 人数が1名の企業を志望しており,この度その企業から 最終面接に呼ばれたとする.事前情報によると,最終面 接に残った応募者のうち,あなた以外はすべてAI(人工 知能)であることが分かった.志望企業から内定を勝ち 取るためには,「AIよりもあなたを採用した方が企業に とってメリットがある」ことを採用担当にアピールする必 要がある. 生産性の観点から,あなたがAIよりも優れている点を,

    A4用紙0.5〜1ページ程度でアピールせよ.なお,「志望 企業」は自由に設定してよい(志望企業名を出す必要 はない).
  125. Assignment Assume that you were looking for a job now.

    You wanted to get a job offer from a company that will hire just one applicant. Fortunately, the company invited you to a final job interview. You heard from a personnel staff that all applicants except you were artificial intelligence. In order to get a job offer, you need to appeal that you would be more beneficial to the company than the AI applicants. From the aspect of productivity, describe in what points you are superior to AIs in one sheet of A4 paper. Note that you can freely for which company you want to work.
  126. ఏग़ํ๏ 133 提出形態 PDF文書(ファイル名は学籍番号とすること) 提出方法 学務情報システムからのメールに従うこと 提出締め切り 2020年 7月 14日(火)

    23:59
  127. How to submit your assignment 134 File type PDF document(filename

    should be your student ID) How to submit Follow an email from LMS Deadline 2020. 7.14(Tue) 23:59