Upgrade to Pro — share decks privately, control downloads, hide ads and more …

第9-10回情報システム設計論2020

 第9-10回情報システム設計論2020

Y. Yamamoto

June 23, 2020
Tweet

More Decks by Y. Yamamoto

Other Decks in Technology

Transcript

  1. Ϗοάσʔλ෼ੳ vs. ैདྷͷσʔλ෼ੳ ビッグデータ の分析 仮説発見 従来型の データ分析 仮説検証 (統計的検定・アンケート調査etc.)

    ビッグデータを見れば 「風が吹けば桶屋が儲かる」的価値を発見できる (ルール,モデルの構築)
  2. ༷ʑͳυϝΠϯͰ஫໨͞ΕΔϏοάσʔλ 農業 医療 交通 製薬 観光 防災 気象 広告 流通

    教育 ICT スポーツ 報道 効率化・コスト削減 ビジネスモデルの創造 付加価値の向上 ITへの意識 ビッグデータ
  3. ϏοάσʔλͱϏδωε *1 鈴木良介著「ビッグデータビジネスの時代」(平成23年11月) *2 McKinsey Global Institute “Big data: The

    next frontier for innovation, competition, and productivity”(平成23年5月) ビッグデータ ビッグデータビジネス ビッグデータを用いて社会・経済の問題解決や、業務の付加価値 向上を行う、あるいは支援する事業 • 事業に役立つ知見を導出するためのデータ • 典型的なDBソフトウェアが把握し、蓄積し、運用し、分析できる 能力を超えたサイズのデータ • 多くの部門において、数十テラバイトから数ペタバイトの範囲
  4. 3V͕ඞཁʹͳΔέʔεྫ: ঎඼ͷਪન 商品A 商品B 商品C 商品D 商品E 山本 • •

    佐藤 • • • 鈴木 • • 伊藤 • • ? Q. 伊藤さんに商品Eを推薦すべきか? A. 購買履歴が類似するユーザの商品を推薦すればよい アイデア • 5つの商品の購買履歴でユーザの好みが分かるか? • 好みが似ているユーザを探すのに3人でよいのか?
  5. ޷ΈΛৄࡉʹௐ΂Δʹ͸ 商品 A 商品 B 商品 C 商品 D 商品

    E F G H I J K L M N O P 山本 • • • • • 佐藤 • • • • • 鈴木 • • • • • • 伊藤 • • ? • • • データの種類を増やす
  6. ޷Έ͕߹͏ਓΛௐ΂Δʹ͸ 商品 A 商品 B 商品 C 商品 D 商品

    E F G H I J K L M N O P 山本 • • • • • 佐藤 • • • • • 鈴木 • • • • • • 伊藤 • • ? • • • 斎藤 • • • • 田中 • 加藤 • • 玉置 • 祇園 • • • • • • 東 • • 河端 • • 烏丸 • • デ ! タ の 量 を 増 や す
  7. ޷Έ͕߹͏ਓΛௐ΂Δʹ͸ 商品 A 商品 B 商品 C 商品 D 商品

    E F G H I J K L M N O P 山本 • • • • • 佐藤 • • • • • 鈴木 • • • • • • 伊藤 • • ? • • • 斎藤 • • • • 田中 • 加藤 • • 玉置 • 祇園 • • • • • • 東 • • 河端 • • 烏丸 • •
  8. Predictive Policing 犯罪が発生する前に、犯罪現場に警察官を送り込む http://www.nytimes.com/2011/08/16/us/16police.html?_r=0 • 米国サンタクルーズ市警と UCLAとの共同研究 • 犯罪の種類や発生時間、 発生場所などのデータから

    犯罪発生予測モデルを構築 - 犯罪レポート1万1000件/年 - 電話通報記録10万5000件/年 http://itpro.nikkeibp.co.jp/atcl/watcher/14/334361/080100020/?ST=bigdata&P=2 • 電子化された犯罪レポート
  9. কདྷ༧ଌ: ഑ૹ x Ϗοάσʔλ * 画像はhttp://www.mbaskool.com/business-articles/operations/10043-anticipatory-shipping-evolution-in-e-commerce.html * Method and system

    for anticipatory package shipping , US 8615473 B2 注文される確率の高い商品を特定し 発注される前に商品を出荷し始める
  10. iPhoneதͷηϯαʔσόΠε • GPS • マイク • 近接センサー • ジャイロセンサー •

    輝度センサー • 電子コンパス • 加速度センサー • 歩数センサー • 指紋センサー • カメラ
  11. ஝ੵɾूੵٕज़ͷਐԽ データの量 デ ! タ の 複 雑 さ "

    多 様 性 # ఆܕԽ͞Εͨ ۀ຿σʔλ Ϗοάσʔλ ʢେྔ ଎͍ ෳࡶʣ
  12. ஝ੵɾूੵٕज़ͷਐԽ データの量 デ ! タ の 複 雑 さ "

    多 様 性 # Ϗοάσʔλ ʢେྔ ଎͍ ෳࡶʣ 関係データベース ◦ 定型データ処理は高速 × データへの柔軟性が低い × スケーラビリティが低い ◦ データの一貫性
  13. ஝ੵɾूੵٕज़ͷਐԽ データの量 デ ! タ の 複 雑 さ "

    多 様 性 # 関係データベース ◦ 定型データ処理は高速 × データへの柔軟性が低い NoSQL ◦ 複雑・大量データの蓄積に最適化 × 集計処理が弱い × スケーラビリティが低い ◦ データの一貫性
  14. ஝ੵɾूੵٕज़ͷਐԽ データの量 デ ! タ の 複 雑 さ "

    多 様 性 # NoSQL ◦ 複雑・大量データの蓄積に最適化 × 集計処理が弱い 関係データベース ◦ 定型データ処理は高速 × データへの柔軟性が低い × スケーラビリティが低い ◦ データの一貫性 MapReduce NoSQLにマッチする 大規模分散技術でカバー
  15. ਓ޻஌ೳ(AI) 人工知能 強いAI 弱いAI (Artificial Intelligence) ➂꟦ך״ֲז荈䠐陎׾䭯׍➂꟦ך ״ֲז濼腉׾׮׏ג⡲噟ָ〳腉ז堣唒 ➂꟦ך濼涸Ⳣ椚ך♧鿇׾垷⦺ׅ׷ 暴㹀㉏겗鍑寸㐻

    ・ 現在行われているAI研究の大半は弱いAIの研究 ⿫罋➂䊨濼腉灇瑔IUUQTXXXBJHBLLBJPSKQXIBUTBJ"*SFTFBSDIIUNM ・ 強いAI研究の成果(e.g. 推論)も人間の知能には遠く及ばず 62
  16. ڭࢣ͋Γֶशʢ1/2ʣ סּ ـٔ 달 뎕 大量のラベル付データ 堣唒㷕统 ،ٕ؞ٔؤي ӧӧך識別に必要となる 特徴と分類ルール

    歗⫷⳿ⰩIUUQTKQNBUIXPSLTDPNIFMQEFFQMFBSOJOHFYBNQMFTWJTVBMJ[FGFBUVSFTPGBDPOWPMVUJPOBMOFVSBMOFUXPSLIUNM 全長が25cmくらいで, 長く伸びた白いヒレ. 白い体に2本の黒い帯. 背びれが黄色い. これは「ハタタテダイ」 大量のラベル(答え)付データを与えて ラベルを分類する特徴とルールを抽出(学習)する 65
  17. σΟʔϓϥʔχϯάʢ2/3ʣ … … … … … リンゴ スイカ バナナ ドリアン

    … ピクセル 毎の色コード 255 28 果物の確率 0 1 0 0 人間にはよく分からない特徴
  18. σΟʔϓϥʔχϯάʢ3/3ʣ … … … … … リンゴ スイカ バナナ ドリアン

    … ピクセル 毎の色コード 60 28 果物の確率 0.2 0.6 0 0 人間にはよく分からない特徴 ◦◦だったら△△になって,△△だったら□□ で… という果てしない数値ルールを学習する
  19. 75

  20. Cycle GAN Jun-Yan Zhu*, Taesung Park*, Phillip Isola, Alexei A.

    Efros: “Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks”, ICCV 2017. ターゲット画像に特定の特徴量(例:服装)を付与する 画像(動画)加工が可能に
  21. Style GAN Yildirim, Gokhan, et al. "Generating High-Resolution Fashion Model

    Images Wearing Custom Outfits." Proceedings of the IEEE International Conference on Computer Vision Workshops. 2019. ターゲット画像に任意の特徴量(例:服装)を加味した 画像生成が可能に
  22. ؔ܎ͳ͍Α͏Ͱؔ܎͋Δ༨ஊɿ αϧͷࣗࡱΓ https://ja.wikipedia.org/wiki/サルの自撮り 写真家のDavid Slaterは自身の カメラを三脚に設置し,サルが 自撮りをできるような工夫をした. 工夫の甲斐あって,サルの自撮り 写真の回収に成功.Davidはその 写真を発表し,注目を集めた.

    ところが,複数のウェブメディアが サルは法律上の人でないため, 写真に著作権はないと主張し, 当該写真はパブリックドメインの 扱いとして,写真を自サイトに公開. その後,Davidと各種団体は 法廷闘争に…
  23. データ分析に必要な データを収集・構築する データ 構築 前処理 アルゴリズム 適用 評価・分析 σʔλղੳɾ׆༻ͷϓϩηε アルゴリズムを走らせるために

    データをクリーニング,統合,変形 種々のアルゴリズムの 適用・開発 構築したモデルの評価, データマイニングした知見の分析
  24. • データベース • センサーネットワーク データ 構築 前処理 アルゴリズム 適用 評価・分析

    σʔλαΠΤϯεʹඞཁͱͳΔεΩϧ • データラングリング • 自然言語処理 • 音声・画像処理 • 機械学習 • データマイニング • 分散処理 ▪ 必ず必要となる専門スキル ▪ オプションとして必要となる専門スキル 専門スキルを支えるための基本スキル • データ構造 • プログラミング • 線形代数学 • 離散数学 • 数理・統計
  25. • データベース • センサーネットワーク データ 構築 前処理 アルゴリズム 適用 評価・分析

    σʔλαΠΤϯεʹඞཁͱͳΔεΩϧ • データラングリング • 自然言語処理 • 音声・画像処理 • 機械学習 • データマイニング • 分散処理 ▪ 必ず必要となる専門スキル ▪ オプションとして必要となる専門スキル 専門スキルを支えるための基本スキル • データ構造 • プログラミング • 線形代数学 • 離散数学 • 数理・統計 一般人が考えるデータサイエンスはこれ
  26. データ分析に必要な データを収集・構築する データ 構築 前処理 アルゴリズム 適用 評価・分析 σʔλղੳɾ׆༻ͷϓϩηε アルゴリズムを走らせるために

    データをクリーニング,統合,変形 種々のアルゴリズムの 適用・開発 構築したモデルの評価, データマイニングした知見の分析 データ解析の8割は「データ構築と前処理」
  27. Assignment Assume that you were looking for a job now.

    You wanted to get a job offer from a company that will hire just one applicant. Fortunately, the company invited you to a final job interview. You heard from a personnel staff that all applicants except you were artificial intelligence. In order to get a job offer, you need to appeal that you would be more beneficial to the company than the AI applicants. From the aspect of productivity, describe in what points you are superior to AIs in one sheet of A4 paper. Note that you can freely for which company you want to work.
  28. How to submit your assignment 134 File type PDF document(filename

    should be your student ID) How to submit Follow an email from LMS Deadline 2020. 7.14(Tue) 23:59