Upgrade to Pro — share decks privately, control downloads, hide ads and more …

機械学習を科学研究で使うとは?

itakigawa
November 29, 2023
35

 機械学習を科学研究で使うとは?

第12回WPIサイエンスシンポジウム, 2023年11月23日, 北海道大学
https://www.icredd.hokudai.ac.jp/ja/event/9695

itakigawa

November 29, 2023
Tweet

Transcript

  1. 瀧川 ⼀学
    瀧川 ⼀学
    たきがわ いちがく
    機械学習
    を科学研究で使うとは?
    機械学習
    を科学研究で使うとは?
    データを予測に変える技術

    View full-size slide

  2. ⾃⼰紹介:瀧川 ⼀学 (たきがわ いちがく)
    うどん県⽣まれなのになぜか札幌と京都を⾏ったり来たりしている⼈
    「機械学習」と「機械発⾒」を研究する技術屋
    ⾼松18年 ⽣まれも育ちもうどん県 (1年だけドイツに住みましたが)


    札幌10年 北海道⼤学⼯学部・⼯学研究科を卒業 (⼤学4年、⼤学院5年、博⼠研究員1年)


    京都7年 京都⼤学化学研究所バイオインフォマティクスセンター 助教 (兼 京⼤薬学研究科 助教)


    札幌7年 北海道⼤学情報科学研究科 准教授 (+ICReDD 准教授)


    京都4年 理化学研究所⾰新知能統合研究センター(京都) 研究員 (+ICReDD 特任准教授)


    京都1年 北海道⼤学ICReDD 特任教授 + 京都⼤学国際⾼等教育院 特定教授
    ご当地ゆるキャラ
    「うどん脳」
    特に「離散構造」を伴う機械学習
    2

    View full-size slide

  3. 今⽇の話:機械学習を科学研究に使うとは?
    「機械学習」を化学に使った事例紹介


    「機械学習」とは何か


    「機械学習」と「機械発⾒」


    チャレンジと⾯⽩さ
    機械学習屋が化学の研究拠点で⼀体何をやっているのか?


    どこに⾯⽩さややりがいを感じているのか?
    今⽇伝えたいこと
    3

    View full-size slide

  4. なんとなくこんなふうに思われているのでは…?
    というか、正直に⾔えば、私⾃⾝もこう考えて気軽に始めた!
    しかしこのシナリオのようには全然⾏かない…(今⽇は「なぜか?」を伝えたい)
    あらゆる科学データを

    スゴイAI様に教えこむ
    AI様、超絶賢く覚醒!

    (⼈間のベスト以上の⾼みへ)
    あとは寝てればAI様が

    バンバン科学的発⾒をする
    4

    View full-size slide

  5. 実は「AIを科学に使う」研究はAI誕⽣からずっとある!
    何ができれば「⼈⼯知能(AI)」と⾔えるのかはずっとグレーな難しい問題

    → 得意げにAI、AI⾔うけど、⼈⼯じゃない知能が定義できてない問題
    「科学ができること」は「知能」の最も説得⼒のある試⾦⽯

    → AIの研究は⾊々あるけど最終的にはこの問題に戻ってくると思っている
    AIの概念とコンピュータは実はほぼ同時に誕⽣した


    つまり「AIを科学に使う」のはコンピュータ誕⽣からの積年の課題


    チューリングやフォン・ノイマンの時代から続く古くて新しい問題
    5

    View full-size slide

  6. 機械学習を使った私たちの研究の紹介(1)
    Hu et al. AAAI'22 Workshop on Deep Learning on Graphs (DLG-AAAI’22), 2022.
    分⼦構造を描くときに機械学習で構造補完:今をときめく(?)⽣成AI

    →⼀発で構造⽣成するのは実⽤性が低いので対話式かつ多段式の⽣成
    6

    View full-size slide

  7. 機械学習を使った私たちの研究の紹介(2)
    ৯Ԙ ແػ෺

    0.5 mm
    ࠭౶ ༗ػ෺

    0.5 mm
    ࣮ࡍ 85% 15%
    ༧ଌ 83% 17%
    ࠭౶ ৯Ԙ
    砂糖と⾷塩など、異なる固体の混合割合を写真から予測定量

    →結晶多形の⽐率や鏡像体過剰率、固体反応の収率も⾼精精度で予測

    ࠞ߹
    Ide et al. Ind. Eng. Chem. Res., 2 2023; 62(35): 13790–13798. with ICReDD(猪熊研)
    7

    View full-size slide

  8. 機械学習を使った私たちの研究の紹介(3)
    Katsuno et al, Microscopy and Microanalysis 2022; 28(1), 138-144.
    透過電⼦顕微鏡(TEM)の低電⼦線量像の画質改善

    →⾼電⼦線量だと対象に影響・低電⼦線量では観察しづらい問題を解消
    ߴిࢠઢ ௿ిࢠઢ ೖྗ
    վળ૾ ग़ྗ
    ߴిࢠઢ ௿ిࢠઢ ೖྗ
    վળ૾ ग़ྗ
    ߴిࢠઢ ௿ిࢠઢ ೖྗ
    վળ૾ ग़ྗ

    with 北⼤低温研(⽊村研)
    8

    View full-size slide

  9. 機械学習を使った私たちの研究の紹介(4)
    逆⽔性ガスシフト反応のPt担持TiO2
    系多元素触媒を開発

    → 機械学習に⽤いていない元素を含む既報触媒系より良い触媒を発⾒
    Wang et al. Nature Communications, 2023; 14, 5861. with 北⼤触媒研(清⽔研)
    ࣮ݧࢼߦ਺
    ৮ഔੑೳ $0ੜ੒଎౓

    طใ৮ഔܥ
    ͷ࠷ྑ஋
    ›$ҎԼ

    9

    View full-size slide

  10. 最後の(4)だけ実は仲間はずれ…
    なお、(4)だけ深層学習(ディープラーニング)を使っていない
    (1)-(3)は「機械学習」の問題と⾔えるが


    (4)はもはや「機械学習」では全然なく、もっと難しい別の問題

    →「機械発⾒」の問題
    これを理解するために
    「機械学習」とは何か


    「機械学習」と「機械発⾒」
    10

    View full-size slide

  11. 機械学習とは新しいプログラミングのやり⽅
    多数の⼊出⼒⾒本例からそれを再現できるプログラムを作り出す⽅法
    コンピュータプログラム
    ⼊⼒ 出⼒
    通常のプログラミング (中⾝は⼈が書く)
    ATM
    ⼝座情報 残⾼表⽰
    コントローラの

    ボタン⼊⼒
    対応する

    画⾯の描画
    ゲーム
    計算に必要な

    各種の値
    シミュレーション結果
    科学計算
    ⾃分のスマホ

    にあるデータ
    指定の相⼿の

    スマホへ送信
    通信
    機械学習 (中⾝は⾒本例データから作られる)
    物体認識
    画像/動画
    何がどこに

    写っているか
    ⾳声データ 発話に対応

    する⽂字
    ⾳声認識
    フランス語の⽂ 対応する英語の⽂
    機械翻訳
    それまでに

    打った⼿
    勝てる確率の

    ⾼い次の⼿
    囲碁プレイ
    11

    View full-size slide

  12. コンピュータプログラム
    機械学習はデータを予測に変えることができる
    p1 p2 p3 p4
    ʜ
    ⼊⼒⾒本点を関数モデルで内挿することで⾒本点以外での予測値を得る
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxInfGr5JoY4nRAxK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMCxPOtHHdb6ewsrq2vlHcLG1t7+zulfcPGjpOFaE+iXmsWiHWlDNJfcMMp61EUSxCTpvh8HbiN5+o0iyWj2aU0EDgvmQRI9hY6eG563XLFbfqToGWiZeTCuSod8s/nV5MUkGlIRxr3fbcxAQZVoYRTselTqppgskQ92nbUokF1UE2PXWMTqzSQ1GsbEmDpurfiQwLrUcitJ0Cm4Fe9Cbif147NdF1kDGZpIZKMlsUpRyZGE3+Rj2mKDF8ZAkmitlbERlghYmx6cxtCcXYZuItJrBMGmdV77J6cX9eqd3k6RThCI7hFDy4ghrcQR18INCHF3iFNydz3p0P53PWWnDymUOYg/P1C7x/lEA=
    x1
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxIndE1JJoY4lRPhK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMC2LOtHHdbye3tr6xuZXfLuzs7u0fFA+PmjpKFKENEvFItQOsKWeSNgwznLZjRbEIOG0Fo9up33qiSrNIPppxTH2BB5KFjGBjpYfnXqVXLLlldwa0SryMlCBDvVf86fYjkggqDeFY647nxsZPsTKMcDopdBNNY0xGeEA7lkosqPbT2akTdGaVPgojZUsaNFP/TqRYaD0Wge0U2Az1sjcV//M6iQmv/ZTJODFUkvmiMOHIRGj6N+ozRYnhY0swUczeisgQK0yMTWdhSyAmNhNvOYFV0qyUvcty9f6iVLvJ0snDCZzCOXhwBTW4gzo0gMAAXuAV3pzUeXc+nM95a87JZo5hAc7XL74SlEE=
    x2
    12
    ⾒本点(データ)
    AAACAnicbVDLSgMxFM3UV62vqks3wSJUkDJTfG2EohuXFewD2mHIpJk2NMkMSUY6DN35DW517U7c+iMu/RPTdha29cCFwzn3ci7HjxhV2ra/rdzK6tr6Rn6zsLW9s7tX3D9oqjCWmDRwyELZ9pEijArS0FQz0o4kQdxnpOUP7yZ+64lIRUPxqJOIuBz1BQ0oRtpI3eQmKI8852zkVU+9Ysmu2FPAZeJkpAQy1L3iT7cX4pgToTFDSnUcO9JuiqSmmJFxoRsrEiE8RH3SMVQgTpSbTn8ewxOj9GAQSjNCw6n69yJFXKmE+2aTIz1Qi95E/M/rxDq4dlMqolgTgWdBQcygDuGkANijkmDNEkMQltT8CvEASYS1qWkuxedj04mz2MAyaVYrzmXl4uG8VLvN2smDI3AMysABV6AG7kEdNAAGEXgBr+DNerberQ/rc7aas7KbQzAH6+sXQ3GXPA==
    y = f(x1, x2)
    関数値(予測)
    ⼊⼒ 出⼒

    View full-size slide

  13. 関数モデル AAACAHicbVDLTsJAFJ3iC/GFunQzkZhgYkjLS9wR3bjERB4RmmY6TGHCdNrMTA2kYeM3uNW1O+PWP3HpnzhAF4Ke5CYn59ybe+9xQ0alMs0vI7W2vrG5ld7O7Ozu7R9kD49aMogEJk0csEB0XCQJo5w0FVWMdEJBkO8y0nZHNzO//UiEpAG/V5OQ2D4acOpRjJSWHrz82LEuxk7x3MnmzMJVzSxVLGgWilapWi1rYs4BrYTkQIKGk/3u9QMc+YQrzJCUXcsMlR0joShmZJrpRZKECI/QgHQ15cgn0o7nF0/hmVb60AuELq7gXP09ESNfyonv6k4fqaFc9Wbif143Ul7NjikPI0U4XizyIgZVAGfvwz4VBCs20QRhQfWtEA+RQFjpkJa2uP5UZ2KtJvCXtIoFq1qo3JVz9esknTQ4AacgDyxwCergFjRAE2DAwTN4Aa/Gk/FmvBsfi9aUkcwcgyUYnz8cepai
    f(x1, x2)
    機械学習はデータを予測に変えることができる
    p1 p2 p3 p4
    ʜ
    ⼊⼒⾒本点を関数モデルで内挿することで⾒本点以外での予測値を得る
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxInfGr5JoY4nRAxK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMCxPOtHHdb6ewsrq2vlHcLG1t7+zulfcPGjpOFaE+iXmsWiHWlDNJfcMMp61EUSxCTpvh8HbiN5+o0iyWj2aU0EDgvmQRI9hY6eG563XLFbfqToGWiZeTCuSod8s/nV5MUkGlIRxr3fbcxAQZVoYRTselTqppgskQ92nbUokF1UE2PXWMTqzSQ1GsbEmDpurfiQwLrUcitJ0Cm4Fe9Cbif147NdF1kDGZpIZKMlsUpRyZGE3+Rj2mKDF8ZAkmitlbERlghYmx6cxtCcXYZuItJrBMGmdV77J6cX9eqd3k6RThCI7hFDy4ghrcQR18INCHF3iFNydz3p0P53PWWnDymUOYg/P1C7x/lEA=
    x1
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxIndE1JJoY4lRPhK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMC2LOtHHdbye3tr6xuZXfLuzs7u0fFA+PmjpKFKENEvFItQOsKWeSNgwznLZjRbEIOG0Fo9up33qiSrNIPppxTH2BB5KFjGBjpYfnXqVXLLlldwa0SryMlCBDvVf86fYjkggqDeFY647nxsZPsTKMcDopdBNNY0xGeEA7lkosqPbT2akTdGaVPgojZUsaNFP/TqRYaD0Wge0U2Az1sjcV//M6iQmv/ZTJODFUkvmiMOHIRGj6N+ozRYnhY0swUczeisgQK0yMTWdhSyAmNhNvOYFV0qyUvcty9f6iVLvJ0snDCZzCOXhwBTW4gzo0gMAAXuAV3pzUeXc+nM95a87JZo5hAc7XL74SlEE=
    x2
    12
    ⾒本点(データ)
    AAACAnicbVDLSgMxFM3UV62vqks3wSJUkDJTfG2EohuXFewD2mHIpJk2NMkMSUY6DN35DW517U7c+iMu/RPTdha29cCFwzn3ci7HjxhV2ra/rdzK6tr6Rn6zsLW9s7tX3D9oqjCWmDRwyELZ9pEijArS0FQz0o4kQdxnpOUP7yZ+64lIRUPxqJOIuBz1BQ0oRtpI3eQmKI8852zkVU+9Ysmu2FPAZeJkpAQy1L3iT7cX4pgToTFDSnUcO9JuiqSmmJFxoRsrEiE8RH3SMVQgTpSbTn8ewxOj9GAQSjNCw6n69yJFXKmE+2aTIz1Qi95E/M/rxDq4dlMqolgTgWdBQcygDuGkANijkmDNEkMQltT8CvEASYS1qWkuxedj04mz2MAyaVYrzmXl4uG8VLvN2smDI3AMysABV6AG7kEdNAAGEXgBr+DNerberQ/rc7aas7KbQzAH6+sXQ3GXPA==
    y = f(x1, x2)
    関数値(予測)
    ⼊⼒ 出⼒

    View full-size slide

  14. 機械学習はデータを予測に変えることができる
    Random Forest Neural Network SVR Kernel Ridge
    p1 p2 p3 p4
    ʜ
    関数モデル
    ⼊⼒⾒本点を関数モデルで内挿することで⾒本点以外での予測値を得る
    AAACAHicbVDLTsJAFJ3iC/GFunQzkZhgYkjLS9wR3bjERB4RmmY6TGHCdNrMTA2kYeM3uNW1O+PWP3HpnzhAF4Ke5CYn59ybe+9xQ0alMs0vI7W2vrG5ld7O7Ozu7R9kD49aMogEJk0csEB0XCQJo5w0FVWMdEJBkO8y0nZHNzO//UiEpAG/V5OQ2D4acOpRjJSWHrz82LEuxk7x3MnmzMJVzSxVLGgWilapWi1rYs4BrYTkQIKGk/3u9QMc+YQrzJCUXcsMlR0joShmZJrpRZKECI/QgHQ15cgn0o7nF0/hmVb60AuELq7gXP09ESNfyonv6k4fqaFc9Wbif143Ul7NjikPI0U4XizyIgZVAGfvwz4VBCs20QRhQfWtEA+RQFjpkJa2uP5UZ2KtJvCXtIoFq1qo3JVz9esknTQ4AacgDyxwCergFjRAE2DAwTN4Aa/Gk/FmvBsfi9aUkcwcgyUYnz8cepai
    f(x1, x2)
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxInfGr5JoY4nRAxK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMCxPOtHHdb6ewsrq2vlHcLG1t7+zulfcPGjpOFaE+iXmsWiHWlDNJfcMMp61EUSxCTpvh8HbiN5+o0iyWj2aU0EDgvmQRI9hY6eG563XLFbfqToGWiZeTCuSod8s/nV5MUkGlIRxr3fbcxAQZVoYRTselTqppgskQ92nbUokF1UE2PXWMTqzSQ1GsbEmDpurfiQwLrUcitJ0Cm4Fe9Cbif147NdF1kDGZpIZKMlsUpRyZGE3+Rj2mKDF8ZAkmitlbERlghYmx6cxtCcXYZuItJrBMGmdV77J6cX9eqd3k6RThCI7hFDy4ghrcQR18INCHF3iFNydz3p0P53PWWnDymUOYg/P1C7x/lEA=
    x1
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxIndE1JJoY4lRPhK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMC2LOtHHdbye3tr6xuZXfLuzs7u0fFA+PmjpKFKENEvFItQOsKWeSNgwznLZjRbEIOG0Fo9up33qiSrNIPppxTH2BB5KFjGBjpYfnXqVXLLlldwa0SryMlCBDvVf86fYjkggqDeFY647nxsZPsTKMcDopdBNNY0xGeEA7lkosqPbT2akTdGaVPgojZUsaNFP/TqRYaD0Wge0U2Az1sjcV//M6iQmv/ZTJODFUkvmiMOHIRGj6N+ozRYnhY0swUczeisgQK0yMTWdhSyAmNhNvOYFV0qyUvcty9f6iVLvJ0snDCZzCOXhwBTW4gzo0gMAAXuAV3pzUeXc+nM95a87JZo5hAc7XL74SlEE=
    x2
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxInfGr5JoY4nRAxK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMCxPOtHHdb6ewsrq2vlHcLG1t7+zulfcPGjpOFaE+iXmsWiHWlDNJfcMMp61EUSxCTpvh8HbiN5+o0iyWj2aU0EDgvmQRI9hY6eG563XLFbfqToGWiZeTCuSod8s/nV5MUkGlIRxr3fbcxAQZVoYRTselTqppgskQ92nbUokF1UE2PXWMTqzSQ1GsbEmDpurfiQwLrUcitJ0Cm4Fe9Cbif147NdF1kDGZpIZKMlsUpRyZGE3+Rj2mKDF8ZAkmitlbERlghYmx6cxtCcXYZuItJrBMGmdV77J6cX9eqd3k6RThCI7hFDy4ghrcQR18INCHF3iFNydz3p0P53PWWnDymUOYg/P1C7x/lEA=
    x1
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxIndE1JJoY4lRPhK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMC2LOtHHdbye3tr6xuZXfLuzs7u0fFA+PmjpKFKENEvFItQOsKWeSNgwznLZjRbEIOG0Fo9up33qiSrNIPppxTH2BB5KFjGBjpYfnXqVXLLlldwa0SryMlCBDvVf86fYjkggqDeFY647nxsZPsTKMcDopdBNNY0xGeEA7lkosqPbT2akTdGaVPgojZUsaNFP/TqRYaD0Wge0U2Az1sjcV//M6iQmv/ZTJODFUkvmiMOHIRGj6N+ozRYnhY0swUczeisgQK0yMTWdhSyAmNhNvOYFV0qyUvcty9f6iVLvJ0snDCZzCOXhwBTW4gzo0gMAAXuAV3pzUeXc+nM95a87JZo5hAc7XL74SlEE=
    x2
    12
    ⾒本点(データ)
    AAACAnicbVDLSgMxFM3UV62vqks3wSJUkDJTfG2EohuXFewD2mHIpJk2NMkMSUY6DN35DW517U7c+iMu/RPTdha29cCFwzn3ci7HjxhV2ra/rdzK6tr6Rn6zsLW9s7tX3D9oqjCWmDRwyELZ9pEijArS0FQz0o4kQdxnpOUP7yZ+64lIRUPxqJOIuBz1BQ0oRtpI3eQmKI8852zkVU+9Ysmu2FPAZeJkpAQy1L3iT7cX4pgToTFDSnUcO9JuiqSmmJFxoRsrEiE8RH3SMVQgTpSbTn8ewxOj9GAQSjNCw6n69yJFXKmE+2aTIz1Qi95E/M/rxDq4dlMqolgTgWdBQcygDuGkANijkmDNEkMQltT8CvEASYS1qWkuxedj04mz2MAyaVYrzmXl4uG8VLvN2smDI3AMysABV6AG7kEdNAAGEXgBr+DNerberQ/rc7aas7KbQzAH6+sXQ3GXPA==
    y = f(x1, x2)
    関数値(予測)
    ⼊⼒ 出⼒
    内部パラメタの値

    View full-size slide

  15. 深層学習と表現学習
    q1 q2 q3 q4
    ʜ
    関数モデル
    AAACYHicbVFNT9tAEN2YUlIXSii39rJqBAIpimzERy9IiF56DBIBpNiKdteTZMV6be2OEZHlv8idY/sbuILYJD4U0pFWenrz5s3oLc+VtBgEjw1v5cPqx7XmJ//z+saXzdbW1yubFUZAX2QqMzecWVBSQx8lKrjJDbCUK7jmt79m/es7MFZm+hKnOcQpG2s5koKho4atyfQ04jCWuhTOxVZ+SHfpXhnNnQdmzOMy7ASdoIoQ7rE0kFTVfhT5wZLMiTphLeOqAKfzI9BJbTxstYNuMC+6DMIatEldvWHrT5RkokhBo1DM2kEY5BiXzKAUCio/KizkTNyyMQwc1CwFG5fzgyq645iEjjLjnkY6Z/+dKFlq7TTlTpkynNj3vRn5v96gwNHPuJQ6LxC0WCwaFYpiRmfx0kQaEKimDjBhpLuVigkzTKD7hDdbeDrLJHyfwDK4OuiGx92ji8P22XmdTpN8Jz/IHgnJCTkjv0mP9IkgD+SJPJOXxl+v6W16Wwup16hntsmb8r69AobUuF8=
    y =
    (
    1 (red)
    0 (blue)
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxInfGr5JoY4nRAxK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMCxPOtHHdb6ewsrq2vlHcLG1t7+zulfcPGjpOFaE+iXmsWiHWlDNJfcMMp61EUSxCTpvh8HbiN5+o0iyWj2aU0EDgvmQRI9hY6eG563XLFbfqToGWiZeTCuSod8s/nV5MUkGlIRxr3fbcxAQZVoYRTselTqppgskQ92nbUokF1UE2PXWMTqzSQ1GsbEmDpurfiQwLrUcitJ0Cm4Fe9Cbif147NdF1kDGZpIZKMlsUpRyZGE3+Rj2mKDF8ZAkmitlbERlghYmx6cxtCcXYZuItJrBMGmdV77J6cX9eqd3k6RThCI7hFDy4ghrcQR18INCHF3iFNydz3p0P53PWWnDymUOYg/P1C7x/lEA=
    x1
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxIndE1JJoY4lRPhK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMC2LOtHHdbye3tr6xuZXfLuzs7u0fFA+PmjpKFKENEvFItQOsKWeSNgwznLZjRbEIOG0Fo9up33qiSrNIPppxTH2BB5KFjGBjpYfnXqVXLLlldwa0SryMlCBDvVf86fYjkggqDeFY647nxsZPsTKMcDopdBNNY0xGeEA7lkosqPbT2akTdGaVPgojZUsaNFP/TqRYaD0Wge0U2Az1sjcV//M6iQmv/ZTJODFUkvmiMOHIRGj6N+ozRYnhY0swUczeisgQK0yMTWdhSyAmNhNvOYFV0qyUvcty9f6iVLvJ0snDCZzCOXhwBTW4gzo0gMAAXuAV3pzUeXc+nM95a87JZo5hAc7XL74SlEE=
    x2
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxInfGr5JoY4nRAxK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMCxPOtHHdb6ewsrq2vlHcLG1t7+zulfcPGjpOFaE+iXmsWiHWlDNJfcMMp61EUSxCTpvh8HbiN5+o0iyWj2aU0EDgvmQRI9hY6eG563XLFbfqToGWiZeTCuSod8s/nV5MUkGlIRxr3fbcxAQZVoYRTselTqppgskQ92nbUokF1UE2PXWMTqzSQ1GsbEmDpurfiQwLrUcitJ0Cm4Fe9Cbif147NdF1kDGZpIZKMlsUpRyZGE3+Rj2mKDF8ZAkmitlbERlghYmx6cxtCcXYZuItJrBMGmdV77J6cX9eqd3k6RThCI7hFDy4ghrcQR18INCHF3iFNydz3p0P53PWWnDymUOYg/P1C7x/lEA=
    x1
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxIndE1JJoY4lRPhK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMC2LOtHHdbye3tr6xuZXfLuzs7u0fFA+PmjpKFKENEvFItQOsKWeSNgwznLZjRbEIOG0Fo9up33qiSrNIPppxTH2BB5KFjGBjpYfnXqVXLLlldwa0SryMlCBDvVf86fYjkggqDeFY647nxsZPsTKMcDopdBNNY0xGeEA7lkosqPbT2akTdGaVPgojZUsaNFP/TqRYaD0Wge0U2Az1sjcV//M6iQmv/ZTJODFUkvmiMOHIRGj6N+ozRYnhY0swUczeisgQK0yMTWdhSyAmNhNvOYFV0qyUvcty9f6iVLvJ0snDCZzCOXhwBTW4gzo0gMAAXuAV3pzUeXc+nM95a87JZo5hAc7XL74SlEE=
    x2
    AAAB93icbVDLSgNBEOyNrxhfUY9eFoPgKeyKr2PQi8cEzAOSJcxOepMhM7PLzKywhHyBVz17E69+jkf/xEmyBxMtaCiquunuChPOtPG8L6ewtr6xuVXcLu3s7u0flA+PWjpOFcUmjXmsOiHRyJnEpmGGYydRSETIsR2O72d++wmVZrF8NFmCgSBDySJGibFSI+uXK17Vm8P9S/ycVCBHvV/+7g1imgqUhnKiddf3EhNMiDKMcpyWeqnGhNAxGWLXUkkE6mAyP3Tqnlll4EaxsiWNO1d/T0yI0DoToe0UxIz0qjcT//O6qYlugwmTSWpQ0sWiKOWuid3Z1+6AKaSGZ5YQqpi91aUjogg1NpulLaGY2kz81QT+ktZF1b+uXjUuK7W7PJ0inMApnIMPN1CDB6hDEyggPMMLvDqZ8+a8Ox+L1oKTzxzDEpzPH5Ack50=
    y
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxInfGr5JoY4nRAxK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMCxPOtHHdb6ewsrq2vlHcLG1t7+zulfcPGjpOFaE+iXmsWiHWlDNJfcMMp61EUSxCTpvh8HbiN5+o0iyWj2aU0EDgvmQRI9hY6eG563XLFbfqToGWiZeTCuSod8s/nV5MUkGlIRxr3fbcxAQZVoYRTselTqppgskQ92nbUokF1UE2PXWMTqzSQ1GsbEmDpurfiQwLrUcitJ0Cm4Fe9Cbif147NdF1kDGZpIZKMlsUpRyZGE3+Rj2mKDF8ZAkmitlbERlghYmx6cxtCcXYZuItJrBMGmdV77J6cX9eqd3k6RThCI7hFDy4ghrcQR18INCHF3iFNydz3p0P53PWWnDymUOYg/P1C7x/lEA=
    x1
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxIndE1JJoY4lRPhK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMC2LOtHHdbye3tr6xuZXfLuzs7u0fFA+PmjpKFKENEvFItQOsKWeSNgwznLZjRbEIOG0Fo9up33qiSrNIPppxTH2BB5KFjGBjpYfnXqVXLLlldwa0SryMlCBDvVf86fYjkggqDeFY647nxsZPsTKMcDopdBNNY0xGeEA7lkosqPbT2akTdGaVPgojZUsaNFP/TqRYaD0Wge0U2Az1sjcV//M6iQmv/ZTJODFUkvmiMOHIRGj6N+ozRYnhY0swUczeisgQK0yMTWdhSyAmNhNvOYFV0qyUvcty9f6iVLvJ0snDCZzCOXhwBTW4gzo0gMAAXuAV3pzUeXc+nM95a87JZo5hAc7XL74SlEE=
    x2
    ⼊⼒変数
    標準的な
    機械学習
    Random

    Forest
    GBDT
    Nearest

    Neighbor
    SVM
    Gaussian

    Process
    Neural

    Network
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxInfGr5JoY4nRAxK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMCxPOtHHdb6ewsrq2vlHcLG1t7+zulfcPGjpOFaE+iXmsWiHWlDNJfcMMp61EUSxCTpvh8HbiN5+o0iyWj2aU0EDgvmQRI9hY6eG563XLFbfqToGWiZeTCuSod8s/nV5MUkGlIRxr3fbcxAQZVoYRTselTqppgskQ92nbUokF1UE2PXWMTqzSQ1GsbEmDpurfiQwLrUcitJ0Cm4Fe9Cbif147NdF1kDGZpIZKMlsUpRyZGE3+Rj2mKDF8ZAkmitlbERlghYmx6cxtCcXYZuItJrBMGmdV77J6cX9eqd3k6RThCI7hFDy4ghrcQR18INCHF3iFNydz3p0P53PWWnDymUOYg/P1C7x/lEA=
    x1
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxIndE1JJoY4lRPhK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMC2LOtHHdbye3tr6xuZXfLuzs7u0fFA+PmjpKFKENEvFItQOsKWeSNgwznLZjRbEIOG0Fo9up33qiSrNIPppxTH2BB5KFjGBjpYfnXqVXLLlldwa0SryMlCBDvVf86fYjkggqDeFY647nxsZPsTKMcDopdBNNY0xGeEA7lkosqPbT2akTdGaVPgojZUsaNFP/TqRYaD0Wge0U2Az1sjcV//M6iQmv/ZTJODFUkvmiMOHIRGj6N+ozRYnhY0swUczeisgQK0yMTWdhSyAmNhNvOYFV0qyUvcty9f6iVLvJ0snDCZzCOXhwBTW4gzo0gMAAXuAV3pzUeXc+nM95a87JZo5hAc7XL74SlEE=
    x2
    AAAB93icbVDLSgNBEOyNrxhfUY9eFoPgKeyKr2PQi8cEzAOSJcxOepMhM7PLzKywhHyBVz17E69+jkf/xEmyBxMtaCiquunuChPOtPG8L6ewtr6xuVXcLu3s7u0flA+PWjpOFcUmjXmsOiHRyJnEpmGGYydRSETIsR2O72d++wmVZrF8NFmCgSBDySJGibFSI+uXK17Vm8P9S/ycVCBHvV/+7g1imgqUhnKiddf3EhNMiDKMcpyWeqnGhNAxGWLXUkkE6mAyP3Tqnlll4EaxsiWNO1d/T0yI0DoToe0UxIz0qjcT//O6qYlugwmTSWpQ0sWiKOWuid3Z1+6AKaSGZ5YQqpi91aUjogg1NpulLaGY2kz81QT+ktZF1b+uXjUuK7W7PJ0inMApnIMPN1CDB6hDEyggPMMLvDqZ8+a8Ox+L1oKTzxzDEpzPH5Ack50=
    y
    13

    View full-size slide

  16. 深層学習と表現学習
    p1 p2 p3 p4
    ʜ
    変数変換(表現学習)
    AAAChnichVHLTsJAFD3UF+ID1I2JGyLBuCJTg2JcEd245CGPBAlp64gNpW3aQgLEHzBxKwtXmrgwfoAf4MYfcMEnGJeYuHHhpTQxSsTbTOfMmXvunJkrm5pqO4z1fMLE5NT0jH82MDe/sBgMLS3nbaNhKTynGJphFWXJ5pqq85yjOhovmhaX6rLGC3LtYLBfaHLLVg39yGmZvFyXqrp6qiqSQ1S2XREroQiLMTfCo0D0QARepIzQI45xAgMKGqiDQ4dDWIMEm74SRDCYxJXRIc4ipLr7HOcIkLZBWZwyJGJr9K/SquSxOq0HNW1XrdApGg2LlGFE2Qu7Z332zB7YK/v8s1bHrTHw0qJZHmq5WQlerGY//lXVaXZw9q0a69nBKXZdryp5N11mcAtlqG+2u/3sXiba2WC37I3837Aee6Ib6M135S7NM9dj/MjkhV6MGiT+bscoyG/FxJ1YPB2PJPe9VvmxhnVsUj8SSOIQKeSofhWXuEJX8AsxYVtIDFMFn6dZwY8Qkl9Y9pCe
    z1
    AAAChnichVHLTsJAFD3UF+ID1I2JGyLBuCIDQTGuiG5c8pBHgoS0dcCG0jZtIQHiD5i4lYUrTVwYP8APcOMPuOATjEtM3LjwUpoYJeJtpnPmzD13zsyVDFWxbMb6HmFqemZ2zjvvW1hcWvYHVlbzlt40ZZ6TdVU3i5JocVXReM5WbJUXDZOLDUnlBal+ONwvtLhpKbp2bLcNXm6INU2pKrJoE5XtVGKVQIhFmBPBcRB1QQhupPTAI05wCh0ymmiAQ4NNWIUIi74SomAwiCujS5xJSHH2Oc7hI22TsjhliMTW6V+jVcllNVoPa1qOWqZTVBomKYMIsxd2zwbsmT2wV/b5Z62uU2PopU2zNNJyo+K/WM9+/Ktq0Gzj7Fs10bONKvYcrwp5NxxmeAt5pG91eoPsfibc3WK37I3837A+e6IbaK13+S7NM9cT/EjkhV6MGhT93Y5xkI9ForuReDoeSh64rfJiA5vYpn4kkMQRUshR/RoucYWe4BUiwo6QGKUKHlezhh8hJL8AWxaQnw==
    z2
    ⼊⼒変数
    AAAChnichVHLTsJAFD3UF+ID1I2JGyLBuCJTg2JcEd245CGPBAlp64gNpW3aQgLEHzBxKwtXmrgwfoAf4MYfcMEnGJeYuHHhpTQxSsTbTOfMmXvunJkrm5pqO4z1fMLE5NT0jH82MDe/sBgMLS3nbaNhKTynGJphFWXJ5pqq85yjOhovmhaX6rLGC3LtYLBfaHLLVg39yGmZvFyXqrp6qiqSQ1S2XREroQiLMTfCo0D0QARepIzQI45xAgMKGqiDQ4dDWIMEm74SRDCYxJXRIc4ipLr7HOcIkLZBWZwyJGJr9K/SquSxOq0HNW1XrdApGg2LlGFE2Qu7Z332zB7YK/v8s1bHrTHw0qJZHmq5WQlerGY//lXVaXZw9q0a69nBKXZdryp5N11mcAtlqG+2u/3sXiba2WC37I3837Aee6Ib6M135S7NM9dj/MjkhV6MGiT+bscoyG/FxJ1YPB2PJPe9VvmxhnVsUj8SSOIQKeSofhWXuEJX8AsxYVtIDFMFn6dZwY8Qkl9Y9pCe
    z1
    AAAChnichVHLTsJAFD3UF+ID1I2JGyLBuCIDQTGuiG5c8pBHgoS0dcCG0jZtIQHiD5i4lYUrTVwYP8APcOMPuOATjEtM3LjwUpoYJeJtpnPmzD13zsyVDFWxbMb6HmFqemZ2zjvvW1hcWvYHVlbzlt40ZZ6TdVU3i5JocVXReM5WbJUXDZOLDUnlBal+ONwvtLhpKbp2bLcNXm6INU2pKrJoE5XtVGKVQIhFmBPBcRB1QQhupPTAI05wCh0ymmiAQ4NNWIUIi74SomAwiCujS5xJSHH2Oc7hI22TsjhliMTW6V+jVcllNVoPa1qOWqZTVBomKYMIsxd2zwbsmT2wV/b5Z62uU2PopU2zNNJyo+K/WM9+/Ktq0Gzj7Fs10bONKvYcrwp5NxxmeAt5pG91eoPsfibc3WK37I3837A+e6IbaK13+S7NM9cT/EjkhV6MGhT93Y5xkI9ForuReDoeSh64rfJiA5vYpn4kkMQRUshR/RoucYWe4BUiwo6QGKUKHlezhh8hJL8AWxaQnw==
    z2
    潜在変数
    深層学習
    q1 q2 q3 q4
    ʜ
    関数モデル
    AAACYHicbVFNT9tAEN2YUlIXSii39rJqBAIpimzERy9IiF56DBIBpNiKdteTZMV6be2OEZHlv8idY/sbuILYJD4U0pFWenrz5s3oLc+VtBgEjw1v5cPqx7XmJ//z+saXzdbW1yubFUZAX2QqMzecWVBSQx8lKrjJDbCUK7jmt79m/es7MFZm+hKnOcQpG2s5koKho4atyfQ04jCWuhTOxVZ+SHfpXhnNnQdmzOMy7ASdoIoQ7rE0kFTVfhT5wZLMiTphLeOqAKfzI9BJbTxstYNuMC+6DMIatEldvWHrT5RkokhBo1DM2kEY5BiXzKAUCio/KizkTNyyMQwc1CwFG5fzgyq645iEjjLjnkY6Z/+dKFlq7TTlTpkynNj3vRn5v96gwNHPuJQ6LxC0WCwaFYpiRmfx0kQaEKimDjBhpLuVigkzTKD7hDdbeDrLJHyfwDK4OuiGx92ji8P22XmdTpN8Jz/IHgnJCTkjv0mP9IkgD+SJPJOXxl+v6W16Wwup16hntsmb8r69AobUuF8=
    y =
    (
    1 (red)
    0 (blue)
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxInfGr5JoY4nRAxK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMCxPOtHHdb6ewsrq2vlHcLG1t7+zulfcPGjpOFaE+iXmsWiHWlDNJfcMMp61EUSxCTpvh8HbiN5+o0iyWj2aU0EDgvmQRI9hY6eG563XLFbfqToGWiZeTCuSod8s/nV5MUkGlIRxr3fbcxAQZVoYRTselTqppgskQ92nbUokF1UE2PXWMTqzSQ1GsbEmDpurfiQwLrUcitJ0Cm4Fe9Cbif147NdF1kDGZpIZKMlsUpRyZGE3+Rj2mKDF8ZAkmitlbERlghYmx6cxtCcXYZuItJrBMGmdV77J6cX9eqd3k6RThCI7hFDy4ghrcQR18INCHF3iFNydz3p0P53PWWnDymUOYg/P1C7x/lEA=
    x1
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxIndE1JJoY4lRPhK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMC2LOtHHdbye3tr6xuZXfLuzs7u0fFA+PmjpKFKENEvFItQOsKWeSNgwznLZjRbEIOG0Fo9up33qiSrNIPppxTH2BB5KFjGBjpYfnXqVXLLlldwa0SryMlCBDvVf86fYjkggqDeFY647nxsZPsTKMcDopdBNNY0xGeEA7lkosqPbT2akTdGaVPgojZUsaNFP/TqRYaD0Wge0U2Az1sjcV//M6iQmv/ZTJODFUkvmiMOHIRGj6N+ozRYnhY0swUczeisgQK0yMTWdhSyAmNhNvOYFV0qyUvcty9f6iVLvJ0snDCZzCOXhwBTW4gzo0gMAAXuAV3pzUeXc+nM95a87JZo5hAc7XL74SlEE=
    x2
    良い変数さえ⾒つかれば

    ここはシンプルで良い!
    標準的な
    機械学習
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxInfGr5JoY4nRAxK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMCxPOtHHdb6ewsrq2vlHcLG1t7+zulfcPGjpOFaE+iXmsWiHWlDNJfcMMp61EUSxCTpvh8HbiN5+o0iyWj2aU0EDgvmQRI9hY6eG563XLFbfqToGWiZeTCuSod8s/nV5MUkGlIRxr3fbcxAQZVoYRTselTqppgskQ92nbUokF1UE2PXWMTqzSQ1GsbEmDpurfiQwLrUcitJ0Cm4Fe9Cbif147NdF1kDGZpIZKMlsUpRyZGE3+Rj2mKDF8ZAkmitlbERlghYmx6cxtCcXYZuItJrBMGmdV77J6cX9eqd3k6RThCI7hFDy4ghrcQR18INCHF3iFNydz3p0P53PWWnDymUOYg/P1C7x/lEA=
    x1
    AAAB+XicbVA9TwJBEJ3DL8Qv1NJmIzGxIndE1JJoY4lRPhK4kL1lDzbs7l1294zkwk+w1drO2PprLP0nLnCFgC+Z5OW9mczMC2LOtHHdbye3tr6xuZXfLuzs7u0fFA+PmjpKFKENEvFItQOsKWeSNgwznLZjRbEIOG0Fo9up33qiSrNIPppxTH2BB5KFjGBjpYfnXqVXLLlldwa0SryMlCBDvVf86fYjkggqDeFY647nxsZPsTKMcDopdBNNY0xGeEA7lkosqPbT2akTdGaVPgojZUsaNFP/TqRYaD0Wge0U2Az1sjcV//M6iQmv/ZTJODFUkvmiMOHIRGj6N+ozRYnhY0swUczeisgQK0yMTWdhSyAmNhNvOYFV0qyUvcty9f6iVLvJ0snDCZzCOXhwBTW4gzo0gMAAXuAV3pzUeXc+nM95a87JZo5hAc7XL74SlEE=
    x2
    通常の機械学習でも⼊⼒変数の
    設計が決定的に重要
    14

    View full-size slide

  17. 機械学習で最も難しい問題:予測の評価
    ⾒本点が複雑な分布でも⾒本点を再現する内挿モデルは作成できる!
    機械学習で最も難しい問題:そのモデルの予測が当たるのか調べること
    予測が⼿元のデータ(⾒本点)に対して当たるのは当たり前

    → そもそもそうなるようにモデルを作るのが機械学習!


    したがって、⾒本点以外のデータを使って予測が当たるかを検証しないとダメ


    しかし「⾒本点(訓練データ)以外のデータ」ってなんだろう…?


    ちなみにもし予測は当たるのだと保証できるなら科学×機械学習は簡単
    15

    View full-size slide

  18. 機械学習で最も難しい問題:予測の評価
    機械学習では少なくとも訓練データ・検証データ・テストデータの3つが必須

    → この理由をみんなが⼤好きな(?)受験勉強に例えて考えてみよう
    訓練データ
    教科書や練習問題(問題理解)
    検証データ
    模擬試験(理解度の確認)
    テストデータ
    ⼊試本番(理解の使⽤)
    すべて異なるデータであることが⼤前提中の⼤前提!


    ⼊試本番の出題範囲が想定され3つのデータは全部それに従うと暗黙的に仮定
    16

    View full-size slide

  19. 機械学習と科学的発⾒
    機械学習を科学研究に使うときの「⼊試本番」や「出題範囲」とは??

    → はっきりとはない場合がかなりある!!
    私たちの研究(2)(3) → 明確な本番がある (=機械学習の問題)


    私たちの研究(1) → 構造補完のゴール設定による


    私たちの研究(4) → 明確な本番がない (=機械学習の問題じゃない)
    (4)では既存のどの材料よりも良い材料(今ないもの)の発⾒がゴール

    → つまり⼊試本番に相当する「テストデータ」は本当に「訓練データ」

      以外のあらゆる全てのデータ…(出題範囲がない⼊試に受かるか!?)
    17

    View full-size slide

  20. 機械発⾒の問題
    「機械発⾒」: 予測を⽬的とする機械学習の前提とはかなり違う別の問題
    既にあるデータのどれよりも「良いもの」の発⾒を求めて、データを取得ずみの範囲で

    (機械学習使って)有望候補を絞りつつ、データをまだ取ってない範囲も新たに調べる
    「機械発⾒」は予測や学習ではなく「探索」の問題(運要素も含む!)
    出題範囲を策定し「訓練データ」はその範囲に満遍なく取るべき(実験計画)


    探索範囲の任意の対象を同じ⼟俵で⽐較できるような共通変数表現が重要


    予測だけではなく予測の「不確実性の定量化」が逐次実験計画には必要
    18

    View full-size slide

  21. 機械学習と科学的理解
    科学的発⾒以外に「科学的理解」(法則の発⾒)をゴールにすれば良い?

    → 経験則の延⻑である機械学習は恣意性を含むため本質的に難しい…
    例) 次の数列の□は?

      2、4、□、8 2、4、6、8
    19

    View full-size slide

  22. 機械学習と科学的理解
    科学的発⾒以外に「科学的理解」(法則の発⾒)をゴールにすれば良い?

    → 経験則の延⻑である機械学習は恣意性を含むため本質的に難しい…
    例) 次の数列の□は?

      2、4、□、8 2、4、5、8
    AAAB+XicbVDLTgJBEOzFF+IL9ehlIjHxRHaNryPRi0eMIiSwIbPDLEyYx2Zm1oRs+ASvevZmvPo1Hv0TB9iDgJV0UqnqTndXlHBmrO9/e4WV1bX1jeJmaWt7Z3evvH/wZFSqCW0QxZVuRdhQziRtWGY5bSWaYhFx2oyGtxO/+Uy1YUo+2lFCQ4H7ksWMYOukB9yV3XLFr/pToGUS5KQCOerd8k+np0gqqLSEY2PagZ/YMMPaMsLpuNRJDU0wGeI+bTsqsaAmzKanjtGJU3ooVtqVtGiq/p3IsDBmJCLXKbAdmEVvIv7ntVMbX4cZk0lqqSSzRXHKkVVo8jfqMU2J5SNHMNHM3YrIAGtMrEtnbkskxi6TYDGBZfJ0Vg0uqxf355XaTZ5OEY7gGE4hgCuowR3UoQEE+vACr/DmZd679+F9zloLXj5zCHPwvn4B+COUZg==
    an
    AAAB93icbVDLSgNBEOyNrxhfUY9eFoPgKeyKr2PQi8cEzAOSJcxOepMhM7PLzKywhHyBVz17E69+jkf/xEmyBxMtaCiquunuChPOtPG8L6ewtr6xuVXcLu3s7u0flA+PWjpOFcUmjXmsOiHRyJnEpmGGYydRSETIsR2O72d++wmVZrF8NFmCgSBDySJGibFSQ/bLFa/qzeH+JX5OKpCj3i9/9wYxTQVKQznRuut7iQkmRBlGOU5LvVRjQuiYDLFrqSQCdTCZHzp1z6wycKNY2ZLGnau/JyZEaJ2J0HYKYkZ61ZuJ/3nd1ES3wYTJJDUo6WJRlHLXxO7sa3fAFFLDM0sIVcze6tIRUYQam83SllBMbSb+agJ/Seui6l9XrxqXldpdnk4RTuAUzsGHG6jBA9ShCRQQnuEFXp3MeXPenY9Fa8HJZ45hCc7nD37Lk5I=
    n
    19

    View full-size slide

  23. 機械学習と科学的理解
    科学的発⾒以外に「科学的理解」(法則の発⾒)をゴールにすれば良い?

    → 経験則の延⻑である機械学習は恣意性を含むため本質的に難しい…
    例) 次の数列の□は?

      2、4、□、8 2、4、4、8
    AAAB+XicbVDLTgJBEOzFF+IL9ehlIjHxRHaNryPRi0eMIiSwIbPDLEyYx2Zm1oRs+ASvevZmvPo1Hv0TB9iDgJV0UqnqTndXlHBmrO9/e4WV1bX1jeJmaWt7Z3evvH/wZFSqCW0QxZVuRdhQziRtWGY5bSWaYhFx2oyGtxO/+Uy1YUo+2lFCQ4H7ksWMYOukB9yV3XLFr/pToGUS5KQCOerd8k+np0gqqLSEY2PagZ/YMMPaMsLpuNRJDU0wGeI+bTsqsaAmzKanjtGJU3ooVtqVtGiq/p3IsDBmJCLXKbAdmEVvIv7ntVMbX4cZk0lqqSSzRXHKkVVo8jfqMU2J5SNHMNHM3YrIAGtMrEtnbkskxi6TYDGBZfJ0Vg0uqxf355XaTZ5OEY7gGE4hgCuowR3UoQEE+vACr/DmZd679+F9zloLXj5zCHPwvn4B+COUZg==
    an
    AAAB93icbVDLSgNBEOyNrxhfUY9eFoPgKeyKr2PQi8cEzAOSJcxOepMhM7PLzKywhHyBVz17E69+jkf/xEmyBxMtaCiquunuChPOtPG8L6ewtr6xuVXcLu3s7u0flA+PWjpOFcUmjXmsOiHRyJnEpmGGYydRSETIsR2O72d++wmVZrF8NFmCgSBDySJGibFSQ/bLFa/qzeH+JX5OKpCj3i9/9wYxTQVKQznRuut7iQkmRBlGOU5LvVRjQuiYDLFrqSQCdTCZHzp1z6wycKNY2ZLGnau/JyZEaJ2J0HYKYkZ61ZuJ/3nd1ES3wYTJJDUo6WJRlHLXxO7sa3fAFFLDM0sIVcze6tIRUYQam83SllBMbSb+agJ/Seui6l9XrxqXldpdnk4RTuAUzsGHG6jBA9ShCRQQnuEFXp3MeXPenY9Fa8HJZ45hCc7nD37Lk5I=
    n
    19

    View full-size slide

  24. 機械学習と科学的理解
    科学的発⾒以外に「科学的理解」(法則の発⾒)をゴールにすれば良い?

    → 経験則の延⻑である機械学習は恣意性を含むため本質的に難しい…
    例) 次の数列の□は?

      2、4、□、8 2、4、2、8
    AAAB+XicbVDLTgJBEOzFF+IL9ehlIjHxRHaNryPRi0eMIiSwIbPDLEyYx2Zm1oRs+ASvevZmvPo1Hv0TB9iDgJV0UqnqTndXlHBmrO9/e4WV1bX1jeJmaWt7Z3evvH/wZFSqCW0QxZVuRdhQziRtWGY5bSWaYhFx2oyGtxO/+Uy1YUo+2lFCQ4H7ksWMYOukB9yV3XLFr/pToGUS5KQCOerd8k+np0gqqLSEY2PagZ/YMMPaMsLpuNRJDU0wGeI+bTsqsaAmzKanjtGJU3ooVtqVtGiq/p3IsDBmJCLXKbAdmEVvIv7ntVMbX4cZk0lqqSSzRXHKkVVo8jfqMU2J5SNHMNHM3YrIAGtMrEtnbkskxi6TYDGBZfJ0Vg0uqxf355XaTZ5OEY7gGE4hgCuowR3UoQEE+vACr/DmZd679+F9zloLXj5zCHPwvn4B+COUZg==
    an
    AAAB93icbVDLSgNBEOyNrxhfUY9eFoPgKeyKr2PQi8cEzAOSJcxOepMhM7PLzKywhHyBVz17E69+jkf/xEmyBxMtaCiquunuChPOtPG8L6ewtr6xuVXcLu3s7u0flA+PWjpOFcUmjXmsOiHRyJnEpmGGYydRSETIsR2O72d++wmVZrF8NFmCgSBDySJGibFSQ/bLFa/qzeH+JX5OKpCj3i9/9wYxTQVKQznRuut7iQkmRBlGOU5LvVRjQuiYDLFrqSQCdTCZHzp1z6wycKNY2ZLGnau/JyZEaJ2J0HYKYkZ61ZuJ/3nd1ES3wYTJJDUo6WJRlHLXxO7sa3fAFFLDM0sIVcze6tIRUYQam83SllBMbSb+agJ/Seui6l9XrxqXldpdnk4RTuAUzsGHG6jBA9ShCRQQnuEFXp3MeXPenY9Fa8HJZ45hCc7nD37Lk5I=
    n
    19

    View full-size slide

  25. 機械学習と科学的理解
    科学的発⾒以外に「科学的理解」(法則の発⾒)をゴールにすれば良い?

    → 経験則の延⻑である機械学習は恣意性を含むため本質的に難しい…
    例) 次の数列の□は?

      2、4、□、8
    機械学習は「□に何が来ても」都合の良いように説明できてしまう!!

    → 反証の余地がない「なんでもOK」な説明はもはや説明ではない
    AAAB+XicbVDLTgJBEOzFF+IL9ehlIjHxRHaNryPRi0eMIiSwIbPDLEyYx2Zm1oRs+ASvevZmvPo1Hv0TB9iDgJV0UqnqTndXlHBmrO9/e4WV1bX1jeJmaWt7Z3evvH/wZFSqCW0QxZVuRdhQziRtWGY5bSWaYhFx2oyGtxO/+Uy1YUo+2lFCQ4H7ksWMYOukB9yV3XLFr/pToGUS5KQCOerd8k+np0gqqLSEY2PagZ/YMMPaMsLpuNRJDU0wGeI+bTsqsaAmzKanjtGJU3ooVtqVtGiq/p3IsDBmJCLXKbAdmEVvIv7ntVMbX4cZk0lqqSSzRXHKkVVo8jfqMU2J5SNHMNHM3YrIAGtMrEtnbkskxi6TYDGBZfJ0Vg0uqxf355XaTZ5OEY7gGE4hgCuowR3UoQEE+vACr/DmZd679+F9zloLXj5zCHPwvn4B+COUZg==
    an
    AAAB93icbVDLSgNBEOyNrxhfUY9eFoPgKeyKr2PQi8cEzAOSJcxOepMhM7PLzKywhHyBVz17E69+jkf/xEmyBxMtaCiquunuChPOtPG8L6ewtr6xuVXcLu3s7u0flA+PWjpOFcUmjXmsOiHRyJnEpmGGYydRSETIsR2O72d++wmVZrF8NFmCgSBDySJGibFSQ/bLFa/qzeH+JX5OKpCj3i9/9wYxTQVKQznRuut7iQkmRBlGOU5LvVRjQuiYDLFrqSQCdTCZHzp1z6wycKNY2ZLGnau/JyZEaJ2J0HYKYkZ61ZuJ/3nd1ES3wYTJJDUo6WJRlHLXxO7sa3fAFFLDM0sIVcze6tIRUYQam83SllBMbSb+agJ/Seui6l9XrxqXldpdnk4RTuAUzsGHG6jBA9ShCRQQnuEFXp3MeXPenY9Fa8HJZ45hCc7nD37Lk5I=
    n
    19

    View full-size slide

  26. 予測・学習から理解・発⾒へ
    機械学習そのものは科学的発⾒も科学的理解ももたさらない…

    → あくまで現⾏の機械学習の⽬的は「予測」そのもの
    では科学のゴールの「理解」や「発⾒」を⽬指すには?
    理解では予測が当たるモデルから多⾓的に間接証拠を集める地道な努⼒が⼤事


    発⾒では探索範囲(出題範囲)を上⼿に絞ることが重要 (広すぎず狭すぎず)

    → 出題範囲が広すぎたり曖昧な試験の勉強は難しい!!教科書作りも難しい!


    分かっていること(探索範囲を狭められる情報)は積極的に活⽤する

    → 専⾨家との協働、明⽰的知識・理論や論理推論との融合、先⾏知⾒活⽤
    20

    View full-size slide

  27. 科学×機械学習:チャレンジと⾯⽩さ
    科学的発⾒や科学的理解はたまたまでは得られないこと。


    科学を「試験台」にして機械学習と機械発⾒の最新技術研究ができる!

    → 最も難しい「予測が当たるか」の評価問題を最も客観的に解決可能
    たまたまだろうが何だろうが科学的発⾒や理解が実際に得られたらとにかく良し!


    ⼈⼯知能の⽂脈でも「発⾒」は重要 (私たちは⽇々発⾒し世界を理解する)


    機械発⾒はチャレンジだが技術的にもとても⾯⽩い問題がたくさん!

    → そして「理解」をゴールにするより結果が⽩⿊はっきりしてやりやすい
    21

    View full-size slide

  28. まとめ:機械学習を科学研究に使うとは?
    「機械学習」を化学に使った事例紹介


    「機械学習」とは何か


    「機械学習」と「機械発⾒」


    チャレンジと⾯⽩さ
    機械学習屋が化学の研究拠点で⼀体何をやっているのか?


    どこに⾯⽩さややりがいを感じているのか?
    今⽇伝えたいこと
    22

    View full-size slide