Upgrade to Pro — share decks privately, control downloads, hide ads and more …

機械学習の再現性 / Enabling Reproducibility in Machine ...

Kon
November 03, 2018

機械学習の再現性 / Enabling Reproducibility in Machine Learning Workshop

Kon

November 03, 2018
Tweet

More Decks by Kon

Other Decks in Science

Transcript

  1. Yu Ohori (a.k.a. Kon) NS Solutions Corporation (Apr 2017 -

    ) • Researcher • Data Science & Infrastructure Technologies • System Research & Development Center • Technology Bureau @Y_oHr_N @Y-oHr-N #SemiSupervisedLearning #AnomalyDetection #DataOps
  2. 1st Enabling Reproducibility in Machine Learning Workshop • 11 invited

    talks • 2 contributed talks • 16 posters の中から 2 本紹介 3
  3. ML-Schema: Exposing the Semantics of Machine Learning with Schemas and

    Ontologies ハイレベルな相互運用を達成するため機械学習オントロジーを提案したお話 Publio, G. C., Esteves, D., Lawrynowicz, A., Panov, P., Soldatova, L., Soru, T., Vanschoren, J., and Zafar, H. https://github.com/ML-Schema/documentation 4
  4. オントロジー(ontology) AI の文脈で「概念化の明示的な記述」を指す用語 • 本来の意味は「存在論」 Gruber, T. R., "A translation

    approach to portable ontology specifications," Knowledge acquisition, 5(2), pp. 199-220, 1993. 乗り物 機能 種類 船 陸上車 飛行機 四輪車 汽車 属性 二輪車 7
  5. 8

  6. Terse RDF Triple Language (Turtle) による記述例 :run100241 rdf:type owl:NamedIndividual ,

    mls:Run ; mls:hasInput :credit-a ; mls:realizes :logisticRegression ; mls:hasOutput :modelEvaluation100241 ; mls:achieves :task29 ; mls:executes :wekaLogistic ; mls:hasInput :wekaLogisticMSetting29 ; mls:hasOutput :wekaLogisticModel100241 ; mls:hasInput :wekaLogisticRSetting29 . 11
  7. Reproducible Research Environments with repo2docker 環境を容易に再現できるツールを開発したお話 Forde, J., Head, T.,

    Holdgraf, C., Panda, Y., Perez, F., Pacer, M., Nalvarte, G., Ragan-Kelley, B., and Sundell, E. https://github.com/jupyter/repo2docker 13
  8. repo2dokcer Git リポジトリからイメージを構築する CLI ツール $ jupyter-repo2docker <path-to-repo> --ref <branch-name>/<hash-name>

    • Project Jupyter が 2017 年にリリース • setup.py などの設定ファイルを探索 • 構築後,ローカル Jupyter サーバを起動 19
  9. binder Git リポジトリから Jupyter サーバを構築するサービス https://mybinder.org/v2/gh/<org-name>/<repo-name>/<branch|tag|hash-name>?filepath=<path-to-file> • Project Jupyter が

    2016 年にリリース • 誰でも,いつでも,どこでも,環境を再現可能 • 内部で repo2docker を利用 Freeman J., and Osheroff, A., "Toward publishing reproducible computation with binder," eLife, 2016. 20