Save 37% off PRO during our Black Friday Sale! »

AIを使うことになった時に知っておいたら良いこと

 AIを使うことになった時に知っておいたら良いこと

社内LT(2017/11/10)

1e052f21acbe2fc218ac8891b2383f4c?s=128

Kazuhiro Shiota

November 27, 2017
Tweet

Transcript

  1. AIを使うことになった時に 知っておいたら良いこと @k_shiota

  2. まずはじめに

  3. AIとは AIとは 結構古くから研究されている ビックデータの活用、マシン向上(GPU)による成長 Source : https://blogs.nvidia.co.jp/2016/08/09/whats-difference-artificial-intelligence-machine-learning-deep-learning-ai/

  4. 実際にやったこと

  5. AIで何をするか

  6. 何をしたい? • まずは目的を明確にする • どんなことを実現したいか • 何を予測したいか

  7. 記事を公開する前にPVを予測したい

  8. どんな方法があるか • 機械学習?深層学習? • 教師データから予測する → 機械学習 • 回帰?分類? •

    PV数を予測するので回帰 • どのアルゴリズムで? • 色々ある(回帰分析、勾配ブースティングetc) • いきなりは難しい • まずはどんな傾向があるか調べる
  9. 傾向を探る • どんなデータ(数値)を取れるかを知る • 取得できるものは自然と絞られる • タイトル/本文の形態素解析、感情分析 • 各数値との相関があるか •

    PVと各数値に傾向があるか • グラフにしてみる • CSV出力して眺める(意外と重要) • 予想と結果をまとめる
  10. 役に立った便利なツール • Pandas • CSVやexcelを取り込んでデータ加工 • 取り込んだデータの統計量を見れる • dataframe.describe() →

    統計量 • dataframe.corr() → 相関係数
  11. 便利なツール・その2 • scikit-learn • 機械学習ライブラリ • matplotlib,bokeh • グラフ作成

  12. 結果

  13. 現状の数値から相関は見られなかった

  14. 便利なAPI

  15. 学習済みモデルを使ったAPI • 文章解析 • Google Cloud Natural Language API •

    Text Classification API(A3RT) • 学習データから独自のモデルを作成できる • 文章の誤り抽出 • Yahoo! 校正支援API → CMSの本文校正 • 音声データをテキストデータにする • Google Cloud Speech API → テープ起こし
  16. 機械学習の民主化

  17. 機械学習の民主化 • Automated Machine Learning • TPOT • https://rhiever.github.io/tpot/ •

    データサイエンスコンペ • Kaggle • https://www.kaggle.com • 様々なデータセット
  18. まとめ

  19. まとめ • まずはゴールを明確にする • 便利なツールを使う • 学習済みのAPIを利用する • 難しく考えずにやってみる •

    とはいえ数式を読める方が良い