Slide 1

Slide 1 text

自己紹介 市川健太 @ BSN アイネット 技術開発部 水族館とゲームが好き 10/15 長女が産まれました 1

Slide 2

Slide 2 text

ボードゲームをしよう 市川健太 2021/10/22 NINNO Tech Fest #2

Slide 3

Slide 3 text

3

Slide 4

Slide 4 text

ペンギンパーティ! ● しちならべの要領で、順番にピラミッド型にカードを出していく ● 上の階層には、下の階層のどちらかと同じ色しか置けない ● 置けなかったペンギンはシャチの餌食に ● うんたらかんたら 4

Slide 5

Slide 5 text

SIGNATEコンペティション 参加レポート 市川健太 2021/10/22 NINNO Tech Fest #2

Slide 6

Slide 6 text

データ分析コンペに参加しよう! こんな人におすすめ。 ● AI を勉強したいけど何からはじめればいいの? ● 機械学習、深層学習について一通り学んだけど、自分の AI モデル作成の実力を試 したい。 6

Slide 7

Slide 7 text

機械学習、通常のプログラムとの違いとは 7 入力 プログラム 出力 通常のプログラム 機械学習 入力 モデル 出力 人間がルールを書く 大量のデータから パターンを学習する

Slide 8

Slide 8 text

機械学習のモデルどうやって開発するの? 8 学習データ モデル開発・評価 モデル 入力データ モデル 推論結果 開発フェーズ 利用フェーズ

Slide 9

Slide 9 text

機械学習のコンペってお金かかりそう? ● 機械学習って、すごいGPUを積んだスーパーコンピューターでゴリゴリ計算しなけれ ばいけないのでは? ● ハードルが高い? 9

Slide 10

Slide 10 text

無償の学習環境のご紹介 ● Google Colaboratory (https://colab.research.google.com/notebooks/welcome.ipynb?hl=ja) ○ Google が提供するクラウドで Pythonの記述・実行ができる環境 ○ メリット ■ Google アカウントさえあれば、無料で環境を利用できる ■ 初めから機械学習用のライブラリがインストールされている ■ GPU の高速演算も利用できる (利用状況に応じて制限あり、月 1,072円で制限緩 和) 10

Slide 11

Slide 11 text

初心者向けのコンペあります! ● 毎月開催 称号限定コンペ ● 練習問題 11

Slide 12

Slide 12 text

SIGNATE コンペに参加してみた 12

Slide 13

Slide 13 text

13

Slide 14

Slide 14 text

14 肝疾患が あるか 健康診断データ

Slide 15

Slide 15 text

コンペの進め方 - データ準備からモデル学習 15 学習データ 学習・評価 データ分割 モデル テストデータ 前処理 学習・評価デー タ1 データ準備 モデル 学習・評価デー タ1 モデル 学習・評価デー タ1 モデル 学習・評価デー タ1 モデル n 学習・評価デー タ n モデル学習 前処理 k分割交差検証

Slide 16

Slide 16 text

コンペの進め方 - モデルの評価 16 モデル 評価値 評価データ 評価データからモデルの精度を評価 モデル 評価値 評価データ モデル 評価値 評価データ モデル 評価値 評価データ モデル n 評価値 n 評価データ 評価値

Slide 17

Slide 17 text

コンペの進め方 - 提出データ 17 モデル 評価値 テストデータ テストデータから結果を出力 モデル 評価値 テストデータ モデル 評価値 てすトデータ モデル 評価値 テストデータ モデル n 評価値 n テストデータ 評価値 コンペに提出 サイト側で、コンペの評価値を計算

Slide 18

Slide 18 text

試した手法 ● ランダムフォレスト ● ロジスティック回帰 ● Adaboost ● XGBoost ● LightGBM ● SVM ● Deep Learning など 18

Slide 19

Slide 19 text

コンペで使われる定番モデル ● LightBGM ○ 決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワーク ● BERT (自然言語処理) ○ Googleによって開発された自然言語処理の事前学習用のための Transformerベースの機械学習 手法 19

Slide 20

Slide 20 text

20

Slide 21

Slide 21 text

21

Slide 22

Slide 22 text

さいごに ゲーム感覚でスキルアップ いい順位を取りたいから、あの手この手で頑張る SIGNATE に飽きたら Kaggle にも挑戦! 22