Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データサイエンスブートキャンプ参加報告_石村

a-ishimura
August 07, 2019
250

 データサイエンスブートキャンプ参加報告_石村

a-ishimura

August 07, 2019
Tweet

Transcript

  1. 自己紹介 • 石村 麻莉彩 – いしむら ありさ • GxP(株) –

    職業:ITエンジニア – 役割:顧客と開発チームの間にいる人 • データサイエンスは? – 顧客のお悩みはこの分野増えてる – 少しずつ絡めていきたいけどまだお遊 び程度 Copyright© Growth xPartners, Inc. All rights reserved. 1
  2. グロースエクスパートナーズ(株) • 会社概要 –設立:2008年7月4日 –本社所在地:西新宿の野村ビル –主要事業分野 » グループ各社の経営 –関連会社が7社 »

    システムインテグレーション事業 » クリエイティブ・プロデュース事業 » 飲食事業など Copyright© Growth xPartners, Inc. All rights reserved. 10
  3. 対数正規分布 それじゃ統計的手法使う意味なくない? • 統計:結果にどのパラメータがどう影響するか 知りたい Copyright© Growth xPartners, Inc. All

    rights reserved. 40 パラメータ 結果(予測値) 統計 精度より説明力 どのパラメータがどう変われば この結果がどう変化しそう? テキトーじゃダメ。 きちんと選んできちん と処理する。
  4. 対数正規分布 それじゃ統計的手法使う意味なくない? • 機械学習:ブラックボックスでいいから予測や 分類をしたい Copyright© Growth xPartners, Inc. All

    rights reserved. 41 パラメータ 機械学習 結果(予測値) とにかくここがいい感 じになればいいよ! どう影響したかは雰囲 気でオッケー 98%当てるけど当たら ない2%がどういう場 合かは運まかせ
  5. 対数正規分布 それじゃ統計的手法使う意味なくない? • 統計:結果にどのパラメータがどう影響するか 知りたい Copyright© Growth xPartners, Inc. All

    rights reserved. 42 パラメータ 結果(予測値) 統計 精度より説明力 どのパラメータがどう変われば この結果がどう変化しそう? テキトーじゃダメ。 きちんと選んできちん と処理する。 これ説明できなくていいなら機 械学習使った方がよくない?
  6. 対数正規分布 でもそれってどういうことなの? • ヒストグラム見てロングテールだったらとりあ えず対数取ればいいのか →積として成り立っていそうかどうかという基準 があった • モデルが実際の値に近い線を描いたり、予測精 度が上がればそれが正解なのか

    →上記の理屈にあてはまりそうにない場合は精度 が上がるからやればいいってもんではなさそう (とはいえ目的が予測ならそれでもいいかも) Copyright© Growth xPartners, Inc. All rights reserved. 46
  7. まとめ EDA Salonって? • EDA(Exploratory Data Analysis) 探索的データ分析 • Exploratoryのスタッフが毎月お題を出して、

    オンラインでみんなの分析結果を共有するやつ • 7月から始まった。8月から参加する予定。 https://exploratory.io/note/kanaugust/EDA- Salon-crT4VNp7aa Copyright© Growth xPartners, Inc. All rights reserved. 49