Slide 1

Slide 1 text

DATA SCIENTIST TALK#1 私が特許を取得できたワケ ⽇本アイ・ビー・エム株式会社 テクノロジーエキスパートラボ(Data&AI) 河津 宏美 2023/6/9 1

Slide 2

Slide 2 text

本セッションのSNS投稿について SNS投稿︓ 全てOK OK: テキストによる⽂字のみの投稿 OK: スクリーンショットの画像/動画を含んだ投稿 ハッシュタグ: #WiDS2023 #WiDSTokyoIBM

Slide 3

Slide 3 text

アジェンダ • ⾃⼰紹介 • 所属部⾨紹介 • IBMでのキャリア • ハードウェア開発エンジニア • データサイエンティスト • マネージャ • まとめ • 特許を取得できたワケ

Slide 4

Slide 4 text

⾃⼰紹介 河津 宏美(カワツ ヒロミ) テクノロジーエキスパートラボ Data&AI部 データサイエンスサービス課 マネージャ 座右の銘 「チャンスの⼥神様には前髪しかない」 IBMでのキャリア 2009年 ハードウェア開発エンジニア 2014年 ボランティア休暇@ケニア(1か⽉) 2015年 データサイエンティスト 2019年 産休・育休 2021年 復職 2022年 産休・育休 2023年 復職、マネージャ

Slide 5

Slide 5 text

所属部⾨紹介 ためる - Collect – あらゆるデータを活⽤できるように蓄積 つなぐ - Organize – 蓄積したデータを使いやすいよう整える 組み込む - Infuse – AIの活⽤・管理 分析する - Analyze – お客様のビジネスを加速化 させるための可視化/分析 テクノロジーエキスパートラボ Data&AI部 データサイエンスサービス課 • 担当するIBM製品のスペシャリスト • お客様のビジネス課題を解決するため、IBMのソフトウェア製品を活⽤ • 世界各国に拠点を置く研究・開発チームとも連携 モダナイズ Modernize ハイブリッド/ マルチクラウド ソフトウェア製品例 Watson SPSS Modeler DataStage DB2

Slide 6

Slide 6 text

ハードウェア開発エンジニア 仕事内容 ボランティア休暇 データサイエンティスト 仕事内容 プロジェクト(特許取得) Kaggle (特許取得) マネージャ 1⽇のタイムスケジュール 仕事内容 IBMでのキャリア

Slide 7

Slide 7 text

ハードウェア開発エンジニア - 仕事内容 ⼤学では⾳声合成・認識のモデル化やアプリケーション開発 スキルも経験もないハードウェア開発エンジニアで内定通知 ⽇々勉強 製品マニュアル・技術マニュアル OJT(On the Job Training) 資格取得 Linux、AIX、VMware、Cisco(SAN) 英語(英語学校へ。授業料補助あり) TOEIC 500点台→900点台 お客様 お客様サポート (フロントエンド) お客様サポート (バックエンド) 開発者 (アメリカ/イスラエル) 開発部⾨ IBM

Slide 8

Slide 8 text

ボランティア休暇@ケニア 参加のきっかけ メンタリングでボランティア休暇のプログラムについて 教えてもらった 内容 AMREF (African Medical and Research Foundation)様と 現地の医療事情改善に向けたコンサルティングやデータ分析を実施 ⼀⽣懸命頑張るも、先⽅はAIやDXに興味なし・・ カスタマーフェーシングの難しさも含めてやりがいを実感 異動の希望 同期からデータサイエンティスト職の公募情報を教えてもらった バックエンドからフロントエンドへ。HWからSWへ。 メンターは、私の同僚の元同僚 ある銀⾏様のアカウントマネージャ コミュニケーションをとって、 アンテナを張り巡らす やりたいことは積極的に⼿をあげる

Slide 9

Slide 9 text

ハードウェア開発エンジニア 仕事内容 ボランティア休暇 データサイエンティスト 仕事内容 プロジェクト(特許取得) Kaggle (特許取得) マネージャ 1⽇のタイムスケジュール 仕事内容 IBMでのキャリア

Slide 10

Slide 10 text

データサイエンティスト - 仕事内容 ・お客様の期待に応えるために、最善を尽くすことを常に意識 ・⽇々勉強︓製品アルゴリズムガイド、最新技術 ⼤⼿電機メーカ様 → 社内表彰受賞 燃料電池の品質早期警告システムの開発 コンサルティング 〜 データ分析 〜 システム化 ⼤⼿カード会社様 → ドイツのIBMメンバーと協業 カード不正利⽤の分析・システム化 CRISP-DM (Cross-Industry Standard Process for Data Mining) ・データマイニングの指針となる⼿法

Slide 11

Slide 11 text

データサイエンティスト - プロジェクト(特許取得) アソシエーション分析(マーケットバスケット分析)「もし○○○ならば△△△である」 例「もしオムツを買うならばビールも買う」という⾼確率で発⽣するルールを抽出 課題︓アソシエーション分析の結果、出⼒されるルールが多く、分かりにくい 仮説︓データにはノイズ(買い忘れなど)が含まれる 結果︓期待通り、出⼒されるルールが減っていることを確認(ルール数︓125 → 22) アソシエーションルールの変化の例 ・オリジナルデータの分析よりも、サポートや確信度が向上したルールの導出が確認できた ・オリジナルデータの分析では存在しなかったルールの導出が確認できた 結果 前提条件 サポート % 確信度 % 果物・野菜 ビール and ⽸詰野菜 29.6 28.6 菓⼦ ビール and ⽸詰野菜 29.6 23.2 結果 前提条件 サポート % 確信度 % 果物・野菜 ビール and ⽸詰野菜 17.7 27.5 オリジナルデータ ノイズ除去後

Slide 12

Slide 12 text

データサイエンティスト - Kaggle(特許取得) 特許のネタ探しを⽬的にKaggleに挑戦 推定結果 Maltese dog 推定結果 komondor オリジナル画像 オリジナル画像+Saliency map オリジナル画像+Saliency mapの逆数 画像認識 ニューラルネット ラベルを推定 推定結果 Maltese dog 正 解 不 正 解 正 解 画像認識ニューラルネットにおいて、 学習データを効率的に増やすために Saliency mapに着⽬ ⼈が画像を⾒たときに注⽬しやすい 場所を推定したヒートマップ ピクセル値の変化が、ラベルの推定 スコアにどの程度影響を与えているかを 推定したヒートマップ

Slide 13

Slide 13 text

ハードウェア開発エンジニア 仕事内容 ボランティア休暇 データサイエンティスト 仕事内容 プロジェクト(特許取得) Kaggle (特許取得) マネージャ 1⽇のタイムスケジュール 仕事内容 IBMでのキャリア

Slide 14

Slide 14 text

マネージャ - 1⽇のタイムスケジュール 4時 起床。授乳、勉強 6-9時 ⾳信不通 ⼦どものお世話、家事 9-18時 仕事 18-21時 ⾳信不通 ⼦どものお世話、家事(⼣⾷は宅配弁当を利⽤) 22時 仕事。就寝 不定期 ⼦どもの体調不良などで保育園から呼び出し

Slide 15

Slide 15 text

マネージャ - 仕事内容 業務を離れて頭のリフレッシュ ・特許のネタ探し(パテントマイニング) ・データ分析の最新技術 管理・⼈事系 • チーム⼒強化 スキル/コミュニケーション/モチベーションの向上 • ライフワークバランス 勤務時間/休暇の管理 • 異動・給与調整 プロジェクト系 • ビジネスプランの検討 • 新規/継続案件の提案⽅針検討 • トラブル案件の対応策検討 マネージャの基本の「き」から勉強中

Slide 16

Slide 16 text

まとめ 特許を取得できたワケ • IBMの環境(メンタリング/プログラム/同僚 など) • 勉強を継続した • コミュニケーションをたくさんとって、アンテナを張り巡らした • 不安があっても、積極的にチャレンジした • お客様の期待に応えるために、最善を尽くした • 業務を離れて、頭をリフレッシュする時間をつくった

Slide 17

Slide 17 text

#WiDS2023 #WiDSTokyoIBM Thank you!