Slide 1

Slide 1 text

DSOC 画像系研究員の働き⽅ - インターンシップ・フルリモート・京都勤務を経験して - Sansan株式会社 DSOC R&D研究員 内⽥ 奏 R&D・エンジニア20卒新卒LT会@2020/11/13

Slide 2

Slide 2 text

Data Strategy and Operation Center ⾃⼰紹介 2020/03: 東京電機⼤学⼤学院 ⼯学研究科 情報通信⼯学専攻 修了 局所特徴量を⽤いたトラッキング,Metric Learningを⽤いたファッション 画像の特徴抽出,超解像・画像縮⼩を中⼼とした画像⽣成の研究に従事 2020/04: Sansan株式会社 ⼊社 (インターンとしては2018/10より在籍) 画像⽣成技術を応⽤した名刺画像補正やOCR精度改善に関する研究に従事 内⽥ 奏 So Uchida twitter.com/s_aiueo32 github.com/S-aiueo32 Sansan 株式会社 DSOC R&D(研究開発部) Automation Group 研究員

Slide 3

Slide 3 text

サマーインターンシップ

Slide 4

Slide 4 text

Data Strategy and Operation Center DSOCとの出会い M1の8⽉にDSOCのサマーインターンシップに参加

Slide 5

Slide 5 text

Data Strategy and Operation Center サマーインターンシップ 共通のデータからそれぞれのテーマを設定・分析・成果発表 • ビジネス上の課題は何か? / 何がユーザの価値につながるか? • 実現可能性を踏まえ,メンターと相談しながらテーマを決定 最終成果報告会 中間報告会 https://jp.corp-sansan.com/mimi/2018/09/2018_rd_summer_intern_2.html

Slide 6

Slide 6 text

Data Strategy and Operation Center サマーインターンを通して テーブルデータほぼ未経験からなんとか切り抜けた • メンター社員の⼿厚いサポート • 時間を意識して仕事に向き合うこと > 短期的な実現可能性を考慮したテーマ選定 > 時間を意識したコーディング • 処理時間の可視化・把握 / 実⾏回数等で優先順位を設けて⼯夫するか判断 インターン仲間が超優秀 • 異分野の強い⼈が集まるため,様々なアイデアが出てくる • 「こんな⼈たちと働きたい」という気持ち

Slide 7

Slide 7 text

⻑期インターンシップ

Slide 8

Slide 8 text

Data Strategy and Operation Center ⻑期インターンシップ 超解像 • 超解像: 画像の解像度を上げる技術 • 名刺を拡⼤して⽂字認識精度向上 ホワイトニング • カメラ撮影名刺の影除去&輝度の引き上げ • Eightで名刺を取り込むと体験できます!!! M1の10⽉から画像タスクを任せてもらうことに

Slide 9

Slide 9 text

Data Strategy and Operation Center Automation Group の構成 (当時) Sansan⻑岡ラボ (2名) Sansan Innovation Lab(2名) Sansan札幌ラボ (1名) 表参道オフィスには ⾃分ただ1⼈

Slide 10

Slide 10 text

Data Strategy and Operation Center ⻑期インターンシップの進め⽅ コミュニケーションは基本オンライン • 基本的に連絡はSlack上で > Slackに個⼈タイムラインがあり,困ったら誰かが助けてくれる • Google Meet上で週1で定例会 > タスク管理はAsanaベースで⾏われる > タスクの進捗・⽅針を話しながら,みんなでカンバンボードを操作 ⽉1の出張でメンバーが東京に集結 (現在は停⽌中) • プロジェクト初期の⽅針決定などはここでやる

Slide 11

Slide 11 text

Data Strategy and Operation Center ⻑期インターンを通して AWS/GCP上での開発を経験 • 開発は基本的にEC2インスタンスおよびその他リソースを利⽤ > 必要とあらばGPUを浴びることも可能 ⾃⾝の専⾨性を評価してもらえる • 多様なメンバーが個々⼈の強みを認識・評価しあう⾵⼟がある • ⾃分の作ったモデルがビジネス的にOKなのかも評価 > Data Management Groupによるチェック・フィードバック 普通の業務以外にも⾊々経験できた • Sansan Builders Blogでの連載, 弊社主催勉強会への登壇 etc.

Slide 12

Slide 12 text

京都勤務

Slide 13

Slide 13 text

Data Strategy and Operation Center Sansan Innovation Lab

Slide 14

Slide 14 text

Data Strategy and Operation Center 京都勤務でやったこと ⾃社製OCRライブラリの開発 • 名刺に特化したOCRライブラリ開発は最優先課題の1つ > OCRの信頼性向上によるデータ化コスト削減 > 即時データ化によるユーザ体験の向上 • メンターはKaggle Grandmaster > データの肌感からモデルの詳細までアドバイスが常にもらえる > (実はまだまだ京都にいたい…) ※OCR: 光学⽂字認識 おかげさまでモデルをリリースして帰ってきました!

Slide 15

Slide 15 text

最後に

Slide 16

Slide 16 text

Data Strategy and Operation Center Take-home message ビジネスにおける「価値」に向き合う • 専⾨性やスピードなど,あらゆるものが「価値」となりうる • 常に意識しながら取り組むことがとにかく⼤事 形態問わず,コミュニケーションは最重要 • 会社の規模・部署の役割的に縦横無尽にコミュニケーションが発⽣します • 「相⼿との共通⾔語は何なのか?」を常に考える 「新卒だから」はない • 全員が裁量を持って,⼤きなタスクに向き合っています • 後輩に対して「新卒なのに」と⾔わせて欲しい

Slide 17

Slide 17 text

ホントに最後に

Slide 18

Slide 18 text

名刺のデータ化を⽀える 仲間を募集しています!

Slide 19

Slide 19 text

No content