Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DSOC 画像系研究員の働き⽅:インターンシップ・フルリモート・京都勤務を経験して / How an Image Processing Researcher Works at DSOC

Sansan DSOC
November 13, 2020

DSOC 画像系研究員の働き⽅:インターンシップ・フルリモート・京都勤務を経験して / How an Image Processing Researcher Works at DSOC

■イベント 
:Sansan R&D・エンジニア20卒新卒LT会
https://sansan.connpass.com/event/191627/

■登壇概要
タイトル:DSOC 画像系研究員の働き⽅:インターンシップ・フルリモート・京都勤務を経験して
発表者: 
DSOC R&D研究員 内田 奏

▼Twitter
https://twitter.com/SansanRandD

Sansan DSOC

November 13, 2020
Tweet

More Decks by Sansan DSOC

Other Decks in Technology

Transcript

  1. Data Strategy and Operation Center ⾃⼰紹介 2020/03: 東京電機⼤学⼤学院 ⼯学研究科 情報通信⼯学専攻

    修了 局所特徴量を⽤いたトラッキング,Metric Learningを⽤いたファッション 画像の特徴抽出,超解像・画像縮⼩を中⼼とした画像⽣成の研究に従事 2020/04: Sansan株式会社 ⼊社 (インターンとしては2018/10より在籍) 画像⽣成技術を応⽤した名刺画像補正やOCR精度改善に関する研究に従事 内⽥ 奏 So Uchida twitter.com/s_aiueo32 github.com/S-aiueo32 Sansan 株式会社 DSOC R&D(研究開発部) Automation Group 研究員
  2. Data Strategy and Operation Center サマーインターンシップ 共通のデータからそれぞれのテーマを設定・分析・成果発表 • ビジネス上の課題は何か? /

    何がユーザの価値につながるか? • 実現可能性を踏まえ,メンターと相談しながらテーマを決定 最終成果報告会 中間報告会 https://jp.corp-sansan.com/mimi/2018/09/2018_rd_summer_intern_2.html
  3. Data Strategy and Operation Center サマーインターンを通して テーブルデータほぼ未経験からなんとか切り抜けた • メンター社員の⼿厚いサポート •

    時間を意識して仕事に向き合うこと > 短期的な実現可能性を考慮したテーマ選定 > 時間を意識したコーディング • 処理時間の可視化・把握 / 実⾏回数等で優先順位を設けて⼯夫するか判断 インターン仲間が超優秀 • 異分野の強い⼈が集まるため,様々なアイデアが出てくる • 「こんな⼈たちと働きたい」という気持ち
  4. Data Strategy and Operation Center ⻑期インターンシップ 超解像 • 超解像: 画像の解像度を上げる技術

    • 名刺を拡⼤して⽂字認識精度向上 ホワイトニング • カメラ撮影名刺の影除去&輝度の引き上げ • Eightで名刺を取り込むと体験できます!!! M1の10⽉から画像タスクを任せてもらうことに
  5. Data Strategy and Operation Center Automation Group の構成 (当時) Sansan⻑岡ラボ

    (2名) Sansan Innovation Lab(2名) Sansan札幌ラボ (1名) 表参道オフィスには ⾃分ただ1⼈
  6. Data Strategy and Operation Center ⻑期インターンシップの進め⽅ コミュニケーションは基本オンライン • 基本的に連絡はSlack上で >

    Slackに個⼈タイムラインがあり,困ったら誰かが助けてくれる • Google Meet上で週1で定例会 > タスク管理はAsanaベースで⾏われる > タスクの進捗・⽅針を話しながら,みんなでカンバンボードを操作 ⽉1の出張でメンバーが東京に集結 (現在は停⽌中) • プロジェクト初期の⽅針決定などはここでやる
  7. Data Strategy and Operation Center ⻑期インターンを通して AWS/GCP上での開発を経験 • 開発は基本的にEC2インスタンスおよびその他リソースを利⽤ >

    必要とあらばGPUを浴びることも可能 ⾃⾝の専⾨性を評価してもらえる • 多様なメンバーが個々⼈の強みを認識・評価しあう⾵⼟がある • ⾃分の作ったモデルがビジネス的にOKなのかも評価 > Data Management Groupによるチェック・フィードバック 普通の業務以外にも⾊々経験できた • Sansan Builders Blogでの連載, 弊社主催勉強会への登壇 etc.
  8. Data Strategy and Operation Center 京都勤務でやったこと ⾃社製OCRライブラリの開発 • 名刺に特化したOCRライブラリ開発は最優先課題の1つ >

    OCRの信頼性向上によるデータ化コスト削減 > 即時データ化によるユーザ体験の向上 • メンターはKaggle Grandmaster > データの肌感からモデルの詳細までアドバイスが常にもらえる > (実はまだまだ京都にいたい…) ※OCR: 光学⽂字認識 おかげさまでモデルをリリースして帰ってきました!
  9. Data Strategy and Operation Center Take-home message ビジネスにおける「価値」に向き合う • 専⾨性やスピードなど,あらゆるものが「価値」となりうる

    • 常に意識しながら取り組むことがとにかく⼤事 形態問わず,コミュニケーションは最重要 • 会社の規模・部署の役割的に縦横無尽にコミュニケーションが発⽣します • 「相⼿との共通⾔語は何なのか?」を常に考える 「新卒だから」はない • 全員が裁量を持って,⼤きなタスクに向き合っています • 後輩に対して「新卒なのに」と⾔わせて欲しい