Upgrade to Pro — share decks privately, control downloads, hide ads and more …

実務と研究のはざまで格闘する / Struggling between practice and research

Sansan DSOC
December 13, 2021

実務と研究のはざまで格闘する / Struggling between practice and research

■イベント 
:Sansan R&D・エンジニア新卒LT会
https://sansan.connpass.com/event/228690/

■登壇概要
タイトル:実務と研究のはざまで格闘する
発表者: 
R&D 研究員  小松 尚太

▼Twitter
https://twitter.com/SansanRandD

Sansan DSOC

December 13, 2021
Tweet

More Decks by Sansan DSOC

Other Decks in Technology

Transcript

  1. 実務と研究のはざまで格闘する
    Sansan株式会社 技術本部 DSOC
    R&D 研究員 ⼩松尚太

    View full-size slide

  2. Data Strategy and Operation Center
    ⾃⼰紹介
    • 農学修⼠
    • 2020年5⽉⼊社
    • 前職はコートジボワールにある国際農業研究機関
    ⼩松 尚太
    Sansan株式会社 技術本部 DSOC
    R&D 研究員
    Shota Komatsu
    オンライン名刺

    View full-size slide

  3. Data Strategy and Operation Center
    なぜSansanに⼊社しようと思ったか?
    1. データ分析がよりクリティカルに活きる現場で働きたくなったから。
    2. 実務と研究を橋渡しできる役割を担いたいと思ったから。
    3. 社会科学系の⼈材を積極活⽤している、⽇系で数少ないTech企業だから。

    View full-size slide

  4. Data Strategy and Operation Center
    これまでの主な業務内容
    1. 現業⽀援系のデータ分析
    • A/Bテストの実⾏により、既存ビジネスの改善を⽬指す。
    • 探索的データ分析により、新規ビジネスのポテンシャルの⾒極める。
    2. ハイレベルな学術雑誌への投稿を⽬指した研究の遂⾏
    • 新規技術の獲得や、研究を通じた世界への貢献を⽬指し、外部研究者との共同
    研究を積極的に実施している。
    • ユニークなデータを使って、野⼼的な問いに答える。

    View full-size slide

  5. Data Strategy and Operation Center
    ⼊社から1年半経過して思うこと
    • ⼤学院・前職での経験は間違いなく活きている。
    • ビジネスの理解、継続的な技術のキャッチアップをしていかないと死ぬ。
    • 現業⽀援と研究開発を良いバランスで取り組めている。

    View full-size slide

  6. 現業⽀援系分析の例:
    名刺アプリ「Eight」でのA/Bテスト

    View full-size slide

  7. 名刺アプリ
    Y o u r B u s i n e s s N e t w o r k

    View full-size slide

  8. Data Strategy and Operation Center
    A/Bテストのデザイン
    • ユーザー体験向上を⽬指した施策の効果検証を、Eight上で実施した。
    • 事前に⾏った探索的データ分析により、産業により効果の⼤⼩があること
    が⽰唆された。
    • 各産業ごとにユーザーのA/B分割を⾏うことで、推定値の分散を⼩さくした。

    View full-size slide

  9. Data Strategy and Operation Center
    A/Bテストの結果
    A/Bテスト開始

    View full-size slide

  10. Data Strategy and Operation Center
    現業⽀援系分析の⾯⽩さと難しさ
    ⾯⽩さ
    • ⾃分の分析が意思決定に寄与できる。
    • 各エキスパートと共同して成果を出す楽しさがある。
    難しさ
    • 分析課題を⾃ら掘り起こしていけるか。
    • 課題を整理し、分析で解くべき課題が何かを整理できるか。
    • 分析の正確性を損なわず、結果をどうわかりやすく伝えるか。

    View full-size slide

  11. ビジネスネットワークの起源を解明する

    View full-size slide

  12. Data Strategy and Operation Center
    答えたい問い
    • ビジネスのネットワークはどのようにして形成されるのか。
    • ネットワーク形成モデルをスケーラブルに推定することは可能か。
    • 推定したネットワーク形成モデルを⽤いて、どのような現実問題に対して
    答えを出すことができるか。

    View full-size slide

  13. Data Strategy and Operation Center
    Research Team – Sansan DSOC
    Takanori Nishida
    ⻄⽥ 貴紀
    Sansan Inc.
    DSOC R&D Department SocSci Group
    Manager / Researcher
    Juan Martínez
    マルティネスフアン
    Sansan Inc.
    DSOC R&D Department SocSci Group
    Researcher/ PhD in economics
    Shota Komatsu
    ⼩松 尚太
    Sansan Inc.
    DSOC R&D Department SocSci Group
    Researcher

    View full-size slide

  14. Data Strategy and Operation Center
    Research Team – Collaborator
    Angelo Mele
    Angelo Mele is an Associate Professor of Economics at Johns
    Hopkins University - Carey Business School. His research analyses
    how social and strategic interactions affect individual and aggregate
    socioeconomic outcomes. His work has been published in
    Econometrica, American Economic Journal: Economic Policy and
    Review of Economics and Statistics, Regional Science and Urban
    Economics. He has a PhD in Economics from University of Illinois at
    Urbana-Champaign.

    View full-size slide

  15. Data Strategy and Operation Center
    ERGMを⽤いたネットワーク形成モデリング
    • ERGM (Exponential Random Graph Model) を⽤いる。
    • ネットワークの分布が、エッジの数、三⾓形の数など、ネットワークの統計量
    で決まるとしてモデリングする。
    • 共通の友⼈の存在によりつながりやすくなるといった、第三者の効果を取り⼊
    れることが可能。
    • 推定はとにかく難しい。詳細は以下のSpeakerDeckを参照。
    https://speakerdeck.com/sansandsoc/the-economics-of-business-networks-estimation-and-applications-at-scale

    View full-size slide

  16. Data Strategy and Operation Center
    共同研究の⾯⽩さと難しさ
    ⾯⽩さ
    • トップランナーの研究者と知のフロンティアを開拓できる、またとない機会。
    • データに対するユニークな視点が得られ、データへの理解が深まる。
    難しさ
    • ⾼度な研究遂⾏能⼒が必要。研究分野のキャッチアップが不可⽋。
    • 複雑で巨⼤なデータセットのデータハンドリング能⼒や、スケーラブルな推定⽅
    法の模索が求められる。
    • 研究成果をビジネスにどう還元するか。

    View full-size slide

  17. Data Strategy and Operation Center
    最後に
    • 現業⽀援と研究開発を共に⾼いレベルで⾏える稀有な環境である。
    > ⾯⽩いことを⼀緒にやっていきましょう。

    View full-size slide

  18. Data Strategy and Operation Center
    宣伝:経済セミナーに寄稿しています
    • 再現性ある研究の遂⾏をサポートするツール紹介 (Git/GitHub, Docker,...)

    View full-size slide