Slide 1

Slide 1 text

コネヒトにおける 機械学習・データ関連業務の紹介資料 最終更新:2023/04/04

Slide 2

Slide 2 text

本資料の目的 コネヒトでは Tech vision の1つに 1 to 1 AI というStrategyを掲げており、 パーソナライズや自然言語処理を活用したコミュニティ改善などの分野に 積極的にチャレンジしていく予定です この資料では、機械学習・データに関連する活用事例や取り組み、 今後チャレンジしていきたいことについてお伝えできればと思います

Slide 3

Slide 3 text

目次 1. コネヒトという会社について 2. プロダクトの紹介 3. 取り扱うデータの種類 4. ML活用事例・取り組み 5. 2025年までに取り組みたいチャレンジ 6. MLエンジニアの役割・利用技術 7. 採用に関する情報 8. Appendix

Slide 4

Slide 4 text

1. コネヒトという会社について

Slide 5

Slide 5 text

コネヒトのVISION ありとあらゆる価値観が見つめ直され、 それぞれに思い描く家族の姿はどんどん変わっている 家族の数だけ形があって、つくりたい未来がある 私たちコネヒトは「家族像」というテーマに向き合う会社です

Slide 6

Slide 6 text

コネヒトのVALUE 肯定から始めよう Affirm & Follow 驚かせよう Surprise 他者の発言やチャレンジを肯定することか ら始め、フォローしよう 肯定から生まれるポジティブなエネルギー をフォローによりアウトプットにつなげる 仲間であろう 仲間やユーザーやクライアントや、業界や社会 の期待を超えた驚きを与え続けよう みんなの幸せな姿にワクワクし「ユニークな発 想」「つきつめた考え」「やり遂げる気概」を もって驚きを与えるプロフェッ ショナルであ ろう

Slide 7

Slide 7 text

コネヒトの事業 「あなたの家族像が実現できる社会をつくる」 というVISIONに基づく中期的な目標として 子どもを望む家族像の多様性を実現するために日々取り組んでいます サービス | コネヒト株式会社

Slide 8

Slide 8 text

TECH VISION コネヒトにおけるテクノロジーへの「態度」を表明した羅針盤 戦略の1つに「1to1 AI」を掲げているように、機械学習を用いたプロダクト 開発に、より一層積極的にチャレンジしていこうとしています CONNEHITO TECH VISION

Slide 9

Slide 9 text

2. プロダクトの紹介(一部抜粋)

Slide 10

Slide 10 text

ママリ 家族に向き合うママの毎日は、新しい選択の連続。慌ただ しい日々の中で、正解のない選択をし続けることは容易な ことではありません 「ママの一歩を支える」をミッションに、悩みの「解消」 と「共感」を軸に、妊活中女性・プレママ・ママに寄り添 うコミュニティを運営しています 子どもを出産したママの3人に1人(※)が利用するアプリ に加え、Instagram、LINE、Twitter、facebookといった SNS、情報サイトを通じて、ママが日々の選択に自信を もって一歩を踏み出せるよう取り組んでいます ※「ママリ」で2019年内に出産予定と設定したユーザー数と、厚生労 働省発表「人口動態統計」の出生数から算出

Slide 11

Slide 11 text

ママリの主な機能 Q&Aコミュニティ メディア ママリプレミアム ユーザーが悩みを投稿、相談しあうQ&A機能 専門家による回答も期間限定で提供 妊娠・育児などの記事をwebとアプリで配信 ママリアプリ内の課金事業 (Android / iOS) クーポンや人気順検索などを月400円で提供

Slide 12

Slide 12 text

データで見るママリ 回答率:95%以上 最初の回答がつくまでの時間:2~3分 出産報告の投稿 回答率とは1つ以上の回答がついている質 問の割合 回答者の熱量が高く、質問を投稿してから回答 がつくまでの時間が短い(最頻値) 出産に際して今まで回答してもらったことへの お礼、産後の喜び、 ママリへの感謝などが投 稿され、特に熱量の高いカテゴリー 登録者数:新ママの3人に1人(※) Q&A 月間投稿数:約130万件 総会員数は約300万 ※2019年の「ママリ」内の出産予定日を設定したユー ザー数と、厚生労働省発表の 「人口動態統計」の出生 数から算出 質問・回答ともに熱量が高いコミュニティ を維持し、ユーザーの悩み解消に寄与

Slide 13

Slide 13 text

家族ノート 家族ノートでは、一般的なアンケート調査とは異なり、 日々の暮らしの中で無意識的に行っている「検索」や「質 問/回答」の中に現れる、家族の心の動きや真の欲求を知 ることができます ママの3人に1人(※1)が利用するアプリ「ママリ」の月 間400万検索、130万投稿(※2)もの活発な利用の中 で、家族が今悩んでいることや、求めている商品・サービ スがタイムリーに反映され、アンケート調査等では踏み込 めないリアルな課題や態度変容が映し出されています 家族ノートを通して、家族の悩みを社会に届け、志を共に するパートナーのみなさんとともに「あなたの家族像が実 現できる社会」の実現に取り組んでいます ※1:「ママリ」で2019年内に出産予定と設定したユーザー数と、厚生労働省発表「人 口動態統計」の出生数から算出。 ※2:2021年3月現在。

Slide 14

Slide 14 text

3. 取り扱うデータの種類

Slide 15

Slide 15 text

主なデータの種類 Q&Aデータ 自然言語:投稿数はQA合わせて月間約130万件 画像:QAに添付される画像 ユーザーの属性データ ユーザーの年齢、子供の年齢、住んでいる地域 … 行動ログデータ クリック、検索 ... 記事データ webとアプリで配信しているコンテンツのデータ QAイメージ 検索イメージ

Slide 16

Slide 16 text

4. ML・データ活用事例・取り組み

Slide 17

Slide 17 text

事例:コミュニティ検閲 Trust&Safetyなコミュニティを維持するための検閲モデル モデルが不適切な投稿と判断したデータに対して、人間が目視チェックを行う ことでHuman in the loopを実現し、コスト削減に寄与 関連記事: ・コネヒトの機械学習プロジェクトにおける構想フェーズ・PoCフェーズの進め方 - コネヒト開発者ブログ ・機械学習と人が協力してママリのコミュニティを支えているよ、という話をしました - コネヒト開発者ブログ

Slide 18

Slide 18 text

事例:カテゴリ類推 質問投稿時のカテゴリを投稿内容から推測し自動的にサジェストするこ とで、質問投稿のコンバージョンUPに寄与 関連記事: ・ カテゴリ類推の機械学習モデルをプロダクションに導入した話 - コネヒト開発者ブログ

Slide 19

Slide 19 text

事例:レコメンデーション ユーザーの行動ログから興味のあるコンテンツを予測し優先的に表示 することで、UX向上に寄与 関連記事: ・レコメンデーション機能を実装するまでの "not 技術的" な取り組みについて - コネヒト開発者ブログ ・トピックモデルを活用したレコメンデーションの実装 - Speaker Deck ・コミュニティサービスにおけるレコメンデーションの変遷とMLパイプラインについて - Speaker Deck

Slide 20

Slide 20 text

事例:チュートリアルでのデータ活用 特定のセグメントにおいて、プロダクトを利用するユーザーがどんな トピックに興味があるのかを分析し、アプリのチュートリアルで活用 関連記事: ・オンボーディング改善に機械学習を活用する〜トピックモデルによる興味選択編〜 ・オンボーディング改善に機械学習を活用する〜Graph Embedding(node2vec)による推薦アイテム計算〜

Slide 21

Slide 21 text

事例:データパイプラインの構築 ● 家族ノート で利用する自然言語のデータ解析 ○ 分析しやすい構造化データを生成するために、独自辞書を利用した 分かち書きや係り受け解析を行うデータパイプラインを構築し運用 ● 検索エンジンへのデータインジェストパイプラインの構築運用 ○ 検索エンジンのインデックス更新や、ニアリアルタイムなデータ同期用のパイプラインの 構築と保守運用の実施 パイプライン for 家族ノート 検索基盤用のパイプライン 関連記事: ・ニアリアルタイムで同期される検索基盤を構築 ~AWS Glueによるデータ同期編~ ・ニアリアルタイムで同期される検索基盤 ~パイプライン構築編~

Slide 22

Slide 22 text

事例:検索システムの構築と精度改善 ● 検索システムを0から構築 ○ ユーザーの声を素早く反映出来たり、検索体験をアプリのコア機能にしていくために検索 システムを0から構築 ○ サジェスト機能の改善、アナライザーの修正や独自のユーザー辞書によるゼロ件ヒットの 改善などユーザー体験の向上や精度改善を実施 ○ 安全で信頼性が高いパイプラインの構築とその運用の実施 ■ Blue/Greenデプロイメントによる安全なインデックス切り替え 関連記事: ・ニアリアルタイムで同期される検索基盤を構築 ~AWS Glueによるデータ同期編~ ・ニアリアルタイムで同期される検索基盤 ~パイプライン構築編~ ・検索システムで再現率向上に取り組んだ話 ・Character filterを用いたアルファベットの大文字小文字対応によるゼロ件ヒット改善 ・日本語サジェスト機能の実装にあたり試行錯誤した話

Slide 23

Slide 23 text

事例:産学連携 経営科学系研究部会連合協議会(JASMAC)が運営する 令和3年度データ解 析コンペティション へママリの投稿データや行動ログデータを提供 産学連携でママリデータを国内最大級のデータ解析コンペティションに提供

Slide 24

Slide 24 text

事例:産学連携 大学と共同研究を行うことで、より良い社会実現を目指す コネヒトと青山学院大学経営学部マーケティング学科の横山暁 准教授が共同研究を開始 コネヒトと北海学園大学工学部内田ゆず研究室が共同研究を開始

Slide 25

Slide 25 text

5. 2025年までに取り組みたいチャレンジ

Slide 26

Slide 26 text

取り組みたいチャレンジ 情報推薦 コミュニティ改善 現在、最も力を入れて取り組んでいる領域 妊娠や、子育て育児における様々なライフイベントを過ごすユーザーに対して、パーソナライズした 情報提供を行いユーザー体験を向上させる 将来的には「家族」単位での情報推薦にもチャレンジし、未来の可能性を増やしていきたい ● 行動ログベースのレコメンド ● 関連アイテムのレコメンド etc … Trust&Safetyなコミュニティを維持しながら、コミュニケーションを活性化させる ● 質問と回答者のマッチング ● 回答の関連度ソート ● 不適切な投稿からユーザーを守る仕組み etc …

Slide 27

Slide 27 text

取り組みたいチャレンジ 自然言語処理 MLOps / 機械学習基盤の整備 大量にある自然言語データを用いた新機能開発やデータの構造化、情報検索への活用 ● コミュニティ内でのトレンド分析 ● キーワード抽出、表現抽出 ● 投稿時の情報サジェスト ● 検索エンジンのパーソナライズ etc … より高速に実験やデプロイを行える機械学習基盤やデータの整備 ● デプロイフロー改善(CI/CDの改善) ● モデルの監視 ● データのストリーミング処理 ● Feature Storeの構築 etc …

Slide 28

Slide 28 text

6. MLエンジニアの役割・利用技術

Slide 29

Slide 29 text

MLエンジニアの役割 MLプロダクトの開発はもちろん、データ起点でPdMと連携し、仮設出しや 施策立案といったデータサイエンティスト(データアナリスト)のような役割 も担う ・新規施策立案のため、PdMと協業しながらのデー タ分析・レポーティング ・各部署から依頼されるデータ分析要件 ・社内にあるデータの有効活用 データ分析による示唆出し ・機械学習プロジェクトにおける、データ分析 / モデル開発 / ML基盤構築 / API開発 など (モデリングだけではなく、 プロダクション周辺の コード開発もサーバーサイドエンジニアとコミュニ ケーションを取りながら担当) データ分析〜ML基盤構築〜API開発

Slide 30

Slide 30 text

MLエンジニアの働き方 フェーズによって動き方が異なる ● 施策立案/PoC:プロダクト開発チームの中に入り、MLの専門家として示唆 出しや技術検証(コラボレーション) ● 開発/運用:MLプロダクトを機能として特定のインターフェースを経由し、 プロダクト開発チームに提供する(X-as-a-Service)

Slide 31

Slide 31 text

利用技術

Slide 32

Slide 32 text

機械学習基盤 一例ではありますが、コンテナ(Docker)とAWSのサービスを用いて機械学習 基盤を構築・運用しています 関連記事: ・SageMaker StudioとStep Functionsを用いてMLOpsへの一歩を踏み出そう - Speaker Deck ・機械学習プロジェクトにおけるSageMaker Processingの使い所 - コネヒト開発者ブログ ・SageMakerとStep Functionsを用いた機械学習パイプラインで構築した検閲システム(前編) - コネヒト開発者ブログ ・SageMakerとStep Functionsを用いた機械学習パイプラインで構築した検閲システム(後編) - コネヒト開発者ブログ ・SageMaker Experimentsを使った機械学習モデルの実験管理 - コネヒト開発者ブログ

Slide 33

Slide 33 text

7. 採用に関する情報

Slide 34

Slide 34 text

募集要項:MLエンジニア <業務内容> <開発環境> <必須条件> <歓迎条件> ● 機械学習モデルの開発・APIの開発 ○ Pythonによる機械学習モデリングやサービスに組み込むためのAPI開 発を行います ● 機械学習基盤の構築(MLOps) ○ AWSのマネージドサービスを用いて機械学習基盤の構築を行います。 現在はECS, Glue, SageMaker, StepFunctionsなどを用いています が、変化を恐れずに新しい技術を試しながら、よりよいアーキテク チャを採用していきたいと考えています ● データドリブンなプロダクト提案や改善 ○ BigQueryやRedash、Jupyterでのデータ分析と分析結果によるプロ ダクト提案や改善等を行います ● 言語:Python ● インフラ・機械学習基盤:AWS (ECS / SageMaker / Step Functions... etc) ● ツール:Docker ● 分析:BigQuery, Redash, Jupyter ● その他:GitHub ● ライフイベント・ライフスタイルの課題解決をするサービスへの 興味関心 ● Python等を用いたデータ分析・モデリングの経験 ● SQL・Python等を利用したデータ抽出・加工の経験 ● Python等を利用した機械学習プロダクトの設計・開発・運用経験 ● 自然言語処理の理論的知識・実装力 ● 推薦システムの理論的知識・実装力 ● Kaggle等の分析コンペティションでの入賞経験 ● Dockerなどのコンテナ技術での開発経験 ● パブリッククラウド環境(AWS, GCP)の使用経験 <応募先> https://hrmos.co/pages/connehito/jobs/00m

Slide 35

Slide 35 text

8. Appendix ・制度について ・開発組織について

Slide 36

Slide 36 text

貸与・補助制度 入社時に貸与されるもの MacBook Pro、アーロンチェア、キーボード、マウス、トラックパッド、など (入社後も都度申請すれば購入は可能) スキルアップ支援制度 勉強会やサーバ代など、学習のために利用した金額のうち年間2万円までを補助 スマイル制度 執筆、OSS活動などによって開発部メンバーが使えるお金がチャージされ、それをエンジニア・デ ザイナーが勉強のための費用に充てることができる制度 年間8万円まで利用可能でスキルアップ支援制度と合わせて合計で年間10万円までを個人の学習費 用として利用可能(詳細:スマイル制度 · Connehito Tech Vision) 会社費用での書籍購入、貸出制度 技術書などの書籍を会社費用で購入し、自由に読むことができる

Slide 37

Slide 37 text

勤怠・休暇制度 フレックスタイム制 コアタイムは11:00〜16:00 ※コロナ対策の一環でコアタイムを12:00〜15:00に変更している時期もあります 入社日に有給休暇を付与 入社直後からでも休みやすい、働きやすい職場づくり 夏季休暇 4~9月の間で5日付与され、1日単位での利用が可能 ハッピーフライデー休暇 土曜日と祝日がかぶった場合、金曜日を休日にする (3連休) 出社形態 月一回の全社出社日 + 部内出社日

Slide 38

Slide 38 text

社内外の取り組み 社内LTランチ お昼を食べながら有志でLT会を開催 仕事や趣味の話、カンファレンス等の発表練習など、なんでもOKな会 開発ブログ 更新頻度は不定期で、書きたいものがある人が自由に書いて公開 https://tech.connehito.com 外部向けイベント 過去にはエンジニア向け勉強会や起業家の対談イベントなどを実施 コネヒトの認知向上や社外とのつながりを生み出す https://connehito.connpass.com

Slide 39

Slide 39 text

EOF