Upgrade to Pro — share decks privately, control downloads, hide ads and more …

コネヒトにおける機械学習関連業務の紹介資料

 コネヒトにおける機械学習関連業務の紹介資料

## カジュアル面談・選考への応募リンク
・カジュアル面談(X DM):https://x.com/takapy0210
・選考応募:https://herp.careers/v1/connehito/q5ZCtEPtUde1

## リンク一覧
・Connehito Tech Vision https://tech-vision.connehito.com/
・サービス | コネヒト株式会社 https://connehito.com/service/
・コネヒトの機械学習プロジェクトにおける構想フェーズ・PoCフェーズの進め方 - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/03/23/193025
・機械学習と人が協力してママリのコミュニティを支えているよ、という話をしました - コネヒト開発者ブログ https://tech.connehito.com/entry/2019/08/19/130802
・カテゴリ類推の機械学習モデルをプロダクションに導入した話 - コネヒト開発者ブログ https://tech.connehito.com/entry/2020/05/13/143047
・レコメンデーション機能を実装するまでの "not 技術的" な取り組みについて - コネヒト開発者ブログ https://tech.connehito.com/entry/2021/02/24/191543
・トピックモデルを活用したレコメンデーションの実装 - Speaker Deck https://speakerdeck.com/takapy/topitukumoderuwohuo-yong-sitarekomendesiyonfalseshi-zhuang
・コミュニティサービスにおけるレコメンデーションの変遷とMLパイプラインについて - Speaker Deck https://speakerdeck.com/takapy/komiyuniteisabisuniokerurekomendesiyonfalsebian-qian-tomlpaipurainnituite
・オンボーディング改善に機械学習を活用する〜トピックモデルによる興味選択編〜 - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/09/06/183758
・オンボーディング改善に機械学習を活用する〜Graph Embedding(node2vec)による推薦アイテム計算〜 - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/09/29/181152
・ニアリアルタイムで同期される検索基盤を構築 ~AWS Glueによるデータ同期編~ - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/08/24/184911
・ニアリアルタイムで同期される検索基盤 ~パイプライン構築編~ - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/09/16/165655
・検索システムで再現率向上に取り組んだ話 - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/09/27/164009
・Character filterを用いたアルファベットの大文字小文字対応によるゼロ件ヒット改善 - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/11/15/180104
・日本語サジェスト機能の実装にあたり試行錯誤した話 - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/12/16/173814
・産学連携でママリデータを国内最大級のデータ解析コンペティションに提供 | コネヒト株式会社 https://connehito.com/news/datacompetition/
・コネヒトと北海学園大学工学部内田ゆず研究室が共同研究を開始。出産前後の母親のオンラインコミュニティにおける言語表現に関する分析を実施。 | コネヒト株式会社 https://connehito.com/news/hokkai-gakuen/
・コネヒトと青山学院大学経営学部マーケティング学科の横山暁 准教授が共同研究を開始。「ママリ利用者の共感に着目した悩み解決」をテーマに分析を実施 | コネヒト株式会社 https://connehito.com/news/aoyama-gakuin/
・SageMaker StudioとStep Functionsを用いてMLOpsへの一歩を踏み出そう - Speaker Deck https://speakerdeck.com/takapy/sagemaker-studiotostep-functionswoyong-itemlopshefalse-bu-wota-michu-sou
・SageMakerとStep Functionsを用いた機械学習パイプラインで構築した検閲システム(前編) - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/03/24/173719
・SageMakerとStep Functionsを用いた機械学習パイプラインで構築した検閲システム(後編) - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/03/28/190436
・SageMaker Experimentsを使った機械学習モデルの実験管理 - コネヒト開発者ブログ https://tech.connehito.com/entry/2021/12/15/181332
・スマイル制度 · Connehito Tech Vision https://tech-vision.connehito.com/program/smile.html

Avatar for Connehito Inc.

Connehito Inc.

July 22, 2022
Tweet

Other Decks in Technology

Transcript

  1. 本資料の目的 2 コネヒトでは Tech vision の1つに 1 to 1 AI

    というStrategyを掲げてお り、パーソナライズや自然言語処理を活用したコミュニティ改善などの 分野に積極的にチャレンジしていく予定です。 この資料では、機械学習・データに関連する活用事例や取り組み、 今後チャレンジしていきたいことについてお伝えできればと思います。
  2. 社 名 代 表 創 業 株 主 住 所

    コネヒト株式会社 杉井 信一郎 2012年1月13日 KDDI株式会社 東京都中央区築地 2-11-10 MISTO Tsukiji7階 01 コネヒトについて 会社概要 従業員数 70人(内 男性:48%、女性:52%) 5 ※2025年3月時点
  3. 01 コネヒトについて KGI:希望出生数と予定出生数のギャップの解消 日本における希望出生数と予定出生数の間には 約0.24人の差分が存在しま す。 コネヒトはこの差分の大きな要因となる 4つの課題を事業領域に定め、両者の ギャップの解消を目指します。 希 望

    2.25人 = 予定 2.01人 − 0.24人 差分 参考:国立社会保障・人口問題研究所 2022年・第16回出生動向基本調査(結婚と出産に関する全国調査) ※2022年・第16回出生動向基本調査(結婚と出産に関する全国調査)の内、夫婦調査を参考 8 VISIONが目指す先
  4. 01 家計 の悩み 02 不妊 の悩み 03 育児 の悩み 04

    社会 の意識 4つの課題を事業領域に定め、 事業開発・アライアンスなど様々な手法で解決を目指す 01 コネヒトについて 9 VISIONが目指す先
  5. 健康事由 経済事由 価値提供を目指すターゲットを、課題当事者から 課題当事者 と課題支援者 へ拡大 社会雰囲気 事由 育児負担 事由

    人の誕生 (共通体験) 人の誕生とコネヒトの関係性 これまで 妊娠/出産というライフイベント当事者である ママ自身の課題解決に注力 これから 親族・友人・第三者などあらゆる支援者を巻き込み 経済的なインパクトのある価値提供に挑戦する ➡ 人の誕生以前 人の誕生以降 課 題 当 事 者 課 題 支 援 者 課題当事者を応援・感謝したいという課題 祖父母、親族、友、 その他、課題当事者の課題を支援・応 援・感謝し合いたいあらゆる人 12 コネヒトのこれから
  6. 「人の誕生」を取り巻く市場 の 成長性や社会からの注目度は年々向上 少子化を背景にしながらも、ベビー用品や関連サービス・習い事・教育費など 人の誕生(出産/育児)を取り巻くコト /市場や支援のマーケット自体は成長しており、 省庁新設や行政支援など、社会的な注目度も高い。 ベビー用品 関連サービス ベビー用品・関連サービス市場は、

    2014年から2020年で約1兆2千億円増加。 習い事 小学1〜4年生にかける習い事の月額費用が 2014年から2019年で平均1600円程度増加。 教育費用 学習塾費用は1994年から2016年で 公立中学校では約5.7万円、 私立高等学校では約5.3万円増加。 こども家庭庁が2023年創設。 伴走型相談支援など行政の取組も加速。 こども庁 行政支援 13 挑戦する市場
  7. ユーザー同士で悩みを相談しあう Q&A機能 月間投稿数110万件、回答率95%、一つ目の回答がくるまで 2-3分(最頻値) Q&Aコミュニティ 生活に役立つ記事を毎日配信。専門家監修の記事も多数 メディア インスタハッシュタグ「 #ママリ」の投稿数が約 1,030万件超で

    #ママ(投稿数:約570万件)よりも投稿されている SNS サービスについて toC向け事業 ママになる 3人に1人が利用中! ママ向けNo.1サービス「ママリ」 ※「ママリ」で 2023年内に出産予定と設定したユーザー数と、厚生労働省発表「人口動態統計」の出生数から算出 ※ 16 特定のテーマごとに存在するルーム内でママ同士で リアルタイムチャットができる機能(リアクションやスレッド機能有り) サークル
  8. 自治体や企業と連携して行う多様なサービスは、コネヒトの新たな価値創造と成長を後押しするものです。 私たちは、様々な取組みを通じて主に 3つの価値提供を目指します。 ※ 19 多様なパートナーとの 連携による社会課題解決 「集声力」の活用による 新たな価値創出 事業領域の拡張による

    コネヒトの企業価値向上 「ママリ」を起点に、 家族・自治体・企業を繋ぎ、子育 てを取り巻く社会課題の解決に 貢献します。 「ママリ」に集まる当事者の声を 分析・活用することで、社会課題 を可視化し、新たなアウトカムを 創出します。 「ママリ」のサービス提供に留まら ず、官民連携の領域で実績を創る ことで、企業としての提供価値を拡 張していきます。 01 02 03 サービスについて toG, toB向け事業
  9. 若年層の将来のライフプランニング支援のため、性や健康に関する正しい知識を提供するセミナー や教材作成、情報発信を行います 。 プレコンセプションケア(※)事業 20 独自のカード教材などを用いて、従来の価値観に縛られない、自分らしい生き方や家族像を考える ワークショップ等を提供します 。 ライフデザイン事業 「とるだけ育休」の社会課題提起を起点に、男性育休取得推進や女性活躍をテーマとした企業研

    修、制度構築コンサルティングなどを行います 。 仕事と子育ての両立支援事業 「ママリ」の検索データを活用し、虐待などに繋がる可能性のあるハイリスク層を早期に検知。 専門家相談へ繋ぎ、予防的介入を支援します 。 ハイリスク検知・支援事業 ※プレコンセプションケアとは:妊娠前のケアにとどまらない、生涯にわたり身体的・精神的・社会的(バイオ・サイコ・ソーシャル)に健康な状態であるための取組として、 「性別を問わず、適切な時期に、性や健康に関する正しい知識を持ち、妊娠・出産を含めたライフデザイン(将来設計)や将来の健康を考えて健康管理を行う」概念 サービスについて toG, toB向け事業
  10. 25 事例:レコメンデーション ユーザーの行動ログから興味のあるコンテンツを予測し優先的に表示 することで、UX向上に寄与 関連記事: ・レコメンデーション機能を実装するまでの "not 技術的" な取り組みについて -

    コネヒト開発者ブログ ・トピックモデルを活用したレコメンデーションの実装 - Speaker Deck ・コミュニティサービスにおけるレコメンデーションの変遷とMLパイプラインについて - Speaker Deck
  11. 27 事例:データパイプラインの構築 • 全社向けデータ基盤(BigQuery)の構築 ◦ StepFunctionsやDataformを利用し、分析しやすいデータ基盤を構築 • 検索エンジンへのデータインジェストパイプラインの構築運用 ◦ 検索エンジンのインデックス更新や、ニアリアルタイムなデータ同期用のパイプラインの

    構築と保守運用の実施 検索基盤用のパイプライン 関連記事: ・ニアリアルタイムで同期される検索基盤を構築 ~AWS Glueによるデータ同期編~ ・ニアリアルタイムで同期される検索基盤 ~パイプライン構築編~
  12. 28 事例:検索システムの構築と精度改善 • 検索システムを0から構築 ◦ ユーザーの声を素早く反映出来たり、検索体験をアプリのコア機能にしていくために検索 システムを0から構築 ◦ サジェスト機能の改善、アナライザーの修正や独自のユーザー辞書によるゼロ件ヒットの 改善などユーザー体験の向上や精度改善を実施

    ◦ 安全で信頼性が高いパイプラインの構築とその運用の実施 ▪ Blue/Greenデプロイメントによる安全なインデックス切り替え 関連記事: ・ニアリアルタイムで同期される検索基盤を構築 ~AWS Glueによるデータ同期編~ ・ニアリアルタイムで同期される検索基盤 ~パイプライン構築編~ ・検索システムで再現率向上に取り組んだ話 ・Character filterを用いたアルファベットの大文字小文字対応によるゼロ件ヒット改善 ・日本語サジェスト機能の実装にあたり試行錯誤した話
  13. 33 取り組みたいチャレンジ 情報推薦 コミュニティ改善 妊娠や、子育て育児における様々なライフイベントを過ごすユーザーに対して、パーソナライズした 情報提供を行いユーザー体験を向上させる • 行動ログベースのレコメンド • 関連アイテムのレコメンド

    etc … Trust&Safetyなコミュニティを維持しながら、コミュニケーションを活性化させる • 質問と回答者のマッチング • 回答の関連度ソート • 不適切な投稿からユーザーを守る仕組み etc …
  14. 34 取り組みたいチャレンジ 自然言語処理 MLOps / 機械学習基盤の整備 大量にある自然言語データを用いた新機能開発やデータの構造化、情報検索への活用 • コミュニティ内でのトレンド分析 •

    キーワード抽出、表現抽出 • 検索システムのパーソナライズ etc … より高速に実験やデプロイを行える機械学習基盤やデータの整備 • デプロイフロー改善(CI/CDの改善) • モデルの監視 • データのストリーミング処理 • Feature Storeの構築 etc …
  15. 35 取り組みたいチャレンジ LLM/AI Agent データ基盤の整備 LLMを用いた新機能開発や社内向けAI Agentの開発 • 検索要約、自動回答 •

    社内向けAI Agent etc … LLMの性能を引き出したり、LLMを社内の戦力とするためのデータ基盤、ナレッジマネジメント • 非構造データの構造化 • 社内ドキュメント(Notionなど)の自動整理、RAGシステム etc …
  16. 機械学習基盤 一例ではありますが、コンテナ(Docker)とAWSのサービスを用いて機械学習 基盤を構築・運用しています 関連記事: ・SageMaker StudioとStep Functionsを用いてMLOpsへの一歩を踏み出そう - Speaker Deck

    ・機械学習プロジェクトにおけるSageMaker Processingの使い所 - コネヒト開発者ブログ ・SageMakerとStep Functionsを用いた機械学習パイプラインで構築した検閲システム(前編) - コネヒト開発者ブログ ・SageMakerとStep Functionsを用いた機械学習パイプラインで構築した検閲システム(後編) - コネヒト開発者ブログ ・SageMaker Experimentsを使った機械学習モデルの実験管理 - コネヒト開発者ブログ