Upgrade to Pro — share decks privately, control downloads, hide ads and more …

コネヒトにおける機械学習関連業務の紹介資料

 コネヒトにおける機械学習関連業務の紹介資料

## カジュアル面談・選考への応募リンク
・カジュアル面談(Twitter DM):https://twitter.com/takapy0210
・カジュアル面談(wantedly):https://www.wantedly.com/projects/813039
・選考応募:https://hrmos.co/pages/connehito/jobs/00m

## スライド中のリンク一覧
・(P2)Connehito Tech Vision https://tech-vision.connehito.com/
・(P7)サービス | コネヒト株式会社 https://connehito.com/service/
・(P17)コネヒトの機械学習プロジェクトにおける構想フェーズ・PoCフェーズの進め方 - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/03/23/193025
・(P17)機械学習と人が協力してママリのコミュニティを支えているよ、という話をしました - コネヒト開発者ブログ https://tech.connehito.com/entry/2019/08/19/130802
・(P18)カテゴリ類推の機械学習モデルをプロダクションに導入した話 - コネヒト開発者ブログ https://tech.connehito.com/entry/2020/05/13/143047
・(P19)レコメンデーション機能を実装するまでの "not 技術的" な取り組みについて - コネヒト開発者ブログ https://tech.connehito.com/entry/2021/02/24/191543
・(P19)トピックモデルを活用したレコメンデーションの実装 - Speaker Deck https://speakerdeck.com/takapy/topitukumoderuwohuo-yong-sitarekomendesiyonfalseshi-zhuang
・(P19)コミュニティサービスにおけるレコメンデーションの変遷とMLパイプラインについて - Speaker Deck https://speakerdeck.com/takapy/komiyuniteisabisuniokerurekomendesiyonfalsebian-qian-tomlpaipurainnituite
・(P20)オンボーディング改善に機械学習を活用する〜トピックモデルによる興味選択編〜 - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/09/06/183758
・(P20)オンボーディング改善に機械学習を活用する〜Graph Embedding(node2vec)による推薦アイテム計算〜 - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/09/29/181152
・(P21)ニアリアルタイムで同期される検索基盤を構築 ~AWS Glueによるデータ同期編~ - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/08/24/184911
・(P21)ニアリアルタイムで同期される検索基盤 ~パイプライン構築編~ - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/09/16/165655
・(P22)検索システムで再現率向上に取り組んだ話 - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/09/27/164009
・(P22)Character filterを用いたアルファベットの大文字小文字対応によるゼロ件ヒット改善 - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/11/15/180104
・(P22)日本語サジェスト機能の実装にあたり試行錯誤した話 - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/12/16/173814
・(P23)産学連携でママリデータを国内最大級のデータ解析コンペティションに提供 | コネヒト株式会社 https://connehito.com/news/datacompetition/
・(P24)コネヒトと北海学園大学工学部内田ゆず研究室が共同研究を開始。出産前後の母親のオンラインコミュニティにおける言語表現に関する分析を実施。 | コネヒト株式会社 https://connehito.com/news/hokkai-gakuen/
・(P24)コネヒトと青山学院大学経営学部マーケティング学科の横山暁 准教授が共同研究を開始。「ママリ利用者の共感に着目した悩み解決」をテーマに分析を実施 | コネヒト株式会社 https://connehito.com/news/aoyama-gakuin/
・(P32)SageMaker StudioとStep Functionsを用いてMLOpsへの一歩を踏み出そう - Speaker Deck https://speakerdeck.com/takapy/sagemaker-studiotostep-functionswoyong-itemlopshefalse-bu-wota-michu-sou
・(P32)SageMakerとStep Functionsを用いた機械学習パイプラインで構築した検閲システム(前編) - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/03/24/173719
・(P32)SageMakerとStep Functionsを用いた機械学習パイプラインで構築した検閲システム(後編) - コネヒト開発者ブログ https://tech.connehito.com/entry/2022/03/28/190436
・(P32)SageMaker Experimentsを使った機械学習モデルの実験管理 - コネヒト開発者ブログ https://tech.connehito.com/entry/2021/12/15/181332
・(P38)スマイル制度 · Connehito Tech Vision https://tech-vision.connehito.com/program/smile.html

Connehito Inc.

July 22, 2022
Tweet

Other Decks in Technology

Transcript

  1. 本資料の目的 コネヒトでは Tech vision の1つに 1 to 1 AI というStrategyを掲げており、

    パーソナライズや自然言語処理を活用したコミュニティ改善などの分野に 積極的にチャレンジしていく予定です この資料では、機械学習・データに関連する活用事例や取り組み、 今後チャレンジしていきたいことについてお伝えできればと思います
  2. 目次 1. コネヒトという会社について 2. プロダクトの紹介 3. 取り扱うデータの種類 4. ML活用事例・取り組み 5.

    2025年までに取り組みたいチャレンジ 6. MLエンジニアの役割・利用技術 7. 採用に関する情報 8. Appendix
  3. コネヒトのVALUE 肯定から始めよう Affirm & Follow 驚かせよう Surprise 他者の発言やチャレンジを肯定することか ら始め、フォローしよう 肯定から生まれるポジティブなエネルギー

    をフォローによりアウトプットにつなげる 仲間であろう 仲間やユーザーやクライアントや、業界や社会 の期待を超えた驚きを与え続けよう みんなの幸せな姿にワクワクし「ユニークな発 想」「つきつめた考え」「やり遂げる気概」を もって驚きを与えるプロフェッ ショナルであ ろう
  4. データで見るママリ 回答率:95%以上 最初の回答がつくまでの時間:2~3分 出産報告の投稿 回答率とは1つ以上の回答がついている質 問の割合 回答者の熱量が高く、質問を投稿してから回答 がつくまでの時間が短い(最頻値) 出産に際して今まで回答してもらったことへの お礼、産後の喜び、

    ママリへの感謝などが投 稿され、特に熱量の高いカテゴリー 登録者数:新ママの3人に1人(※) Q&A 月間投稿数:約130万件 総会員数は約300万 ※2019年の「ママリ」内の出産予定日を設定したユー ザー数と、厚生労働省発表の 「人口動態統計」の出生 数から算出 質問・回答ともに熱量が高いコミュニティ を維持し、ユーザーの悩み解消に寄与
  5. 事例:レコメンデーション ユーザーの行動ログから興味のあるコンテンツを予測し優先的に表示 することで、UX向上に寄与 関連記事: ・レコメンデーション機能を実装するまでの "not 技術的" な取り組みについて - コネヒト開発者ブログ

    ・トピックモデルを活用したレコメンデーションの実装 - Speaker Deck ・コミュニティサービスにおけるレコメンデーションの変遷とMLパイプラインについて - Speaker Deck
  6. 事例:データパイプラインの構築 • 家族ノート で利用する自然言語のデータ解析 ◦ 分析しやすい構造化データを生成するために、独自辞書を利用した 分かち書きや係り受け解析を行うデータパイプラインを構築し運用 • 検索エンジンへのデータインジェストパイプラインの構築運用 ◦

    検索エンジンのインデックス更新や、ニアリアルタイムなデータ同期用のパイプラインの 構築と保守運用の実施 パイプライン for 家族ノート 検索基盤用のパイプライン 関連記事: ・ニアリアルタイムで同期される検索基盤を構築 ~AWS Glueによるデータ同期編~ ・ニアリアルタイムで同期される検索基盤 ~パイプライン構築編~
  7. 事例:検索システムの構築と精度改善 • 検索システムを0から構築 ◦ ユーザーの声を素早く反映出来たり、検索体験をアプリのコア機能にしていくために検索 システムを0から構築 ◦ サジェスト機能の改善、アナライザーの修正や独自のユーザー辞書によるゼロ件ヒットの 改善などユーザー体験の向上や精度改善を実施 ◦

    安全で信頼性が高いパイプラインの構築とその運用の実施 ▪ Blue/Greenデプロイメントによる安全なインデックス切り替え 関連記事: ・ニアリアルタイムで同期される検索基盤を構築 ~AWS Glueによるデータ同期編~ ・ニアリアルタイムで同期される検索基盤 ~パイプライン構築編~ ・検索システムで再現率向上に取り組んだ話 ・Character filterを用いたアルファベットの大文字小文字対応によるゼロ件ヒット改善 ・日本語サジェスト機能の実装にあたり試行錯誤した話
  8. 取り組みたいチャレンジ 自然言語処理 MLOps / 機械学習基盤の整備 大量にある自然言語データを用いた新機能開発やデータの構造化、情報検索への活用 • コミュニティ内でのトレンド分析 • キーワード抽出、表現抽出

    • 投稿時の情報サジェスト • 検索エンジンのパーソナライズ etc … より高速に実験やデプロイを行える機械学習基盤やデータの整備 • デプロイフロー改善(CI/CDの改善) • モデルの監視 • データのストリーミング処理 • Feature Storeの構築 etc …
  9. 機械学習基盤 一例ではありますが、コンテナ(Docker)とAWSのサービスを用いて機械学習 基盤を構築・運用しています 関連記事: ・SageMaker StudioとStep Functionsを用いてMLOpsへの一歩を踏み出そう - Speaker Deck

    ・機械学習プロジェクトにおけるSageMaker Processingの使い所 - コネヒト開発者ブログ ・SageMakerとStep Functionsを用いた機械学習パイプラインで構築した検閲システム(前編) - コネヒト開発者ブログ ・SageMakerとStep Functionsを用いた機械学習パイプラインで構築した検閲システム(後編) - コネヒト開発者ブログ ・SageMaker Experimentsを使った機械学習モデルの実験管理 - コネヒト開発者ブログ
  10. 募集要項:MLエンジニア <業務内容> <開発環境> <必須条件> <歓迎条件> • 機械学習モデルの開発・APIの開発 ◦ Pythonによる機械学習モデリングやサービスに組み込むためのAPI開 発を行います

    • 機械学習基盤の構築(MLOps) ◦ AWSのマネージドサービスを用いて機械学習基盤の構築を行います。 現在はECS, Glue, SageMaker, StepFunctionsなどを用いています が、変化を恐れずに新しい技術を試しながら、よりよいアーキテク チャを採用していきたいと考えています • データドリブンなプロダクト提案や改善 ◦ BigQueryやRedash、Jupyterでのデータ分析と分析結果によるプロ ダクト提案や改善等を行います • 言語:Python • インフラ・機械学習基盤:AWS (ECS / SageMaker / Step Functions... etc) • ツール:Docker • 分析:BigQuery, Redash, Jupyter • その他:GitHub • ライフイベント・ライフスタイルの課題解決をするサービスへの 興味関心 • Python等を用いたデータ分析・モデリングの経験 • SQL・Python等を利用したデータ抽出・加工の経験 • Python等を利用した機械学習プロダクトの設計・開発・運用経験 • 自然言語処理の理論的知識・実装力 • 推薦システムの理論的知識・実装力 • Kaggle等の分析コンペティションでの入賞経験 • Dockerなどのコンテナ技術での開発経験 • パブリッククラウド環境(AWS, GCP)の使用経験 <応募先> https://hrmos.co/pages/connehito/jobs/00m
  11. EOF