Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Ask! NIKKEIの運用基盤と改善に向けた取り組み / NIKKEI TECH TALK #30

Kaito Majima
February 06, 2025

Ask! NIKKEIの運用基盤と改善に向けた取り組み / NIKKEI TECH TALK #30

Kaito Majima

February 06, 2025
Tweet

More Decks by Kaito Majima

Other Decks in Technology

Transcript

  1. #nikkei_tech_talk 2 アジェンダ n ⾃⼰紹介 n Ask! NIKKEI について n

    Ask! NIKKEI の運⽤基盤 n Ask! NIKKEI 改善に向けた取り組み
  2. #nikkei_tech_talk 3 ⾃⼰紹介 n 名前 p ⾺嶋海⽃(まじま かいと) n 所属

    p ⽇本経済新聞社(2023/4~) p ⽇経電⼦版のAI機能開発 n 趣味 p テニス、旅⾏、漫画
  3. #nikkei_tech_talk 10 質問の⼊⼒場所 n 現在、2か所からAsk! NIKKEIに質問を⼊⼒できる ① Ask! NIKKEIのページ Ø

    ⼊⼒フォームとサンプル質問がある ② 個別記事ページの下部 Ø ⼊⼒フォームと記事から⾃動⽣成した質問(関連質問)がある ① Ask! NIKKEIのページ ② 個別記事ページの下部 記事:トランプ⽒、孫正義⽒らとAI開発に78兆円投資表明(2025/1/22) https://www.nikkei.com/article/DGXZQOGN21E3F0R20C25A1000000/
  4. #nikkei_tech_talk 16 検索サーバー n Cloud Runで稼働 p FastAPI + Uvicorn

    n 主な処理 p クエリ展開 p クエリ埋め込みの計算 p ベクトル検索 p 検索結果のリランキング
  5. #nikkei_tech_talk 17 記事DB n Qdrantを使⽤ n 特徴 p ⾼速にベクトル検索可能 p

    Managed Cloudを提供 Ø 2025/02現在、東京リージョンはAWSのみ p Hybrid Searchにも対応 Ø 密ベクトルと疎ベクトルの両⽅を⽤いて検索可能
  6. #nikkei_tech_talk 18 推論インスタンス n 複数タスクを実⾏ p 埋め込み計算 p リランキング n

    GPUインスタンス(G2)を使⽤ p HuggingfaceのText Embeddings Inference Ø GPUで⾼速に推論を可能にするツールキット Ø 電⼦版データで学習したモデルを使⽤ Ø 複数モデルを同じインスタンスで運⽤ p アプリケーション内部LBで接続 Ø Cloud Run等からはVPCコネクタ, Direct VPC egressでアクセス huggingface/text-embedding- inference - GitHub
  7. #nikkei_tech_talk 19 DB挿⼊バッチ n Cloud Run Functionsで稼働 p Cloud Schedulerで定期実⾏

    n 主な処理 p 社内APIで記事情報取得 p 記事の埋め込みを計算 p Qdrantに保存
  8. #nikkei_tech_talk 20 関連質問⽣成 n Cloud Run Functionsで稼働 p Cloud Schedulerで定期実⾏

    n 主な処理 p 社内APIで記事情報取得 p LLMで質問⽣成 p 検索品質評価 Ø 検索サーバーにリクエスト Ø 独⾃の評価指標を計算 Ø 品質の悪い質問をフィルタ
  9. #nikkei_tech_talk 22 ロギング n 社内のデータ基盤Atlasを活⽤ p 参考:https://hack.nikkei.com/blog/advent20241218/ p 他の電⼦版のログとの紐付け n

    Google Cloud上で独⾃のロギングも実施 p Pub/Sub 経由でBigQueryにデータ送信 p プロダクト内の簡易的な分析に使⽤ Ø ユーザーの質問の分析 Ø フィードバックの集計 ⽇経のデータ分析基盤「Atlas」 の現在地 ‒ HACK The Nikkei
  10. #nikkei_tech_talk 23 トレーシング n Arize Phoenixで出⼒をトレーシング p LLMに特化したトレーシングライブラリ p OpenTelemetry

    protocol (OTLP) に従う Ø フロントエンドとバックエンドを紐付け可能 n Cloud Runでセルフホスト p Cloud SQL for PostgreSQLをDBとして使⽤ n ブログ書きました! p https://hack.nikkei.com/blog/advent20241208/ Arize Phoenix + Cloud Runで実現する LLMのトレーシング‒ HACK The Nikkei
  11. #nikkei_tech_talk 24 トレーシング n Arize Phoenixによるトレーシング p 各所のログを紐付け Ø フロントエンドでの回答⽣成

    Ø 検索サーバーにおける各処理 p 主要な記録項⽬ Ø LLMのモデルやトークン数 Ø ⼊出⼒、レイテンシ Ø ユーザーからのフィードバック(後述) p その他機能 Ø データセット登録 Ø LLM部分のリプレイ Arize Phoenix + Cloud Runで実現する LLMのトレーシング‒ HACK The Nikkei
  12. #nikkei_tech_talk 26 関連質問の改善 n 品質劣化の検知、改善策の着想をしやすい環境作り p 毎⽇Slackで⼈気記事の関連質問を通知 p 関連質問⽣成処理をトレーシング Ø

    プロンプトを変更した場合などの検証が容易 Slackでの⼈気記事の関連質問の通知 関連質問の⽣成過程をトレーシング
  13. #nikkei_tech_talk 28 まとめ n Ask! NIKKEIは⽇経電⼦版のRAG機能 p 電⼦版記事を元にユーザーの質問に対する回答を⽣成 p 記事下部には記事の関連質問を⾃動⽣成

    n Ask! NIKKEIのバックエンドはGoogle Cloud上で稼働 p 検索サーバーやGPUインスタンスなどを運⽤ n Ask! NIKKEI改善のための取り組み p ロギング、トレーシング p フィードバックの収集、関連質問の品質チェック