Slide 1

Slide 1 text

生成AIで「お客様の声」を ストーリーに変える 新潮流「Generative ETL」 石川 覚 クラウド事業本部 コンサルティング部

Slide 2

Slide 2 text

自己紹介 2 名前:石川 覚(いしかわ さとる) 所属:クラウド事業本部 担当:コンサルタント、ブログ・登壇等 経歴:メーカーでSE、研究開発   →ITベンチャーで製品開発、受託研究   →クラスメソッド(2014/6〜) 好きなサービス: Amazon Redshift/Athena/Bedrock、 Google BigQuery Sapporo 2020-2025 Japan AWS Top Engineers 2021-2025 Japan AWS All Certifications Engineers 


Slide 3

Slide 3 text

ブログ: データアナリティクス通信 3 弊社のブログにて、2022年からクラスメソッド データアナリティクス通信(AWS データ分析編)を連載中です!
 
 


Slide 4

Slide 4 text

アジェンダ 4 ● 「お客様の声」に眠る価値とその活用 ● 新潮流「Generative ETL」とは ● AWSで実現するGenerative ETL ● Amazon QuickSightでインサイトを「ストーリー」に変える ● インサイトからアクションに繋げるベストプラクティス

Slide 5

Slide 5 text

「お客様の声」に眠る価値とその活用

Slide 6

Slide 6 text

「お客様の声」を活用できていますか? 6 企業にとって「お客様の声」は、商品やサービスの改善、顧客満足度の向 上に繋がる貴重な情報源です。しかし、多くの企業がその重要性を認識し つつも、有効に分析し、具体的なアクションに繋げることが困難です。 ● 膨大なデータ量 ○ アンケート、レビュー、問い合わ せ、SNS等の多様化する・散在する チャネル ● インサイトの見逃し ○ 大量のデータから重要な顧客の声や トレンドを見逃してしまう ● 分析の専門性とリソースの壁 ○ 手作業での分類や集計、レポート 作成など、タイムリーな対応がで きない ● 専門知識の壁 ○ 文章(自然言語)のデータ分析に は専門的なスキルが必要で、誰で も扱えない

Slide 7

Slide 7 text

「お客様の声」が活かせない理由 7 その理由は、「お客様の声」は、定性的な「非構造化データ」です。その ため、データは豊富に存在するにもかかわらず、そこから意味のある知見 (インサイト)を引き出せない状況に陥っている。 ● 顧客が自社の製品やサービスについて何を考え、何を感じ、何を求めている のか、その「なぜ」を解き明かす鍵がデータの中に眠っているにもかかわら ず、その扉を開ける手段がなかった。 ● 結果として、多くの戦略的意思決定は、断片的な定量的指標や、一部の顧客 からの逸話的なフィードバックに依存せざるを得ず、企業は顧客理解におけ る戦略的死角を抱え続けてきた。

Slide 8

Slide 8 text

生成AIの進化と普及 8 現在、生成AIの進化と普及は、この状況を変えつつあります。 非構造化データである「お客様の声」から生成AIを活用して、混沌とした 「お客様の声」を、分析可能で意味のある「ストーリー」へと変換する新 たな潮流、『Generative ETL』について紹介します。

Slide 9

Slide 9 text

新潮流「Generative ETL」とは

Slide 10

Slide 10 text

生成AIの進化と普及 10 従来のETLにおける「変換」が、既存の行と列のデータを整理・加工する 作業であったのに対し、Generative ETLにおける「変換」は、生成AIを 用いて、構造を持たないデータから意味を読み解き、新たな構造を「生 成」するプロセスである 。 ● 「お客様の声」という非構造化データに対し、生成AIがその内容を理解 ● 「これは製品の価格に関する意見である」と分類 ● 「感情はネガティブである」と判定 ● 「競合製品Xについての言及がある」という具体的な情報を抽出

Slide 11

Slide 11 text

従来のETLとGenerative ETLの違い 11 特徴 従来のETL / ELT Generative ETL 主な入力データ 構造化データ(データベース、CSV等) 非構造化データ(テキスト、音声、画像 等) 「変換」の目的 データのクレンジング、正規化、集計 データの構造化と意味付け(分類、感情分 析、情報抽出) 中核技術 スクリプティング(SQL, Python)、ルー ルベースエンジン 生成AI / 大規模言語モデル(LLM) 主要な課題 スケール対応、スキーマ定義 文脈、ニュアンス、意図の理解 人間の役割 データエンジニアによる変換ロジックの実 装 ビジネスユーザーによる指示(プロンプ ト)の設計 主な出力データ データウェアハウス内の構造化データ 質的情報を含む、リッチな構造化データ (CSV、JSON等)

Slide 12

Slide 12 text

Generative ETLは、非構造化データと BIツールを繋ぐ 12 Amazon QuickSight(BIツール)と「お客様の声」には、データ形式の 違いから直接連携できないという課題がありました。 ● Amazon QuickSight (BIツール) の特性 ○ ワードクラウドなどの強力な可視化機能を持つ。 ○ しかし、分析できるのは定量的な構造化データに限られる。 ● 「お客様の声」の特性 ○ 自由記述のテキストであり、非構造化データにあたる。 ○ そのため、BIツールは生の声を直接読み込んで分析することがで きない。 このギャップを埋めるのがGenerative ETLです。生成AIが非構造化デー タである「お客様の声」を、BIツールが理解できる構造化データへと変 換。

Slide 13

Slide 13 text

AWSで実現する Generative ETL

Slide 14

Slide 14 text

Generative ETLアーキテクチャ 14 Extract(抽出) ● 「お客様の声」を Amazon S3 に集約 Transform(変換) ● AWS Lambdaによる正規化 (Normalization) ● AWS Lambdaによる形態素解析 (Tokenization / Morphological Analysis)、 係り受け解析(Dependency parsing) ● Amazon Bedrock によるLLMを用いてテ キストから分類、判定、感情分析 Load(格納) ● 構造化されたデータを Amazon S3に 格納 、Amazon Athenaでクエリ Visualize(可視化) ● Amazon QuickSight のダッシュボー ドを構築 。 ● Amzon QuickSight のデータストーリ 機能やシナリオ機能を用いて生成 ※ ワークフローは、AWS Step Functions を用いて管理します。

Slide 15

Slide 15 text

Amazon BedrockによるAI駆動のデータ変換 15 プロンプトで生成AIに指示を与え、高度なテキスト分析を実現する。 ● タスク1:分類(Categorization) ○ 目的: フィードバックを「UI/UX」「価格」等のビジネスカテゴリに自動分類。 ○ プロンプト例: 「以下のレビューを 'UI/UX', '価格', '機能要望' のいずれかに分類し、JSON形式 で出力してください。」 ● タスク2:感情分析(Sentiment Analysis) ○ 目的: ポジ/ネガだけでなく、文脈に応じた詳細な感情を把握。 ○ プロンプト例: 「以下のテキストの感情(ポジティブ, ネガティブ, 中立)を判定し、言及されて いる特定の側面と関連する感情も抽出してください。」 ● タスク3:情報抽出(Information Extraction) ○ 目的: テキストから「顧客名」「製品SKU」等の特定の情報を構造化して抽出。 ○ プロンプト例: 「以下の会話記録から、顧客名, 製品SKU, 報告された問題点を抽出し、JSONオ ブジェクトで出力してください。」

Slide 16

Slide 16 text

Amazon QuickSightで インサイトを「ストーリー」に変える

Slide 17

Slide 17 text

「お客様の声」を誰もが理解できるビジュアルへ 17 ダッシュボード例「お客様の声」モニタリング ● ワードクラウド ○ 話題のキーワードを直感的に把握 。 ● ワードランク ○ 最も声が寄せられているトピックを特定し、リソース配分の参考にする。 ● センチメント分析 ○ テキストデータから人間の感情的なトーンを検出・分析する。 ● 係り受け分析 ○ テキストデータから、何について、どのように評価されているのかを正確 に把握できる。

Slide 18

Slide 18 text

18 ワードクラウド トップワード センチメント分析 係り受け分析 「お客様の声」を理解できるビジュアルへ Sample Data

Slide 19

Slide 19 text

19 「お客様の声」をストーリーに変える Amazon QuickSightのData Stories は、ダッシュボード上のデータからイ ンサイトを自動で文章化し、ストーリー形式で分かりやすく説明してくれる 生成AI機能です。 自然言語で「具体的な施策を提 案」などと指示するだけで、重要 なポイントや傾向をまとめたス トーリーを数分で作成します。 専門家でなくても、データに基づ いた洞察を手軽に得られ、関係者 との共有も簡単に行えるため、迅 速な意思決定を支援します。

Slide 20

Slide 20 text

20 「お客様の声」をストーリーに変える 経験豊富なデータアナリストであり、優れた マーケティング戦略家です。 「お客様の声」に関する可視化データから、重 要なトレンドを読み解き、事業成長に繋がる具 体的な施策を提案してください。 各セクションのタイトルと内容に英語は使わな いでください。必ず日本語を使ってください。 プロンプトの入力例 : Sample Data

Slide 21

Slide 21 text

21 「お客様の声」をストーリーに変える Data Stories は約2分程度で作成されます。 Sample Data

Slide 22

Slide 22 text

インサイトを得られる世界へ 22 ● 自然言語で質問するだけ ○ SQLやダッシュボード操作は不要。QuickSightに、日常会話のように質問を入力す るだけ 。 ○ 質問例: 「先月、モバイルアプリに関するネガティブなトピックのトップ3は何で したか?」 ● 生成AIが最適なビジュアルを自動生成 ○ Amazon Qが質問の意図を理解し、構造化データにクエリを実行。 ○ 回答に最適なグラフや表を自動で作成して提示 。 ● ビジネスの変化 ○ Before: ビジネス部門がBIチームに分析を依頼 → 回答まで数日。 ○ After: ビジネス部門が自ら質問 → 回答まで数秒〜数分。組織全体の俊敏性が飛躍 的に向上する。

Slide 23

Slide 23 text

インサイトからアクションへ繋げる ベストプラクティス

Slide 24

Slide 24 text

導入に向けたベストプラクティス 24 1. PoC(概念実証)から始める ○ インパクトが大きく管理しやすい単一のデータソース(例:主力製品のレ ビュー)から着手し、小さく初めて迅速に価値を実証する 。 2. プロンプトエンジニアリングを磨く ○ アウトプットの品質はプロンプトの品質に依存する。明確な指示、具体例の 提示、出力形式の指定が鍵 。 3. コストを管理する ○ リージョン毎の基盤モデルの入力トークン数や出力トークン数をモニタし て、利用状況を把握・管理する 。 4. QuickSightのDataStoriesはビジネスコンテキストを含める ○ データストーリーを作成するプロンプトには、 「小売」など分析対象やビジ ネス目標を含めるとより良いストーリーが生成される。

Slide 25

Slide 25 text

まとめ

Slide 26

Slide 26 text

最後に 26 ● Generative ETLは、既存プロセスの改善ではなく、パラダイムシフトで す。 ○ これまで受動的であった「お客様の声」を、能動的でリアルタイムな ビジネスの推進力へと変えます。 ● この変革を実現するテクノロジーは、すでにここにあります。 ○ AWSのマネージドサービスを組み合わせることで、迅速かつスケーラ ブルに構築可能です。 ● お客様の声を単なる「データ」から、ビジネスを導く「ストーリー」へ。 ○ この新しい潮流を理解し、活用する企業こそが、次世代の顧客体験を 創造し、競争優位を確立します。

Slide 27

Slide 27 text

No content