DataStaxの生成AIへのアプローチと顧客のAI活用事例

Slide 1

Slide 1 text

Slide 2

Slide 2 text

©2023 DataStax. – All rights reserved  2  はじめに：本ウェビナーについて本ウェビナーは、録画されたビデオの配信となります。      8/31 オンラインで参加の方々へ    ご覧のプラットフォームの「Ask Question」からご質問いただくことが可能です。   ご覧の全ての方々へ    ご質問・デモ・ご商談のご依頼は、[email protected]へお問合せください。

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

©2023 DataStax. – All rights reserved  DataStaxのご紹介本社    Santa Clara, CA    2010年4月創業    Santa Clara • London • Paris •   Singapore • Tokyo •  Sydney • Wellington          オープンソースを基盤とした  テクノロジースタックを  エンタープライズ向けソリューション  として提供  DATASTAX JAPAN 2017年法人設立

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

©2023 DataStax. – All rights reserved  サンプルアプリ 9  https://github.com/YoshiyukiKono/semantic-text-search Astra DBとColaboratory (※)の組み合わせのみで実行可能    ※ Colaboratory (Colab): Googleの提供する、環境構築なしでブラウザ上で、 Pythonを記述・実行できる環境。  

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

©2023 DataStax. – All rights reserved  リアルタイム AI を活用するリーダー企業 ● ドライバー、パートナー、顧客のデータを統合して予測を推進  ● ドライバーの供給と乗客の需要に合わせた動的な価格設定  ● 生成AI を活用アプリ内コミュニケーション    ● ヒストリカル情報とリアルタイム情報を組み合わせて、継続的なエンゲージメントを推進   ● リアルタイムのユーザーの行動をコンテンツの提示に活用  ● ベクトル検索を活用したレコメンデーション  Apache CassandraⓇ を使用してAIを実現 

Slide 13

Slide 13 text

©2023 DataStax. – All rights reserved  Uber：CassandraをMLプラットフォームに活用 13  https://www.uber.com/en-JP/blog/michelangelo-machine-learning-platform/ Cassandra フィーチャーストア Cassandra モデルレポ ● バッチ(OFFLINE)とリアルタイム(ONLINE)、２つのデータ処理パイプラインを備えた Lambda アーキテクチャ

Slide 14

Slide 14 text

©2023 DataStax. – All rights reserved  Netﬂix: Cassandraをアノテーション管理に活用 14  https://netflixtechblog.com/scalable-annotation-service-marken-f5ba9266d428 https://www.infoq.com/news/2023/02/netflix-annotations-cassandra/ ElasticSearch ● 全文検索 ● 地理検索 ● セマンティクス検索 Cassandra アノテーションのシングル・ソース・オブ・トゥルース

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

©2023 DataStax. – All rights reserved  17  リアルタイムの会話から感情を特定し、サービスエージェントや営業担当者が個々の顧客のニーズに適切かつ効果的に対応 https://jp.uniphore.com/ https://www.datastax.com/jp/enterprise-success/uniphore 同社システムは AWS上で運営されていますが、Amazon Keyspaces は、実行可能な選択肢でなかったと、いいます。「Amazon Keyspacesは Cassandra ではありません。DynamoDB ストレージエンジン上の CQL レイヤーです」同社は、AstraDBを選択しました。「私たちが生成するデータ量が大きいため、これは私たちにとって適切なソリューションではありませんでした。 Cassandra が提供するストレージの最適化とパーティショニングが必要でした。」

Slide 18

Slide 18 text

©2023 DataStax. – All rights reserved  18  https://www.datastax.com/jp/enterprise-success/digital-river ● グローバルなeコマース、支払い、マーケティングサービスを提供 ● 請求の最適化と不正行為の防止に機械学習を活用 https://www.digitalriver.com/ Digital River は、Cassandra を直接管理していた場合と比較して、総所有コストを全体で 60% 削減しました。 Astra DB は使用量モデルに基づいて価格設定されているため、Digital River はトラフィックに基づいて支払います。「Astra DB は、コスト削減、管理性、サポート性の観点から総合的に有利」

Slide 19

Slide 19 text

©2023 DataStax. – All rights reserved  19  https://www.datastax.com/blog/dataworkz-enabling-customer-360-in-minutes-with-vector-search-and-llms https://www.datastax.com/jp/enterprise-success/dataworkz https://www.datastax.com/enterprise-success/dataworkz/dataworkz-optimizes-its-startup-resources-with-ast ra-db ● Dataworkz開発チームは経験豊富な Apache Cassandra開発者を要しており、高性能でスケーラビリティの高いアクティビティストリームモジュールを構築するために、 Cassandra を選択するのは自然でした。 ● Dataworkz チームは、DataStaxのAstra DBが、要件をすべて満たしていると判断しました。 https://www.dataworkz.com/ AIに基づく分析の複雑さは、平均的なビジネスユーザーにとって必ずしも簡単に習得できるわけではありません。 Dataworkz は、AI を統合するノーコードの高性能クラウドサービスのユーザーインターフェイスをビジネスユーザーに提供することで、この状況を変えようとしています。

Slide 20

Slide 20 text

©2023 DataStax. – All rights reserved  20  https://www.datastax.com/resources/whitepaper/generative-ai-you-can-t-afford-to-wait 「SkyPoint Cloud Inc. は、Astra DB をベクトルデータベースとして使用し、高齢者向け医療業界の変革を支援しています。同社は生成 AI を使用して、医療データと、そこから得られる洞察へのシームレスなアクセスを実現しました。『これは本質的に、HIPAA に完全準拠の高齢者向け医療データの ChatGPT に相当するものです』と SkyPoint の CEO Tisson Mathewは述べています。彼はさらに、AstraDBのベクトル検索の高速さが決めてとなった、他のベクトルストアは遅すぎて SkyPoint の要件を満たすことができなかった、と述べています。」（DataStaxホワイトペーパー『Generative AI - You Can't Afford to Wait』） AstraDBのベクトル検索によって実現されたもの： ● Astra DB をベクトルデータベースとして使用し、高齢者向け医療業界の変革を支援 ● 生成 AI を使用して、医療データと、そこから得られる洞察へのシームレスなアクセスを実現 ● 『HIPAA 完全準拠の医療データの ChatGPT に相当』 AstraDBのベクトル検索を選択した理由： ● AstraDBのベクトル検索の高速さが決めて ● 他のベクトルストアは遅すぎて要件を満たすことができなかった画像は、skypointcloud Inc. HP(https://skypointcloud.com) より 

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

©2023 DataStax. – All rights reserved  承前：予測AIと生成AI 23  予測AI  ● 素早い決断  ● 正確な予測  ● 積極的な行動  生成AI  ● 自然言語応答  ● パーソナライズされたエクスペリエンス  ● カスタマイズされたコンテンツ  インタラクティブな、  コンテキストに基づく  エクスペリエンス  スマートな、  自動化された  オペレーション  Predictive AI 動的な価格設定  リアルタイム取引  予知保全  在庫の最適化  対話 (チャットボット /  仮想エージェント  集合知の活用(公開および非公開テキスト情報)  コンテキスト(AIの役割)の指示    テキスト生成 (文章 / コード)   Generative AI /Gen AI

Slide 24

Slide 24 text

©2023 DataStax. – All rights reserved  生成AI / LLM (大規模言語モデル) 24  LLM：大量のテキストデータ（数十億語）を使ってトレーニングされた自然言語処理のモデルトレーニング時に与えられた言語情報に基づき、質疑応答、テキスト分類、感情分析、文章要約のような言語の意味的理解に基づくタスクを行う「ChatGPT」（2022年12月発表）：2022年初頭にトレーニングされた「 GPT-3.5シリーズ」を元に、チャット向けにファインチューニング『2022年初頭移行の情報は含まれていない』一方で ... 『2022年以前の公開情報について、（ほとんど）あらゆる知識を持つ（かのよう）』

Slide 25

Slide 25 text

©2023 DataStax. – All rights reserved  「AI」の変化 25  データ量の変化  予測AI  生成AI  LLM    コンテクスト：  構造化データ  特徴量    コンテンツ：  非構造化データ  ベクトルデータ  ディープラーニング(深層学習)による画像認識（自動運転の礎） GAN(Generative Adversarial Network)：敵対的生成ネットワークによる画像「生成」リカレントニューラルネットワーク (RNN) によるシーケンシャルデータに対するアプローチ Transformerによる自然言語処理 (NLP)

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

©2023 DataStax. – All rights reserved  ユーザー入力  データユーザー入力＋  企業保有データ  LLM  データシステムからの  応答  生成AI活用アプリ    増強されたLLM  プロンプト・エンジニアリング  / コンテキスト・インジェスチョン (Context Ingestion)  LLMへのリクエスト：「・・・というユーザーのリクエストに答えよ。その際、以下の関連するデータを活用せよ・・・」企業の保有する大量のデータから関連するデータ（非構造）を素早く見つけることが重要  

Slide 31

Slide 31 text

©2023 DataStax. – All rights reserved  プロンプトエンジニアリング解説 31  日本語版：https://www.promptingguide.ai/jp Prompt Engineering Guide DAIR.AIがオープンソースとして公開 https://www.promptingguide.ai/ ● Zero-Shotプロンプティング ● Few-Shotプロンプティング ● Chain-of-Thoughtプロンプティング

Slide 32

Slide 32 text

©2023 DataStax. – All rights reserved  何が使えるか？：ファインチューニング〜LLM 32  https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard オープンLLMリーダーボード  ファインチューニングには、  オープンソースLLMを使う他、  LLMプロバイダーのサービスとして、ユーザーのデータを用いたファインチューニングを特定の LLMに対して  提供しているケースがある  

Slide 33

Slide 33 text

Slide 34

Slide 34 text

©2023 DataStax. – All rights reserved  RAG：Retrieval Augmented Generation 34  https://arxiv.org/abs/2005.11401 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks RAG（検索拡張生成）とは： ● ユーザからの質問に回答するために必要な内容が書かれた文章を検索（ベクトル検索が有効） ● 検索した文章をLLMへの入力（プロンプト）に渡す LLMが学習していない内容について回答を行わせることができる

Slide 35

Slide 35 text

©2023 DataStax. – All rights reserved  ベクトルとは何か？ 35  DataStaxブログ「What is a Vector Database?」 https://www.datastax.com/guides/what-is-a-vector-database コンピューター/プログラミング：  ベクターは、通常「動的」配列     数学（一般的）：  ベクトル空間の元（ベクトル空間に配置しうる）       ベクトル検索の文脈では以下のように考えることができる   ● ベクトルは多次元データ   ● 固定長配列として表現   ● ベクトル同士の比較には以下が重要   ○ 多次元 = 配列は同じ長さ  ○ 多次元 = 要素の「意味合い」が等しい（縦横高さ）        

Slide 36

Slide 36 text

©2023 DataStax. – All rights reserved  ベクトル化・エンベディング 36  DataStaxブログ「What is a Vector Database?」 https://www.datastax.com/guides/what-is-a-vector-database エンベディング：非構造化データのベクトル化。   エンベディングでは、元の情報のセマンティクス（意味）が保存される。     さまざまなエンベディングモデル（ API）が存在する。  ● 共通のモデル/ロジックで多次元データ化されているデータはお互いに比較可能   ● ベクトル同士の比較が目的、複合化が目的ではない

Slide 37

Slide 37 text

Slide 38

Slide 38 text

Slide 39

Slide 39 text

©2023 DataStax. – All rights reserved  ベクトル検索とは何か？ 39    Googleいわく、「あらゆるデータ」を「瞬時に」アクセス（つまり検索）する技術    https://cloud.google.com/blog/ja/topics/developers-practitioners/ﬁnd-anything-blazingly-fast-googles-v ector-search-technology?hl=ja                  （非構造化）データのベクトル化（Embedding）ベクトル同士の類似性を検出する（数学的）アルゴリズム Cassandraのカバーする範囲 

Slide 40

Slide 40 text

Slide 41

Slide 41 text

Slide 42

Slide 42 text

Slide 43

Slide 43 text

Slide 44

Slide 44 text

Slide 45

Slide 45 text

©2023 DataStax. – All rights reserved  CassIO 45  https://cassio.org/ CassIO の目的は、生成AIの一般的なニーズに合わせて Cassandra データベースにアクセスする詳細を抽象化することです。 CassIO は CassandraをLangChain やLlamaIndexとシームレスに統合 https://docs.langchain.com/docs/

Slide 46

Slide 46 text

Slide 47

Slide 47 text

©2023 DataStax. – All rights reserved  LangChain: LLM回答のキャッシュ 47  import langchain from langchain.cache import InMemoryCache langchain.llm_cache = InMemoryCache() import langchain from langchain.cache import CassandraCache from cqlsession import getCQLSession, getCQLKeyspace cqlMode = 'astra_db' # 'astra_db'/'local' session = getCQLSession(mode=cqlMode) keyspace = getCQLKeyspace(mode=cqlMode) langchain.llm_cache = CassandraCache( session=session, keyspace=keyspace, ) メモリ利用  Cassandra/Astra 利用 

Slide 48

Slide 48 text

Slide 49

Slide 49 text