Upgrade to Pro — share decks privately, control downloads, hide ads and more …

マルチエージェントで性能が上がったText-to-SQLのいま/Text-to-SQL

 マルチエージェントで性能が上がったText-to-SQLのいま/Text-to-SQL

吉田真吾

June 28, 2024
Tweet

More Decks by 吉田真吾

Other Decks in Technology

Transcript

  1. Generative Agents, Inc. AWS Serverless Heroとして日本におけるサーバーレスの普 及を促進。 「ChatGPT/LangChainによるチャットシステム構築[実 践]入門」(技術評論社)共著、「Azure OpenAI

    Serviceで はじめるChatGPT/LLMシステム構築入門」(技術評論社) 共著、「AWSによるサーバーレスアーキテクチャ」(翔泳 社)監修、「サーバーレスシングルページアプリケーショ ン」(オライリー)監訳、「AWSエキスパート養成読本」 (技術評論社)共著。 ChatGPT Community(JP)主催 大規模言語モデルを組み込んだアプリケーションやAIエージ ェントの開発を実施。 個人ではエンジニア向けの勉強会開催や教材作成など。オン ラインコースUdemyではベストセラー講座多数。 「ChatGPT/LangChainによるチャットシステム構築[実 践]入門」(技術評論社)共著。 勉強会コミュニティStudyCo運営。 事業会社の顧問CTOとして活動するソフトウェア開発のスペ シャリスト。AIエージェントを経営に導入することにより、 あらゆる業種業態の生産性を高めるための活動に尽力してい る。 「その仕事、AIエージェントがやっておきました。 ――ChatGPTの次に来る自律型AI革命」(技術評論社)単 著、Software Design「実践LLMアプリケーション開発」 (技術評論社)連載。 西見 公宏(にしみ まさひろ) 吉田 真吾(よしだ しんご) 大嶋 勇樹(おおしま ゆうき) 代表取締役CEO / Founder 取締役COO / Co-founder 取締役CTO / Co-founder
  2. 評価フレームワークはSpiderかBIRD-SQL The Dawn of Natural Language to SQL: Are We

    Fully Ready? https://arxiv.org/html/2406.01265v1 Spider 2018〜(LLM版は2023.2〜) https://yale-lily.github.io/spider 10,181 questions and 5,693 unique complex SQL queries on 200 databases with multiple tables covering 138 different domains. • イェール大の学生がアノテートした データセット • 派生版が多く存在 • 1.0版は2024.2から停止中、2.0待ち BIRD-SQL 2023.5〜 https://bird-bench.github.io/ 12,751 unique question-SQL pairs, 95 big databases with a total size of 33.4 GB. It also covers more than 37 professional domains, • Spiderほど有名じゃないが、より現実 を反映している
  3. CHESS: Contextual Harnessing for Efficient SQL Synthesis CHESS: Contextual Harnessing

    for Efficient SQL Synthesis https://arxiv.org/html/2405.16755v1 1. キーワードの抽出 2. 関連性の高いデータとそのカラム情 報をRetrieveする 3. テーブルとカラムを選定する 4. 候補を生成する 5. 修正する