Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LLMの出⼒制御問題とSansan Labsにおける「Output Parsers」の活⽤ / LLM Output Control Issues and the Use of "Output Parsers" in Sansan Labs

Sansan R&D
November 29, 2023
1k

LLMの出⼒制御問題とSansan Labsにおける「Output Parsers」の活⽤ / LLM Output Control Issues and the Use of "Output Parsers" in Sansan Labs

■イベント:実践LLMエンジニアリング
https://generative-ai-conf.connpass.com/event/299210/

■登壇概要
タイトル:LLMの出⼒制御問題とSansan Labsにおける「Output Parsers」の活⽤
発表者:技術本部 研究開発部 SocSciグループ Juan Martinez

◉ 研究開発職 採用情報
https://media.sansan-engineering.com/randd

◉ Sansan Tech Blog
https://buildersbox.corp-sansan.com/

Sansan R&D

November 29, 2023
Tweet

More Decks by Sansan R&D

Transcript

  1. 写真が入ります Juan Martinez(@Just1n14n) Sansan株式会社 技術本部 研究開発部 SocSci Group 研究員 エルサルバドル⼈。慶應義塾⼤学経済学研究科博⼠課程終了。

    2016年からウェブ開発の業務をしてきた。 Sansan株式会社の研究開発部研究員として、Sansan Labsの アプリ開発、開発業務の効率化、LLMの活⽤や社会ネットワーク の研究に従事。
  2. 働き⽅を変えるDXサービス 請求 ⼈や企業との出会いをビジネスチャンスにつなげる「働き⽅を変えるDXサービス」を提供 ビジネスフローにおけるさまざまな分野でサービスを展開 名刺管理 名刺DX 営業 営業DX 契約 法務DX

    経理DX 個⼈向けDX 法⼈向けDX 必要な情報を すぐに⾒つけられる 情報の管理がしやすく すぐに共有できる 情報を分析・活⽤しやすく データに基づいた判断ができる SansanのDXサービスの活⽤で変わる働き⽅
  3. Output Parsersで解決してみる Output Parser:LLMの出⼒をPythonオブジェクトに変換する。そのため、情報抽出に とても役に⽴つ。LangChainのPydantic Output Parserは特に便利: - LLMに望ましい出⼒の書式(JSON)の指⽰を作ってくれる(few-shot) -

    LLMの出⼒を適宜パースする(Pydantic Object) 企業検索ボットでは⼆つのOutput Parserを⽤いている: - Query Info Parser:ユーザーのクエリからの「課題」と「業界」抽出 - Response Summary Parser: - 回答の⽂章 - 回答に含まれた企業のID - ユーザーのクエリに回答できたかどうか:できなかった場合はボットの回答を無視して、 ボットが質問に対応できない旨をユーザーに伝える
  4. AI企業検索 -経営⽅針・経営課題-におけるハルシネーション対策 ボット 検索エンジン (業界) { “response”: “海外展開を検討している。。。”, “company_ids”: [“123”,

    “456”, “789”], “could_answer_question”: true } 課題 業界 ドキュメント 検索エンジン (経営課題) “海外展開を考えている Webサービスの企業”
  5. 参考⽂献 - Lei Huang, Weijiang Yu, Weitao Ma, Weihong Zhong,

    Zhangyin Feng, Haotian Wang, Qianglong Chen, Weihua Peng, Xiaocheng Feng, Bing Qin, & Ting Liu. (2023). A Survey on Hallucination in Large Language Models: Principles, Taxonomy, Challenges, and Open Questions. (https://arxiv.org/abs/2311.05232) - Zachary Kenton, Tom Everitt, Laura Weidinger, Iason Gabriel, Vladimir Mikulik, & Geoffrey Irving. (2021). Alignment of Language Agents. (https://arxiv.org/abs/2103.14659) - LangChain Output Parsers: https://python.langchain.com/docs/modules/model_io/output_parsers/