Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20240827_LLM発表

TK
August 29, 2024
100

 20240827_LLM発表

TK

August 29, 2024
Tweet

Transcript

  1. 自己紹介 職歴や経験分野 ▪ SEとして20年近く汎用的なシステム開発 ▪ 先端科学技術と情報技術の融合に興味あり ▪ 現在は本業データサイエンス ▪ 個人プロジェクトで識別

    AI、生成AIを5年ほど ▪ 統計や機械学習も少し 柴田 たけお ▪ 愛知県名古屋市生まれ豊田市育ち ▪ 大学は仙台過ごし、大学院は   米国カリフォルニアバークレにて地球物理学専攻 ▪ 現在アメリカカリフォルニア州在住(ロス近郊) ▪ 愛知県の豊田市にある空家に年数回滞在 基本情報 趣味 ▪ キャンプやハイキング、野宿旅行 ▪ 自転車旅行 ▪ 18切符での鈍行列車旅 ▪ 最近は日本の田舎の古民家探 写真
  2. AIでやってきたこと遊んだこと(興味本位のプロジェクトも含む) • 音声認識システム(2018~2021) 議事録などを音声から自動文字起こしと要約     **当時KALDI + 東工大レシピやESPNETを使用、今はWISPHER…. • 笑顔+笑声 検知システム(2018~2021)    会議での参加者の笑顔を検知して会議に進んだかどうかの顔認識と    音声の笑声の検知をAIと音響工学勉強してスペクトルのパターンを    AI分析(波はとても奥が深い。)

    • SNS評価システム (2021 ~ 2023)    SNSでのコメントや評価を自動で採点して評価を見極めるシステム **この時期はポジネガ判定程度で感動❣ • 災害管理システム案(個人的趣味でPOC)     自治体向けに災害管理(SNSのコメント画像、リモートセンシング画像のAI解析) • 農産物管理のため衛星画像リモートセンシングシステム(個人的趣味でPOC)    衛星画像から農業の育成状況をチェックして農産物市場価格の影響をアセスメント • 顔認証システム (2023 ~)    顔認証システムを使い本人特定をする ★ フリーなチャットおよび独自文書回答のチャットボット (2024 ~) 今回の発表テーマ!! 独自文書から OPENAIと公開言語モデルを利用してチャットボット ただしデータ解析のアシスタントして生成 AIが現状どこまで使えるか少し厳しく探求   **今回はフリーに統計問題と数表をよませた RAGをOpenAIのCHATGPTのAPIだけでなく        日本語モデル ELYZAと比較しながらデモ      
  3. 使用モデル •デモサイト(クラウド上のLLM) 最新でパラメータ最多であろうサイトで 統計問題小手調べ https://elyza.ai/lp/elyza-llm-for-jp (比較のためChatGPT4oもテスト) •LOCAL LLM (+ OpenAI API) 整形しきってない数表を与えたRAGで実験 Llama-3-ELYZA-JP-8B-q4_k_m.gguf on

    Ollama (比較のためChatGPT gpt-3.5-turbo のAPIもテスト) テスト内容 右のような 50のデータを与えて質問した. 1) 以下のCSVのデータから販売台数の 最大値、最小値、平均値、中央値、最頻値、分散、標準偏差を求めてください 2) 年齢と販売台数の相関係数を求めてください 3) 学歴別(大学、高校)の販売台数の平均を求めて各平均をください    またt検定を実施してその平均の差が有意かどうかをみるためにp値を求めてくださ い 4) 性別と担当地区のクロス集計表を作成してください また期待度数のクロス集計表も作成してください また性別と担当地域が偏向なく独立に選ばれているか カイ2乗検定をおこない p値を求めてください
  4. RAGでの実行環境とサンプルデータ概要 [LOCALでの実行環境 ]: AWS EC2 g4dn • NVIDIA Tesla T4 16GB

    MEMORY • 4 vCPU 16 GB RAM • Ubuntu 24.04 CUDA 12.5 使用ライブライりやフレームワーク LLM本体 • OLLAMA • Llama-3-ELYZA-JP-8B-q4_k_m.gguf RAG用 VectorIndex保存 • llama-index フロントエンド • Streamlit RAGでの使用データ 日本食品成分表2024 八訂  添付PDFからEXCELに変換してもの 本当は高い精度で機械的にRDBに格納したいが中途半端な整形状態でテーブルに いれるために整形するのははかなり整形が大変そう =>RDB+SQL(+過酷なデータクレンジングと整形)   ではなくRAG+日本語PROMPTで    検索回答ある程度いけるだろうか?
  5. 所感および今後のどのようなアプローチが必要か 今後のアプローチ案 : - PROMPTをもっと工夫する、VECTOR DBにCHROMADBやFAISSなど検討 - Document AIの技術を調査、導入検討 -もっと最適なチャンクサイズ方法を工夫

    - FINETUNINGやRAGを工夫やってみる(初級記述統計の本を参照させる?) - モデルの開発1:自然言語と数表からPROGRAMに翻訳して実行して答えるLLMモデル - モデルの開発2: 数表+自然言語の処理に特化したLLMモデル - アプローチを変える(LLMという手段をいったん忘れる。) 所感: - LLMは数学がやはり苦手? そもそも知性があるわけではないので自分期待しすぎ?   ちなみにCHATGPTだといったんPROGRAM(PYTHON)に   翻訳してそれを実行して答えようとしている。 -  LLMは文系問題に強いが理系問題にはまだまだ弱い -  今の仕組み(膨大な線形式+非線形式+強化学習)ではまだまだ厳しいが今後の発展に期待 - とはいえ膨大な書類や論文の中にある重要な表などは正しく数理的にはまとめてほしいとは思う