Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIを組み込んで自作したWebサービスやツールの紹介

 AIを組み込んで自作したWebサービスやツールの紹介

2024/4/10 「AIミーティング」で発表

siroitori0413

April 12, 2024
Tweet

More Decks by siroitori0413

Other Decks in Technology

Transcript

  1. ▪説明 ②カレンダーキャプチャー ・Google Vision API、OpenAI API、Google Calendar APIを使用 +---------+ +---------------------+

    | Picture | -> | Google Vision API | +---------+ +---------------------+ *1 | +---------+ +-----+ +--------+ | Prompt | -----> |Mux| -----> | Result | +---------+ +-----+ +--------+ *1 プロンプトは固定 ・GPT-4はコスト高い  3.5 Turboはvisionがない   なんちゃって自作             ProtoPediaにも記載しています。             https://protopedia.net/prototype/3819 https://cam2calendar .memetan.dev/
  2. ▪説明 ③AIコード補完 WizardCoder
 • 15B
 • モデルアーキテクチャは starcoder
 • 特殊トークンで補完が可能


    llama.cpp
 llama.cppでQ4_Kに量子化 2023/09時点でLLaMA系列ではないのにllama.cppに サポートが追加[1]
 Q4_Kは12GiBにぎりぎり収まる (= RTX3060で動く) [1]https://github.com/ggerganov/llama.cpp/issues/3076 <fim_prefix>fn helloWorld() { println!(<fim_suffix> } <fim_middle>"Hello world!");
  3. VSCodium
 検証環境はVSCodeの派生のVSCodium 
 拡張機能でコードを補完する 
 使うインターフェスは InlineCompletionItemProvider 
 このインターフェスは GitHub

    Copilot も使っている (だから表示・使い勝手は同 じ) 
 llama.cpp の OpenAI 互換 HTTP API をこのインターフェスに変換するだけ