Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【ミニハッカソン】 arXiv Slider

【ミニハッカソン】 arXiv Slider

#ミニハッカソンのお題
LLMを用いた面白いサービス・プロダクト。
学習させても、推論のみでも、APIを使っても可。
評価基準:有用性と独自性

# 実装
Chat-GPT + Pandoc + Marp + Stable Diffusion / Nuxt + Tailwind

Yuiga Wada (和田唯我)

March 13, 2023
Tweet

More Decks by Yuiga Wada (和田唯我)

Other Decks in Technology

Transcript

  1. 5 実装: Pandoc + Chat-GPT + Marp + SD /

    Nuxt + Tailwind Stable Diffusion Pandoc markdown Chat-GPT API Slide Frontend
  2. 6 実装: Pandoc + Chat-GPT + Marp + SD /

    Nuxt + Tailwind Stable Diffusion Pandoc markdown Chat-GPT API Slide Frontend arXivのtexソースから有用な文章を抽出
  3. 7 実装: Pandoc + Chat-GPT + Marp + SD /

    Nuxt + Tailwind Stable Diffusion Pandoc markdown Chat-GPT API Slide Frontend 指定した形式で 要約するよう指示
  4. 8 実装: Pandoc + Chat-GPT + Marp + SD /

    Nuxt + Tailwind Stable Diffusion Pandoc markdown Chat-GPT API Slide Frontend 指定した形式で スライドを作成
  5. 9 実装: Pandoc + Chat-GPT + Marp + SD /

    Nuxt + Tailwind Stable Diffusion Pandoc markdown Chat-GPT API Slide Frontend テーマに即した 背景画像の作成
  6. 11 • スライドを補強するためにモデル図を論文から抽出したい → ルールベースのパーサ or 画像・言語による識別器が必要… ⇒ キャプションを与えてLLMに解かせよう! 例:

    Zero shotによる画像抽出 (Caption-Matching) Transformer Encoder MLP Head Vision Transformer (ViT) * Linear Projection of Flattened Patches * Extra learnable [ cl ass] embedding 1 2 3 4 5 6 7 8 9 0 Patch + Position Embedding Class Bird Ball Car ... Embedded Patches Multi-Head Attention Norm MLP Norm + L x + Transformer Encoder Caption: hoge1 Caption: hoge2 Caption: hoge3
  7. 12 Zero shotによる画像抽出 (Caption-Matching) Transformer Encoder MLP Head Vision Transformer

    (ViT) * Linear Projection of Flattened Patches * Extra learnable [ cl ass] embedding 1 2 3 4 5 6 7 8 9 0 Patch + Position Embedding Class Bird Ball Car ... Embedded Patches Multi-Head Attention Norm MLP Norm + L x + Transformer Encoder Caption: hoge1 Caption: hoge2 Caption: hoge3 どのキャプションがモデル図として 相応しいかをLLMに問い合わせる • スライドを補強するためにモデル図を論文から抽出したい → ルールベースのパーサ or 画像・言語による識別器が必要… ⇒ キャプションを与えてLLMに解かせよう! 例:
  8. 14 • 和田 … 全て • 小松 … 画像の埋め込み・スライド作成部分 •

    平野 … Stable Diffusion / Chat-GPT のprompt担当 役割担当:チームShinnosuke
  9. 17 生成したスライド表紙の例 Attention Is All You Need Ashish Vaswani, Noam

    Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin