Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
traP ユニークビジョン LT 会
Search
taxfree
February 28, 2025
18
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
traP ユニークビジョン LT 会
taxfree
February 28, 2025
More Decks by taxfree
See All by taxfree
Evolving collaborative research ideas with multi-agent grounding in lab-specific contexts and literature
taxfree_python
0
13
研究開発のための Coding Agent 活用術
taxfree_python
0
85
R&D_UIのラストワンマイルをLLMで埋める
taxfree_python
0
19
AI for タギロン
taxfree_python
0
41
traP 2024 忘年会
taxfree_python
0
11
R.*u.*f.*f.*
taxfree_python
0
19
traP_新入生オリエンテーション_2024
taxfree_python
0
110
A Beginner's Guide to Quantum computing
taxfree_python
0
420
How to create slack Bot with Python?
taxfree_python
1
350
Featured
See All Featured
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.3k
Utilizing Notion as your number one productivity tool
mfonobong
4
320
The World Runs on Bad Software
bkeepers
PRO
72
12k
The Curious Case for Waylosing
cassininazir
1
380
The Limits of Empathy - UXLibs8
cassininazir
1
350
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
New Earth Scene 8
popppiees
3
2.3k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Odyssey Design
rkendrick25
PRO
2
690
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
320
Java REST API Framework Comparison - PWX 2021
mraible
34
9.4k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
230
Transcript
PaperRecap Presented by: tax_free
Who am I? 東京科学大学 情報理工学院 数理・計算科学系 数理最適化の研究室に入っている けど,最近は LLM に興味あり
明日 TOEIC を受ける twitter: @taxfree_python
Motivation 院試のために英語の勉強をする必要がある 非常に,とても 最新論文のキャッチアップが間に合わない
Motivation 院試のために英語の勉強をする必要がある 非常に,とても 最新論文のキャッチアップが間に合わない → 特にリスニングの練習をしたい → 短い時間でさっと分かると嬉しい
Solution LLM パンチでどうにかできないかなぁ...
Solution LLM で要約して 1. TTS で英語の音声にして 2. YouTube に upload
する 3.
Implementation オープンアクセス じゃないと 権利が怖い... Gemini 2.0 Text-to-Speech AI arXiv YouTube
Data API 無料 + pdf 読み込みに対応 無料 (なんでもいい) upload に必須 https://vecta.io/symbols/4/google-cloud- platform/67/google-speech-to-text https://cloud.google.com/products/gemini/data bases?hl=ja https://developers.google.com/youtube/terms/ branding-guidelines https://info.arxiv.org/brand/logos.html
Result
Future Work VTuber? を使ってかわいい感じにしたい 画面があまりにも寂しい 要約の内容が微妙なのでいい感じにしたい arXiv 以外のものを提供したい Gemini 2.0
Flash の限界? プロンプトが甘いのでいい感じにする Deep research だったり Notebook LM の結果だったりも 良さそう?