Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
traP ユニークビジョン LT 会
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
taxfree
February 28, 2025
17
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
traP ユニークビジョン LT 会
taxfree
February 28, 2025
More Decks by taxfree
See All by taxfree
Evolving collaborative research ideas with multi-agent grounding in lab-specific contexts and literature
taxfree_python
0
5
研究開発のための Coding Agent 活用術
taxfree_python
0
85
R&D_UIのラストワンマイルをLLMで埋める
taxfree_python
0
19
AI for タギロン
taxfree_python
0
41
traP 2024 忘年会
taxfree_python
0
11
R.*u.*f.*f.*
taxfree_python
0
19
traP_新入生オリエンテーション_2024
taxfree_python
0
110
A Beginner's Guide to Quantum computing
taxfree_python
0
420
How to create slack Bot with Python?
taxfree_python
1
350
Featured
See All Featured
Site-Speed That Sticks
csswizardry
13
1.2k
Git: the NoSQL Database
bkeepers
PRO
432
67k
Accessibility Awareness
sabderemane
1
130
Java REST API Framework Comparison - PWX 2021
mraible
34
9.3k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
160
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Six Lessons from altMBA
skipperchong
29
4.3k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
400
Art, The Web, and Tiny UX
lynnandtonic
304
22k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
860
Transcript
PaperRecap Presented by: tax_free
Who am I? 東京科学大学 情報理工学院 数理・計算科学系 数理最適化の研究室に入っている けど,最近は LLM に興味あり
明日 TOEIC を受ける twitter: @taxfree_python
Motivation 院試のために英語の勉強をする必要がある 非常に,とても 最新論文のキャッチアップが間に合わない
Motivation 院試のために英語の勉強をする必要がある 非常に,とても 最新論文のキャッチアップが間に合わない → 特にリスニングの練習をしたい → 短い時間でさっと分かると嬉しい
Solution LLM パンチでどうにかできないかなぁ...
Solution LLM で要約して 1. TTS で英語の音声にして 2. YouTube に upload
する 3.
Implementation オープンアクセス じゃないと 権利が怖い... Gemini 2.0 Text-to-Speech AI arXiv YouTube
Data API 無料 + pdf 読み込みに対応 無料 (なんでもいい) upload に必須 https://vecta.io/symbols/4/google-cloud- platform/67/google-speech-to-text https://cloud.google.com/products/gemini/data bases?hl=ja https://developers.google.com/youtube/terms/ branding-guidelines https://info.arxiv.org/brand/logos.html
Result
Future Work VTuber? を使ってかわいい感じにしたい 画面があまりにも寂しい 要約の内容が微妙なのでいい感じにしたい arXiv 以外のものを提供したい Gemini 2.0
Flash の限界? プロンプトが甘いのでいい感じにする Deep research だったり Notebook LM の結果だったりも 良さそう?