Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ローカルLLM
Search
NearMeの技術発表資料です
PRO
November 07, 2025
0
17
ローカルLLM
NearMeの技術発表資料です
PRO
November 07, 2025
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
初めてのmarimo (ハンズオン)
nearme_tech
PRO
0
12
LlamaIndex Workflow: Build Practical AI Agents Fast
nearme_tech
PRO
0
14
Box-Muller法
nearme_tech
PRO
1
23
Kiro触ってみた
nearme_tech
PRO
0
160
今だからこそ入門する Server-Sent Events (SSE)
nearme_tech
PRO
4
450
ReactNative のアップグレード作業が (意外に)楽しかった話
nearme_tech
PRO
2
110
強化学習アルゴリズムPPOの改善案を考えてみた
nearme_tech
PRO
0
61
Apple Containerについて調べて触ってみた
nearme_tech
PRO
0
680
Rust 並列強化学習
nearme_tech
PRO
0
48
Featured
See All Featured
Producing Creativity
orderedlist
PRO
348
40k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.1k
Fireside Chat
paigeccino
41
3.7k
Site-Speed That Sticks
csswizardry
13
970
Why You Should Never Use an ORM
jnunemaker
PRO
60
9.6k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
Six Lessons from altMBA
skipperchong
29
4.1k
How to train your dragon (web standard)
notwaldorf
97
6.4k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.4k
Transcript
0 ローカルLLM 2025-11-06 第134回NearMe技術勉強会 Takuma KAKINOUE
1 LLMをローカルで動かしたい • 楽にできる⽅法はないか? → Ollamaを使ってみよう!(https://ollama.com/) • どのモデルを動かそう? ◦ https://ollama.com/search
◦ gpt-ossが気になったのでgpt-oss:20bを動かしてみる
2 動かし⽅ • ollama pull gpt-oss:20b • ollama run gpt-oss:20b
3 環境 • Windows11 • GPU:RTX5070Ti(VRAM:16GB)
4 動かしてみた結果 約12秒で完全な出⼒が得られた! AIからの返答は、「前提知識があれば理解できる が、⼩学⽣が理解するのは難しそう」といった 感じ..
5 Mac(M2 Pro)でも試してみた • brew install ollama • ollama serve
• ollama pull gpt-oss:20b • ollama run gpt-oss:20b 同じ質問をしたら、完全な出⼒が得られるのに約43秒かかった → 5070tiより遅いが実⽤的なレベル ※出⼒の内容は若⼲異なったが(⻑さは同程度)、質はどっこいどっこい
6 本家ChatGPT(無課⾦版)では 28秒かかったが、 内容は⼀番わかりやす かった! (モデルはOSS版と異な る模様)
7 結果 • local(RTX5070Ti) ◦ 処理時間:約12秒、出⼒精度:普通 • local(Mac M2 Pro)
◦ 処理時間:約43秒、出⼒精度:普通 • 無課⾦版ChatGPT ◦ 処理時間:約28秒、出⼒精度:良い
8 コーディングもやらせてみた結果(local: Mac M2 Pro) > FizzBuzz問題を解くコードをPythonで書いて。
9 今後の展望 • Toolsなどを使って⾃作コーディングエージェントを作ってみる (余談) DGX Sparkほしい..! https://www.nvidia.com/ja-jp/products/workstations/dgx-spark/
10 Thank you