Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ローカルLLM
Search
NearMeの技術発表資料です
PRO
November 07, 2025
150
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
ローカルLLM
NearMeの技術発表資料です
PRO
November 07, 2025
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
初めてのLean言語
nearme_tech
PRO
0
9
Apache Airflow Workflow orchestration without turning cron into spaghetti
nearme_tech
PRO
1
16
実務で役立つ幾何学 ボロノイ図の基礎から グラフ・ネットワーク応用まで
nearme_tech
PRO
1
48
SQL/ID抽出タスクから考える 実践的なハルシネーション対策
nearme_tech
PRO
1
58
OpenCode & Local LLM
nearme_tech
PRO
0
110
OpenCode Introduction
nearme_tech
PRO
0
52
【Browser Automation × AI】 Stagehandを試してみよう
nearme_tech
PRO
0
140
AIを用いた PID制御で部屋 の温度制御をしてみた
nearme_tech
PRO
0
140
CopilotKit + AG-UIを学ぶ
nearme_tech
PRO
3
560
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.5k
Designing Powerful Visuals for Engaging Learning
tmiket
1
410
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
160
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
360
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
Designing for humans not robots
tammielis
254
26k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
310
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Building an army of robots
kneath
306
46k
ラッコキーワード サービス紹介資料
rakko
1
3.6M
How STYLIGHT went responsive
nonsquared
100
6.2k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
220
Transcript
0 ローカルLLM 2025-11-06 第134回NearMe技術勉強会 Takuma KAKINOUE
1 LLMをローカルで動かしたい • 楽にできる⽅法はないか? → Ollamaを使ってみよう!(https://ollama.com/) • どのモデルを動かそう? ◦ https://ollama.com/search
◦ gpt-ossが気になったのでgpt-oss:20bを動かしてみる
2 動かし⽅ • ollama pull gpt-oss:20b • ollama run gpt-oss:20b
3 環境 • Windows11 • GPU:RTX5070Ti(VRAM:16GB)
4 動かしてみた結果 約12秒で完全な出⼒が得られた! AIからの返答は、「前提知識があれば理解できる が、⼩学⽣が理解するのは難しそう」といった 感じ..
5 Mac(M2 Pro)でも試してみた • brew install ollama • ollama serve
• ollama pull gpt-oss:20b • ollama run gpt-oss:20b 同じ質問をしたら、完全な出⼒が得られるのに約43秒かかった → 5070tiより遅いが実⽤的なレベル ※出⼒の内容は若⼲異なったが(⻑さは同程度)、質はどっこいどっこい
6 本家ChatGPT(無課⾦版)では 28秒かかったが、 内容は⼀番わかりやす かった! (モデルはOSS版と異な る模様)
7 結果 • local(RTX5070Ti) ◦ 処理時間:約12秒、出⼒精度:普通 • local(Mac M2 Pro)
◦ 処理時間:約43秒、出⼒精度:普通 • 無課⾦版ChatGPT ◦ 処理時間:約28秒、出⼒精度:良い
8 コーディングもやらせてみた結果(local: Mac M2 Pro) > FizzBuzz問題を解くコードをPythonで書いて。
9 今後の展望 • Toolsなどを使って⾃作コーディングエージェントを作ってみる (余談) DGX Sparkほしい..! https://www.nvidia.com/ja-jp/products/workstations/dgx-spark/
10 Thank you