Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ローカルLLM
Search
NearMeの技術発表資料です
PRO
November 07, 2025
0
54
ローカルLLM
NearMeの技術発表資料です
PRO
November 07, 2025
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
Tile38 Overview
nearme_tech
PRO
0
23
Rust 製のコードエディタ “Zed” を使ってみた
nearme_tech
PRO
0
150
実践で使えるtorchのテンソル演算
nearme_tech
PRO
0
17
ローカルLLMを⽤いてコード補完を⾏う VSCode拡張機能を作ってみた
nearme_tech
PRO
0
410
初めてのmarimo (ハンズオン)
nearme_tech
PRO
0
33
LlamaIndex Workflow: Build Practical AI Agents Fast
nearme_tech
PRO
0
32
Box-Muller法
nearme_tech
PRO
1
52
Kiro触ってみた
nearme_tech
PRO
0
390
今だからこそ入門する Server-Sent Events (SSE)
nearme_tech
PRO
4
630
Featured
See All Featured
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
117
110k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
580
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
57
50k
The World Runs on Bad Software
bkeepers
PRO
72
12k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
170
Build your cross-platform service in a week with App Engine
jlugia
234
18k
For a Future-Friendly Web
brad_frost
182
10k
GraphQLの誤解/rethinking-graphql
sonatard
74
11k
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
0
250
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
88
Transcript
0 ローカルLLM 2025-11-06 第134回NearMe技術勉強会 Takuma KAKINOUE
1 LLMをローカルで動かしたい • 楽にできる⽅法はないか? → Ollamaを使ってみよう!(https://ollama.com/) • どのモデルを動かそう? ◦ https://ollama.com/search
◦ gpt-ossが気になったのでgpt-oss:20bを動かしてみる
2 動かし⽅ • ollama pull gpt-oss:20b • ollama run gpt-oss:20b
3 環境 • Windows11 • GPU:RTX5070Ti(VRAM:16GB)
4 動かしてみた結果 約12秒で完全な出⼒が得られた! AIからの返答は、「前提知識があれば理解できる が、⼩学⽣が理解するのは難しそう」といった 感じ..
5 Mac(M2 Pro)でも試してみた • brew install ollama • ollama serve
• ollama pull gpt-oss:20b • ollama run gpt-oss:20b 同じ質問をしたら、完全な出⼒が得られるのに約43秒かかった → 5070tiより遅いが実⽤的なレベル ※出⼒の内容は若⼲異なったが(⻑さは同程度)、質はどっこいどっこい
6 本家ChatGPT(無課⾦版)では 28秒かかったが、 内容は⼀番わかりやす かった! (モデルはOSS版と異な る模様)
7 結果 • local(RTX5070Ti) ◦ 処理時間:約12秒、出⼒精度:普通 • local(Mac M2 Pro)
◦ 処理時間:約43秒、出⼒精度:普通 • 無課⾦版ChatGPT ◦ 処理時間:約28秒、出⼒精度:良い
8 コーディングもやらせてみた結果(local: Mac M2 Pro) > FizzBuzz問題を解くコードをPythonで書いて。
9 今後の展望 • Toolsなどを使って⾃作コーディングエージェントを作ってみる (余談) DGX Sparkほしい..! https://www.nvidia.com/ja-jp/products/workstations/dgx-spark/
10 Thank you