Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DeepSeek-R1:最新の大規模言語モデル
Search
stoneweb
February 02, 2025
Technology
0
110
DeepSeek-R1:最新の大規模言語モデル
stoneweb
February 02, 2025
Tweet
Share
More Decks by stoneweb
See All by stoneweb
ChatGPTのプロンプトの基本的な書き方
stoneweb
1
150
ChatGPTを業務に活用する具体例
stoneweb
0
97
ChatGPTのAIエージェント「Operator」について
stoneweb
0
54
Perplexityのスペースを使って簡単にAIクローンを作る方法
stoneweb
0
92
ChatGPTで作成した記事をPerplexity・Felo・Grokでファクトチェックする方法
stoneweb
0
300
ChatGPTとは
stoneweb
0
100
Other Decks in Technology
See All in Technology
本部長の代わりに提案書レビュー! KDDI営業が毎日使うAIエージェント「A-BOSS」開発秘話
minorun365
PRO
14
1.8k
Tensix Core アーキテクチャ解説
tenstorrent_japan
0
360
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
47
28k
IIWレポートからみるID業界で話題のMCP
fujie
0
380
キャディでのApache Iceberg, Trino採用事例 -Apache Iceberg and Trino Usecase in CADDi--
caddi_eng
0
150
DenoとJSRで実現する最速MCPサーバー開発記 / Building MCP Servers at Lightning Speed with Deno and JSR
yamanoku
1
100
技術職じゃない私がVibe Codingで感じた、AGIが身近になる未来
blueb
0
130
Tenstorrent HW/SW 概要説明
tenstorrent_japan
0
400
エンジニア採用から始まる技術広報と組織づくり/202506lt
nishiuma
8
1.7k
新規プロダクト開発、AIでどう変わった? #デザインエンジニアMeetup
bengo4com
0
460
kotlin-lsp を Emacs で使えるようにしてみた / use kotlin-lsp in Emacs
nabeo
0
150
OCI Oracle Database Services新機能アップデート(2025/03-2025/05)
oracle4engineer
PRO
1
150
Featured
See All Featured
Rebuilding a faster, lazier Slack
samanthasiow
81
9k
The World Runs on Bad Software
bkeepers
PRO
68
11k
Mobile First: as difficult as doing things right
swwweet
223
9.6k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.2k
Build The Right Thing And Hit Your Dates
maggiecrowley
36
2.7k
YesSQL, Process and Tooling at Scale
rocio
172
14k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
107
19k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
130
19k
It's Worth the Effort
3n
184
28k
Agile that works and the tools we love
rasmusluckow
329
21k
Transcript
DeepSeek-R1: 最新の⼤規模 ⾔語ムヅラ DeepSeek-R1は、中国のAI企業DeepSeekによって開発された最新の⼤規模 ⾔語ムヅラ(LLM)で、2025年1⽉20⽇にエヺフヱセヺシとして公開されま した。このムヅラは、特に推論能⼒に特化しており、OpenAIのo1ムヅラと 同等、またはそれ以上の性能を持つとされています。DeepSeek-R1は、商 業利⽤を含む⾃由な利⽤が可能なMITョアスヱシのもとで提供されていま す。
主な特徴 エヺフヱセヺシ MITョアスヱシにより、開発者はムヅラを⾃由にォシソボ アジし、商業利⽤も可能です。 ⾼い推論能⼒ 数学的問題解決やフルギョポヱギ⽀援など、論理的思考を 要するソシキにおいて⾼精度な結果を⽰します。具体的に は、数学プヱタボヺキ「MATH-500」で97.3%の正解率を 記録し、フルギョポヱギ競技コアテ「Codeforces」では 96.3ハヺスヱソアラを達成しています。
強化学習の活⽤ DeepSeek-R1は、強化学習を⽤いた⾃律的な学習を⾏ い、さらに⾼品質なヅヺソを⽤いたビゟアヱタャヺドヱギ も⾏っています。この゠フルヺタにより、ムヅラは複雑な 問題解決能⼒を獲得し、特に数学やフルギョポヱギの分野 で優れた性能を発揮します。 ⼤規模ケヱツカシテ対応 最⼤128Kテヺキヱの⼊⼒を処理できるため、⻑⽂のデカ ャミヱテや⻑時間の会話においても⼀貫性のある応答を⽣ 成できます。
性能とベンチマーク 数学的推論 AIME 2024で79.8%のスコアを達成 し、MATH-500では97.3%の正解率 を記録しています。 プログラミング能⼒ Codeforcesで2029という⾼レーテ ィングを獲得し、プログラミング関 連のタスクに最適です。
総合的な知識理解⼒ MMLUテストで90.8%のスコアを達 成し、さまざまな知識を問うタスク においても⾼い性能を⽰していま す。
ケシテと利⽤⽅法 ⼊⼒テヺキヱ カメチサャバチテ時は$0.14/百万テヺキヱ、カメチサャポ シ時は$0.55/百万テヺキヱ。 出⼒テヺキヱ $2.19/百万テヺキヱ。 このように、DeepSeek-R1は⾼性能でありながら、ケシテハビェヺボヱシにも優れたムヅラです。
注意点 ヅヺソ保護に関する懸念 中国企業が開発したムヅラであるため、⼀部の利⽤者はヅヺソ 保護に関する懸念を抱いています。API経由で⼊⼒したヅヺソ が学習ヅヺソとして使⽤される可能性があるため、機密情報を 扱う際には注意が必要です。 特定の制約 台湾や中国政府に関連する質問では特定の制約が確認されてい ます。
まとめ DeepSeek-R1は、エヺフヱセヺシでありながら⾼い推論能⼒を持つ⼤規模 ⾔語ムヅラで、特に数学やフルギョポヱギの分野での応⽤が期待されていま す。強化学習を活⽤した⾃律的な学習フルスシにより、従枈のムヅラに⽐べ て優れた性能を発揮しています。商業利⽤が可能で、ケシテ効率も⾼いた め、研究機関や企業にとっても魅⼒的な選択肢となるでしょう。
STONEWEB 合同会社ストーンウェブ 経営者の「困った」にワンストップで応える!幅広い実務経験と経営視点をあわせ持つパートナーとして、WebサイトやSNS運⽤ はもちろん、採⽤やブランディングなど複数の課題を⼀括サポート。 余計なやり取りやコストを抑えながら、経営者の意思決定と 戦略⽴案に集中できる環境を整えます。 ご相談はこちら