Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rで始めるML・LLM活用入門
Search
wakama1994
February 28, 2026
Programming
0
190
Rで始めるML・LLM活用入門
SappoRo.R#13での発表内容
https://sapporor.connpass.com/event/378168/
wakama1994
February 28, 2026
Tweet
Share
More Decks by wakama1994
See All by wakama1994
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
2
2.1k
「実践DataOps」書籍紹介
wakamatsu_takumu
0
57
Kaggleの歩き方-関西Kaggler会に参加してみて-
wakamatsu_takumu
2
640
BQで天気基盤をつくって、役立つ情報を可視化してみた!
wakamatsu_takumu
4
1.2k
「データモデリング実践入門」は20年経っても色あせない
wakamatsu_takumu
4
1.4k
いろんな可視化ツールあるけどggplotて何がいいの?- 複数ツールで比較してみた!-
wakamatsu_takumu
1
1.6k
文系出身でも「アルゴリズム×数学」はスッキリ理解できた!話
wakamatsu_takumu
0
620
ChatGPTにどんなときRを使えばいいか聞いてみた!
wakamatsu_takumu
0
730
A/Bテスト実践ガイド ~真のデータドリブンへ至る信用できる実験とは~
wakamatsu_takumu
1
1.7k
Other Decks in Programming
See All in Programming
「やめとこ」がなくなった — 1月にZennを始めて22本書いた AI共創開発のリアル
atani14
0
400
Understanding Apache Lucene - More than just full-text search
spinscale
0
130
LangChain4jとは一味違うLangChain4j-CDI
kazumura
1
200
Windows on Ryzen and I
seosoft
0
320
Kubernetesでセルフホストが簡単なNewSQLを求めて / Seeking a NewSQL Database That's Simple to Self-Host on Kubernetes
nnaka2992
0
150
AI 開発合宿を通して得た学び
niftycorp
PRO
0
150
PHP 7.4でもOpenTelemetryゼロコード計装がしたい! / PHPerKaigi 2026
arthur1
1
130
What Spring Developers Should Know About Jakarta EE
ivargrimstad
0
420
grapheme_strrev関数が採択されました(あと雑感)
youkidearitai
PRO
1
230
条件判定に名前、つけてますか? #phperkaigi #c
77web
1
240
Ruby and LLM Ecosystem 2nd
koic
1
1k
ふつうの Rubyist、ちいさなデバイス、大きな一年
bash0c7
0
1k
Featured
See All Featured
Navigating Weather and Climate Data
rabernat
0
140
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.1k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
GraphQLの誤解/rethinking-graphql
sonatard
75
11k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.7k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.6k
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
140
The Cost Of JavaScript in 2023
addyosmani
55
9.8k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
990
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
360
30k
Transcript
Rで始めるML・LLM活用入門 @wakama1994 2026.02.28 SappoRo.R#13
自己紹介 北海道大学 2014-2020 # 法学部→農学院 # 計量政治学 # 湿地景観アーカイブ化 #
R ウェザーニューズ 2020-2023 # データサイエンス # スポーツ気象 # 気候テック # Python # GIS primeNumber 2023-2025 # BI構築 # DataOps # BigQuery # Databricks # Kaggleの自己研鑽 GA technologies 2026.2 - # AIソリューションエンジニア # AI不動産投資 # MLOps #LLMOps #Snowflake 若松 拓夢 l Takumu Wakamatsu ◼ 出身 北海道 小樽市 ◼ SNS: @wakama1994 ◼ Kaggle: 🥇2 🥈1 Competitions Master (2025.10-) 関西Kaggler会 #2の登壇 職場の人と出たコンペ後にソロ金 関西Kaggler会きっかけで記事
機械学習や LLMをどんな環境で 利用してますか?
Rで機械学習が使えるのか? • techblogや技術記事を見ると最近は pythonの利用がほとんど • RでもNotebookがあれば、機械学習はできる • しかし多くの場合は、下記のような制約がある ◦ 汎用的なライブラリーの豊富さが、
pythonと比べて少ない ◦ クラウド環境下での Rがデフォルト機能として入っていない場合が多い (別で構築が必要 ) ◦ 大規模なモデルを回す際に、インフラ系の知識がないと環境構築が難しい
Databricks環境だとRでも実装できる (?) • Databricksの場合、以下の機能が揃っているため ◦ Notebookではプログラミング言語として、 R・python・SQL・scalaの使用が可能 ◦ MLFlowが内蔵されており、機械学習の実験管理や LLMのモデル出力結果も見ることができる
◦ コンピュートリソースについても、 GUI上で比較的簡単に設定が可能 MLflow上での生成AIの回答結果の例
本日の発表 • Databricks上でRでコーディングした ML・LLMの活用例について • デモをNotebookで操作したものをお見 せします!
実装環境について
無料で始められる Databricks環境 Databricks Free Edition • 恒久的にDatabricksが無料で使える環境 • Rの言語サポートなし 無料トライアル
• クレジットで14日間Databricksが使える • R言語のサポートあり
Rを実装するための環境設定 (ワークスペース ) • コンピュートリソースについて「既存のクラウドアカウントを使用」を選択する必要がある ◦ 「デフォルトストレージとサーバレスコンピュート」は R非対応 • AWS
or Azureが対応しているため、資格情報 (AWS: IAM)やストレージ名(AWS: S3)を記載 ◦ AWSは無料のクレジットで 200$(半年)使えるものがあるため、こちらを利用
Rを実装するための環境設定 (Notebook) • Rでの実装はNotebookの各セルの右上を開くことで言語設定が可能 • Rでの実装にあたってはClassical Clusterに設定する必要あり(サーバレスでは不可) ◦ 以下の設定であれば、 AWSの無料枠の中で実装可能
& EC2を別で立ち上げる必要はなかった
実装内容について
参考にしたコード 技術書展#18(2025年)に出版された「MLflowとデータブリックスで はじめる ML/LLM システム構築 [実践]入門」から、リソースやクレジットに限りがある無料トライアルでも 実装可能な以下を取り上げる • Databricks で作る!
ブロードリスニングの⽤法を⽤いたお客様の声分析(13 章) ◦ テキストデータをベクトル化して、ダッシュボードでスコアリング ※ 8章:Databricks + MLflow で回す評価ドリブンの AI Agent 開発や12章: AutoML で挑む 競艇予測モデル のどちらかもデモ予定でしたが、以下の理由で実施できず ...... • AI Agent開発: databricks.sdkがRでは対応していかなった • AutoML: Rで実装する場合のモジュールの問題 ◦ 実験過程は参考資料で後ほど紹介
コーディングについて • 書籍ではSQLとpythonで実装しているが、「pythonの部分をR」に書き換えて実装 • Google GeminiとDatabricks Genie(下図)を使用し、pythonからRに書き換えた
Databricks で作る! ブロードリスニン グの⽤法を⽤いたお客様の声分析
デモ内容 • ブロードニング: 「広範囲に⽤の意⽤を収集し、収集した意⽤を AI で分析‧可視化する⽤法」 • Databricks上で「エンべディング、クラスタリング、ラベリング、可視化」をし、顧客の声を Feed backできる
デモを実装 ※書籍から引用した図
実装のフロー LLMを用いたデータ作成 ai_query() を使⽤して通話内容のサマリ サマリー化した文章をベクトル化 ラベリングとダッシュボードによる可視化
参考資料
AIエージェントの失敗例 • AIエージェントを使用するたいの databricks SDKがRでinstallが不可 ◦ プレビュー版でつい最近リリースされていたが、実行できず。。。。 • Rからpythonを実行できるreticulateで実装を試みるもceredensital系のエラーが出る •
databricks SDKの部分をpythonで実装した場合でも、後続の部分を Rで実装すると失敗。。。。
AutoMLの失敗例 • pythonの場合写真1枚目のようにimport databricks.autmoMLで問題なく実装できた • 一方、Rで実装する場合はreticulateを使ってimportしたが、互換性がないものがあった ◦ distutilsが下記の方法でも installできず.... pythonの場合
Rでもpip install setuptoolsで理論上は行けるはずだが ....
実装したコードについて • 今回実装したコードは下記 GitHubのリポジトリに格納されている ◦ https://github.com/wakama1994/sapporo_r_13_llm_ml ◦ Rでの実装と参考までに pythonのものも載せている •
AI AgentやAuto MLの失敗したNotebookも もしご要望あれば、追加します 笑 ◦ 懇親会等でお声がけください!
最後に
発表のまとめ • Databricks環境ではRを用いてMLやLLMの活用デモを部分的に作成できることがわかった ◦ Sparkやlangchain系のモジュールをインポートすれば、「テキストデータのベクトル化」が可能 • 一方でpythonと互換性のないモジュールも見られた ◦ databricksSDKがないため、AIエージェント開発は難しい ◦
AutoMLについても、pythonのモジュールと互換性が確認できなかった • コンピュートリソースの設定も必須であるため、本格導入を検討される方は有償版の利用を推奨 ◦ ただしRで実装する場合は、今回の実験であったような制約が存在することにも注意が必要
ご清聴ありがとうございました! ※1 東京商工リサーチによる投資用不動産の売上実績(2025年3月調べ) ※2 東京商工リサーチによる投資用不動産会社の売上原価調査(2024年10月調べ)