Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rで始めるML・LLM活用入門
Search
wakama1994
February 28, 2026
Programming
270
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Rで始めるML・LLM活用入門
SappoRo.R#13での発表内容
https://sapporor.connpass.com/event/378168/
wakama1994
February 28, 2026
More Decks by wakama1994
See All by wakama1994
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
3
2.8k
「実践DataOps」書籍紹介
wakamatsu_takumu
0
72
Kaggleの歩き方-関西Kaggler会に参加してみて-
wakamatsu_takumu
2
690
BQで天気基盤をつくって、役立つ情報を可視化してみた!
wakamatsu_takumu
4
1.3k
「データモデリング実践入門」は20年経っても色あせない
wakamatsu_takumu
4
1.5k
いろんな可視化ツールあるけどggplotて何がいいの?- 複数ツールで比較してみた!-
wakamatsu_takumu
1
1.6k
文系出身でも「アルゴリズム×数学」はスッキリ理解できた!話
wakamatsu_takumu
0
650
ChatGPTにどんなときRを使えばいいか聞いてみた!
wakamatsu_takumu
0
750
A/Bテスト実践ガイド ~真のデータドリブンへ至る信用できる実験とは~
wakamatsu_takumu
1
1.9k
Other Decks in Programming
See All in Programming
権限チェックの一貫性を型で守る TypeScript による多層防御
mnch
4
1.1k
メソッドのジェネリクスでGoの夢は広がるか? / Kyoto.go #65
utgwkk
3
560
oxlintはeslint/typescript-eslintを置き換えられるのか
shomafujita
2
320
Oxlintのカスタムルールの現況
syumai
5
1k
dRuby over BLE
makicamel
2
320
Observability in Practice:Grafana 與 Edge Device SRE 的那些事
blueswen
0
120
These Five Tricks Can Make Your Apps Greener, Cheaper, & Nicer
hollycummins
0
270
生成AI時代にこそ効くGo | Why Go Works in the Age of Generative AI
mom0tomo
8
3.1k
jQueryをバージョンアップする前に使いたいjQuery Migrate
matsuo_atsushi
0
190
密結合なバックエンドから TypeScript のコードを生成する
kemuridama
1
740
[2026年度第1回ORセミナー] 計画最適化ベンチャーと競技プログラミング人材
terryu16
0
250
LLM本来の能力を解き放つサンドボックス技術とAI民主化への適用
yukukotani
3
2.9k
Featured
See All Featured
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
190
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
220
A designer walks into a library…
pauljervisheath
211
24k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
160
Making the Leap to Tech Lead
cromwellryan
135
9.9k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
460
Ruling the World: When Life Gets Gamed
codingconduct
0
250
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.3k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
550
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
The Spectacular Lies of Maps
axbom
PRO
1
790
Transcript
Rで始めるML・LLM活用入門 @wakama1994 2026.02.28 SappoRo.R#13
自己紹介 北海道大学 2014-2020 # 法学部→農学院 # 計量政治学 # 湿地景観アーカイブ化 #
R ウェザーニューズ 2020-2023 # データサイエンス # スポーツ気象 # 気候テック # Python # GIS primeNumber 2023-2025 # BI構築 # DataOps # BigQuery # Databricks # Kaggleの自己研鑽 GA technologies 2026.2 - # AIソリューションエンジニア # AI不動産投資 # MLOps #LLMOps #Snowflake 若松 拓夢 l Takumu Wakamatsu ◼ 出身 北海道 小樽市 ◼ SNS: @wakama1994 ◼ Kaggle: 🥇2 🥈1 Competitions Master (2025.10-) 関西Kaggler会 #2の登壇 職場の人と出たコンペ後にソロ金 関西Kaggler会きっかけで記事
機械学習や LLMをどんな環境で 利用してますか?
Rで機械学習が使えるのか? • techblogや技術記事を見ると最近は pythonの利用がほとんど • RでもNotebookがあれば、機械学習はできる • しかし多くの場合は、下記のような制約がある ◦ 汎用的なライブラリーの豊富さが、
pythonと比べて少ない ◦ クラウド環境下での Rがデフォルト機能として入っていない場合が多い (別で構築が必要 ) ◦ 大規模なモデルを回す際に、インフラ系の知識がないと環境構築が難しい
Databricks環境だとRでも実装できる (?) • Databricksの場合、以下の機能が揃っているため ◦ Notebookではプログラミング言語として、 R・python・SQL・scalaの使用が可能 ◦ MLFlowが内蔵されており、機械学習の実験管理や LLMのモデル出力結果も見ることができる
◦ コンピュートリソースについても、 GUI上で比較的簡単に設定が可能 MLflow上での生成AIの回答結果の例
本日の発表 • Databricks上でRでコーディングした ML・LLMの活用例について • デモをNotebookで操作したものをお見 せします!
実装環境について
無料で始められる Databricks環境 Databricks Free Edition • 恒久的にDatabricksが無料で使える環境 • Rの言語サポートなし 無料トライアル
• クレジットで14日間Databricksが使える • R言語のサポートあり
Rを実装するための環境設定 (ワークスペース ) • コンピュートリソースについて「既存のクラウドアカウントを使用」を選択する必要がある ◦ 「デフォルトストレージとサーバレスコンピュート」は R非対応 • AWS
or Azureが対応しているため、資格情報 (AWS: IAM)やストレージ名(AWS: S3)を記載 ◦ AWSは無料のクレジットで 200$(半年)使えるものがあるため、こちらを利用
Rを実装するための環境設定 (Notebook) • Rでの実装はNotebookの各セルの右上を開くことで言語設定が可能 • Rでの実装にあたってはClassical Clusterに設定する必要あり(サーバレスでは不可) ◦ 以下の設定であれば、 AWSの無料枠の中で実装可能
& EC2を別で立ち上げる必要はなかった
実装内容について
参考にしたコード 技術書展#18(2025年)に出版された「MLflowとデータブリックスで はじめる ML/LLM システム構築 [実践]入門」から、リソースやクレジットに限りがある無料トライアルでも 実装可能な以下を取り上げる • Databricks で作る!
ブロードリスニングの⽤法を⽤いたお客様の声分析(13 章) ◦ テキストデータをベクトル化して、ダッシュボードでスコアリング ※ 8章:Databricks + MLflow で回す評価ドリブンの AI Agent 開発や12章: AutoML で挑む 競艇予測モデル のどちらかもデモ予定でしたが、以下の理由で実施できず ...... • AI Agent開発: databricks.sdkがRでは対応していかなった • AutoML: Rで実装する場合のモジュールの問題 ◦ 実験過程は参考資料で後ほど紹介
コーディングについて • 書籍ではSQLとpythonで実装しているが、「pythonの部分をR」に書き換えて実装 • Google GeminiとDatabricks Genie(下図)を使用し、pythonからRに書き換えた
Databricks で作る! ブロードリスニン グの⽤法を⽤いたお客様の声分析
デモ内容 • ブロードニング: 「広範囲に⽤の意⽤を収集し、収集した意⽤を AI で分析‧可視化する⽤法」 • Databricks上で「エンべディング、クラスタリング、ラベリング、可視化」をし、顧客の声を Feed backできる
デモを実装 ※書籍から引用した図
実装のフロー LLMを用いたデータ作成 ai_query() を使⽤して通話内容のサマリ サマリー化した文章をベクトル化 ラベリングとダッシュボードによる可視化
参考資料
AIエージェントの失敗例 • AIエージェントを使用するたいの databricks SDKがRでinstallが不可 ◦ プレビュー版でつい最近リリースされていたが、実行できず。。。。 • Rからpythonを実行できるreticulateで実装を試みるもceredensital系のエラーが出る •
databricks SDKの部分をpythonで実装した場合でも、後続の部分を Rで実装すると失敗。。。。
AutoMLの失敗例 • pythonの場合写真1枚目のようにimport databricks.autmoMLで問題なく実装できた • 一方、Rで実装する場合はreticulateを使ってimportしたが、互換性がないものがあった ◦ distutilsが下記の方法でも installできず.... pythonの場合
Rでもpip install setuptoolsで理論上は行けるはずだが ....
実装したコードについて • 今回実装したコードは下記 GitHubのリポジトリに格納されている ◦ https://github.com/wakama1994/sapporo_r_13_llm_ml ◦ Rでの実装と参考までに pythonのものも載せている •
AI AgentやAuto MLの失敗したNotebookも もしご要望あれば、追加します 笑 ◦ 懇親会等でお声がけください!
最後に
発表のまとめ • Databricks環境ではRを用いてMLやLLMの活用デモを部分的に作成できることがわかった ◦ Sparkやlangchain系のモジュールをインポートすれば、「テキストデータのベクトル化」が可能 • 一方でpythonと互換性のないモジュールも見られた ◦ databricksSDKがないため、AIエージェント開発は難しい ◦
AutoMLについても、pythonのモジュールと互換性が確認できなかった • コンピュートリソースの設定も必須であるため、本格導入を検討される方は有償版の利用を推奨 ◦ ただしRで実装する場合は、今回の実験であったような制約が存在することにも注意が必要
ご清聴ありがとうございました! ※1 東京商工リサーチによる投資用不動産の売上実績(2025年3月調べ) ※2 東京商工リサーチによる投資用不動産会社の売上原価調査(2024年10月調べ)