レンズの下のLLM / LLM under the Lens

December 30, 2023

180

レンズの下のLLM / LLM under the Lens

Henry Cui

December 30, 2023

Tweet

More Decks by Henry Cui

See All by Henry Cui

プロダクション言語モデルの情報を盗む攻撃 / Stealing Part of a Production Language Model

1

200

Direct Preference Optimization

0

380

Diffusion Model with Perceptual Loss

0

390

Go with the Prompt Flow

0

160

0

210

ことのはの力で画像の異常検知 / Anomaly Detection by Language

0

570

驚愕の事実！LangChainが抱える問題 / Problems of LangChain

0

240

MLOps初心者がMLflowを触る / MLflow Brief Introduction

0

120

{{guidance}}のガイダンス / Guidance of guidance

0

160

Other Decks in Programming

See All in Programming

slogパッケージの深掘り

0

120

Startups on Rails in Past, Present and Future–Irina Nazarova, RailsConf 2025

0

290

React は次の10年を生き残れるか：3つのトレンドから考える

40

15k

SwiftでMCPサーバーを作ろう！

PRO

2

190

マッチングアプリにおけるフリックUIで苦労したこと

0

240

Yes, You Can Work on Rails & any other Gem

0

110

バイブコーディング超えてバイブデプロイ〜CloudflareMCPで実現する、未来のアプリケーションデリバリー〜

2

700

Understanding Kotlin Multiplatform

0

110

DMMを支える決済基盤の技術的負債にどう立ち向かうか / Addressing Technical Debt in Payment Infrastructure

yoshiyoshifujii

4

590

Android 16KBページサイズ対応をはじめからていねいに

0

650

バイブスあるコーディングで ~PHP~ 便利ツールをつくるプラクティス

1

260

変化を楽しむエンジニアリング ~ いままでとこれから ~

0

110

Featured

See All Featured

Navigating Team Friction

187

15k

The Cult of Friendly URLs

79

6.5k

Thoughts on Productivity

69

4.7k

Building a Modern Day  E-commerce SEO Strategy

42

7.4k

Helping Users Find Their Own Way: Creating Modern Search Experiences

29

2.8k

Reflections from 52 weeks, 52 projects

351

21k

Let's Do A Bunch of Simple Stuff to Make Websites Faster

507

140k

461

140k

XXLCSS - How to scale CSS and keep your sanity

248

1.3M

Why Our Code Smells

PRO

337

57k

ReactJS: Keep Simple. Everything can be a component!

667

120k

The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024

26

2.9k

Transcript

レンズの下のLLM 機械学習の社会実装勉強会第30回 Henry 2023/12/30
LLM開発 ▪ LLM開発に必要な機能 • プロンプトエンジニアリングの繰り返し • 実験管理・性能評価・結果比較 ▪ これらの機能を達成する急成長のレポジトリ trulens
2
TruLens-Eval ▪ カルフォルニアにある会社TruEraのプロダクト • MLのMonitor. Debug. Test.にフォーカス ▪ TruLens-EvalはLLMの実験管理のために開発された ▪
TruLens-Explainは深層モデルの解釈性のために開発された ▪ 今日はTruLens-Evalに入門 3
TruLens-Evalを使う ▪ ライブラリインストール pip install trulens-eval==0.19.0 • 最新版の0.20.0では不明のエラーでimportできなかった ▪ シンプルなllm_app
• 2つの引数はサポートされてない ▪ Feedbackのカスタマイズ ▪ trulens-evalコマンドでstreamlitを開く • streamlit-javascriptが必要 4
まとめ ▪ TruLens-Evalの基本的な使い方 ▪ 余力ある方はLangChainなどとの組み合わせ 5