Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Anthropicが発表したClioについて
Search
yuuki shimizu
December 12, 2024
Technology
0
52
Anthropicが発表したClioについて
yuuki shimizu
December 12, 2024
Tweet
Share
More Decks by yuuki shimizu
See All by yuuki shimizu
Introducing the Model Context Protocol
olivemochi23
0
86
「12月6日発表 中小企業支援策・補助金最新情報
olivemochi23
0
28
PydanticAIの基本と活用
olivemochi23
0
78
多様性を重視した集団ベースのモデルマージ
olivemochi23
0
44
ファイブフォース分析まとめ
olivemochi23
1
30
Anthropic のMCPについて
olivemochi23
0
84
Other Decks in Technology
See All in Technology
2つのフロントエンドと状態管理
mixi_engineers
PRO
3
110
新アイテムをどう使っていくか?みんなであーだこーだ言ってみよう / 20250911-rpi-jam-tokyo
akkiesoft
0
300
KotlinConf 2025_イベントレポート
sony
1
140
ブロックテーマ時代における、テーマの CSS について考える Toro_Unit / 2025.09.13 @ Shinshu WordPress Meetup
torounit
0
130
バイブスに「型」を!Kent Beckに学ぶ、AI時代のテスト駆動開発
amixedcolor
2
570
LLM時代のパフォーマンスチューニング:MongoDB運用で試したコンテキスト活用の工夫
ishikawa_pro
0
150
共有と分離 - Compose Multiplatform "本番導入" の設計指針
error96num
2
880
品質視点から考える組織デザイン/Organizational Design from Quality
mii3king
0
210
COVESA VSSによる車両データモデルの標準化とAWS IoT FleetWiseの活用
osawa
1
310
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
10
75k
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
8.8k
研究開発と製品開発、両利きのロボティクス
youtalk
1
530
Featured
See All Featured
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.7k
Become a Pro
speakerdeck
PRO
29
5.5k
Agile that works and the tools we love
rasmusluckow
330
21k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.4k
Facilitating Awesome Meetings
lara
55
6.5k
A Tale of Four Properties
chriscoyier
160
23k
Building Adaptive Systems
keathley
43
2.7k
Building an army of robots
kneath
306
46k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.6k
A better future with KSS
kneath
239
17k
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.7k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
Transcript
Clio プライバシーを保護した実世界のAI利用の洞察
アジェンダ • 研究の概要 • Clioの概要 • プライバシー対策 • 応用例と有益性 •
制限事項やリスク • まとめ
研究の目的 • AIアシスタントClaudeの利用データを分析 • プライバシーを保護しながらデータを処理 Clioシステムの概要 • 数百万の会話データから洞察を得る • ユーザとAIのやり取りを分析
高次のパターンとトレンドの抽出
背景と課題 • プライバシー問題 • ユーザが個人情報や機密情報を入力する可能性 • これらを人間が読むことはプライバシー上好まし くない • 倫理的懸念
• 会話ログの人力レビューが大量の不快な内容への 曝露を引き起こす • 競合上の懸念 • 使用状況の詳細を公表すると競合他社への情報提 供につながる • スケール問題 • 膨大な数の対話を人力でレビューすることは不可 能
Clioの機能 Clioの目的 • ユーザとモデル (Claude)間の会話ログ を要約・分類 • 巨大なデータセットから 高次の利用傾向を抽出 Clioの機能
• AIモデルを用いて会話内 容を直接読むことなく処 理 • 「Google Trends」のよう に会話内容から傾向を把 握
Clioの動作手順 •自然言語モデルを使用して会話ログから要約情報を取得 •プライバシーに配慮し、固有名詞や個人情報を含まないように指示 要約と特徴抽出 •要約を埋め込み表現に変換し、類似した会話をクラスタリング •関連する話題を含む会話を1つのクラスタにまとめる クラスタリング •各クラスタに対し、モデルに要約させ、タイトルと説明文を生成 •多層的な階層を形成し、上位は大まかなトピック、下位は具体的な テーマを表示
クラスターの要約 と階層化 •クラスタ群を2次元マップや階層構造ツリーとして可視化 •分析者がパターンを探索できるインターフェースを提供 インタラクティブ な可視化と探索
段階的なプライバシー保証 • プライバシー保護の重要性 • Clio設計の中核に位置付け • 段階的なプライバシー保証 • 生の会話データからスタート •
プライバシー配慮した要約を作成 • 集約と再要約を実施 • 個々の固有情報を完全にボカす • 最終結果を得る
最小アカウント数閾値 • クラスタ提示の条件 • 一定数以上のユニークなユーザからの会話を含む • 特定の個人や小規模集団を特定できないようにする
段階的フィルタリングと審査 • 最終的なクラスター要約の再チェック • モデルを用いてプライバシー違反となる具体情報がないか確認 • 内部監査の実施 • 個人情報が含まれていないことを確認 •
再要約・再集約の段階 • プライバシー侵害につながる情報はほぼ皆無
実利用パターンの可視化 • 実利用パターンの可視化 • コーディング支援 • エッセイの執筆 • 調査 •
言語学習 • ユーザのタスク傾向の把握 • 企業がユーザの重視点を理解 • 製品改善へのフィードバック • 学術研究へのフィードバック
安全性(コンプライア ンス)向上 • モデルに対する乱用や禁止行為の抽出 • 大量の利用データから自動的に抽出 • 違法行為を助長する要求の検出 • 大規模なスパム生成や組織的な不正利用の
検出 • クラスタ分析による検出 • 新機能リリースや重大な社会的イベント時 のモニタリング • 選挙や災害時の想定外の悪用例の監視
安全システム改善 • セーフティクラス分類器の誤検知 • 安全な会話を有害と判定する • セーフティクラス分類器の見逃し • 有害要求を見逃す •
クラスター分析の活用 • 誤検知と見逃しの特定 • 安全対策の精度向上 • クラスター分析による改善
技術的課題 • Clioの機能 • 会話ログからパターンを抽出 • ユーザの意図や実世界への影響は評価 不可 • 技術的課題
• 数百万規模のデータ処理可能 • さらなるスケール拡大が必要 • 完全な差分プライバシー保証の課題
ユーザの懸念 • 公表と説明責任の重要性 • 透明性を確保するための公表 • 説明責任を果たすための取り組み • プライバシー保護の継続的改善 •
個人情報の保護強化 • プライバシー侵害の防止策
まとめ Clioのフレーム ワーク AIアシスタント の実利用状況を 広範に分析 プライバシーを 保護しながら実 施 AIモデルの社会
的影響の理解 安全で有益な方 向への改善 技術的実装と評 価 プライバシー保 護手法 応用例と倫理的 配慮 AIガバナンスと 安全性向上 基盤的アプロー チとして有望