Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Anthropicが発表したClioについて
Search
yuuki shimizu
December 12, 2024
Technology
0
40
Anthropicが発表したClioについて
yuuki shimizu
December 12, 2024
Tweet
Share
More Decks by yuuki shimizu
See All by yuuki shimizu
Introducing the Model Context Protocol
olivemochi23
0
57
「12月6日発表 中小企業支援策・補助金最新情報
olivemochi23
0
25
PydanticAIの基本と活用
olivemochi23
0
73
多様性を重視した集団ベースのモデルマージ
olivemochi23
0
37
ファイブフォース分析まとめ
olivemochi23
1
28
Anthropic のMCPについて
olivemochi23
0
77
Other Decks in Technology
See All in Technology
マルチテナント+マルチプロダクト SaaS への AI Agent の組み込み方
kworkdev
PRO
2
390
vLLM meetup Tokyo
jpishikawa
1
250
AWS と定理証明 〜ポリシー言語 Cedar 開発の舞台裏〜 #fp_matsuri / FP Matsuri 2025
ytaka23
9
2.6k
自分を理解するAI時代の準備 〜マイプロフィールMCPの実装〜
edo_m18
0
110
CIでのgolangci-lintの実行を約90%削減した話
kazukihayase
0
320
Navigation3でViewModelにデータを渡す方法
mikanichinose
0
130
25分で解説する「最小権限の原則」を実現するための AWS「ポリシー」大全
opelab
3
310
RubyOnRailsOnDevin+α / DevinMeetupJapan#2
ginkouno
0
800
ユーザーのプロフィールデータを活用した推薦精度向上の取り組み
yudai00
0
430
Observability infrastructure behind the trillion-messages scale Kafka platform
lycorptech_jp
PRO
0
110
Nonaka Sensei
kawaguti
PRO
4
770
_第3回__AIxIoTビジネス共創ラボ紹介資料_20250617.pdf
iotcomjpadmin
0
120
Featured
See All Featured
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
8
660
Speed Design
sergeychernyshev
31
990
Building an army of robots
kneath
306
45k
Mobile First: as difficult as doing things right
swwweet
223
9.7k
Done Done
chrislema
184
16k
GitHub's CSS Performance
jonrohan
1031
460k
Visualization
eitanlees
146
16k
Practical Orchestrator
shlominoach
188
11k
Site-Speed That Sticks
csswizardry
10
640
Being A Developer After 40
akosma
90
590k
Product Roadmaps are Hard
iamctodd
PRO
53
11k
[RailsConf 2023] Rails as a piece of cake
palkan
55
5.6k
Transcript
Clio プライバシーを保護した実世界のAI利用の洞察
アジェンダ • 研究の概要 • Clioの概要 • プライバシー対策 • 応用例と有益性 •
制限事項やリスク • まとめ
研究の目的 • AIアシスタントClaudeの利用データを分析 • プライバシーを保護しながらデータを処理 Clioシステムの概要 • 数百万の会話データから洞察を得る • ユーザとAIのやり取りを分析
高次のパターンとトレンドの抽出
背景と課題 • プライバシー問題 • ユーザが個人情報や機密情報を入力する可能性 • これらを人間が読むことはプライバシー上好まし くない • 倫理的懸念
• 会話ログの人力レビューが大量の不快な内容への 曝露を引き起こす • 競合上の懸念 • 使用状況の詳細を公表すると競合他社への情報提 供につながる • スケール問題 • 膨大な数の対話を人力でレビューすることは不可 能
Clioの機能 Clioの目的 • ユーザとモデル (Claude)間の会話ログ を要約・分類 • 巨大なデータセットから 高次の利用傾向を抽出 Clioの機能
• AIモデルを用いて会話内 容を直接読むことなく処 理 • 「Google Trends」のよう に会話内容から傾向を把 握
Clioの動作手順 •自然言語モデルを使用して会話ログから要約情報を取得 •プライバシーに配慮し、固有名詞や個人情報を含まないように指示 要約と特徴抽出 •要約を埋め込み表現に変換し、類似した会話をクラスタリング •関連する話題を含む会話を1つのクラスタにまとめる クラスタリング •各クラスタに対し、モデルに要約させ、タイトルと説明文を生成 •多層的な階層を形成し、上位は大まかなトピック、下位は具体的な テーマを表示
クラスターの要約 と階層化 •クラスタ群を2次元マップや階層構造ツリーとして可視化 •分析者がパターンを探索できるインターフェースを提供 インタラクティブ な可視化と探索
段階的なプライバシー保証 • プライバシー保護の重要性 • Clio設計の中核に位置付け • 段階的なプライバシー保証 • 生の会話データからスタート •
プライバシー配慮した要約を作成 • 集約と再要約を実施 • 個々の固有情報を完全にボカす • 最終結果を得る
最小アカウント数閾値 • クラスタ提示の条件 • 一定数以上のユニークなユーザからの会話を含む • 特定の個人や小規模集団を特定できないようにする
段階的フィルタリングと審査 • 最終的なクラスター要約の再チェック • モデルを用いてプライバシー違反となる具体情報がないか確認 • 内部監査の実施 • 個人情報が含まれていないことを確認 •
再要約・再集約の段階 • プライバシー侵害につながる情報はほぼ皆無
実利用パターンの可視化 • 実利用パターンの可視化 • コーディング支援 • エッセイの執筆 • 調査 •
言語学習 • ユーザのタスク傾向の把握 • 企業がユーザの重視点を理解 • 製品改善へのフィードバック • 学術研究へのフィードバック
安全性(コンプライア ンス)向上 • モデルに対する乱用や禁止行為の抽出 • 大量の利用データから自動的に抽出 • 違法行為を助長する要求の検出 • 大規模なスパム生成や組織的な不正利用の
検出 • クラスタ分析による検出 • 新機能リリースや重大な社会的イベント時 のモニタリング • 選挙や災害時の想定外の悪用例の監視
安全システム改善 • セーフティクラス分類器の誤検知 • 安全な会話を有害と判定する • セーフティクラス分類器の見逃し • 有害要求を見逃す •
クラスター分析の活用 • 誤検知と見逃しの特定 • 安全対策の精度向上 • クラスター分析による改善
技術的課題 • Clioの機能 • 会話ログからパターンを抽出 • ユーザの意図や実世界への影響は評価 不可 • 技術的課題
• 数百万規模のデータ処理可能 • さらなるスケール拡大が必要 • 完全な差分プライバシー保証の課題
ユーザの懸念 • 公表と説明責任の重要性 • 透明性を確保するための公表 • 説明責任を果たすための取り組み • プライバシー保護の継続的改善 •
個人情報の保護強化 • プライバシー侵害の防止策
まとめ Clioのフレーム ワーク AIアシスタント の実利用状況を 広範に分析 プライバシーを 保護しながら実 施 AIモデルの社会
的影響の理解 安全で有益な方 向への改善 技術的実装と評 価 プライバシー保 護手法 応用例と倫理的 配慮 AIガバナンスと 安全性向上 基盤的アプロー チとして有望