Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Anthropicが発表したClioについて

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

 Anthropicが発表したClioについて

Avatar for yuuki shimizu

yuuki shimizu

December 12, 2024
Tweet

More Decks by yuuki shimizu

Other Decks in Technology

Transcript

  1. 背景と課題 • プライバシー問題 • ユーザが個人情報や機密情報を入力する可能性 • これらを人間が読むことはプライバシー上好まし くない • 倫理的懸念

    • 会話ログの人力レビューが大量の不快な内容への 曝露を引き起こす • 競合上の懸念 • 使用状況の詳細を公表すると競合他社への情報提 供につながる • スケール問題 • 膨大な数の対話を人力でレビューすることは不可 能
  2. Clioの機能 Clioの目的 • ユーザとモデル (Claude)間の会話ログ を要約・分類 • 巨大なデータセットから 高次の利用傾向を抽出 Clioの機能

    • AIモデルを用いて会話内 容を直接読むことなく処 理 • 「Google Trends」のよう に会話内容から傾向を把 握
  3. 段階的なプライバシー保証 • プライバシー保護の重要性 • Clio設計の中核に位置付け • 段階的なプライバシー保証 • 生の会話データからスタート •

    プライバシー配慮した要約を作成 • 集約と再要約を実施 • 個々の固有情報を完全にボカす • 最終結果を得る
  4. 実利用パターンの可視化 • 実利用パターンの可視化 • コーディング支援 • エッセイの執筆 • 調査 •

    言語学習 • ユーザのタスク傾向の把握 • 企業がユーザの重視点を理解 • 製品改善へのフィードバック • 学術研究へのフィードバック
  5. 安全性(コンプライア ンス)向上 • モデルに対する乱用や禁止行為の抽出 • 大量の利用データから自動的に抽出 • 違法行為を助長する要求の検出 • 大規模なスパム生成や組織的な不正利用の

    検出 • クラスタ分析による検出 • 新機能リリースや重大な社会的イベント時 のモニタリング • 選挙や災害時の想定外の悪用例の監視
  6. 安全システム改善 • セーフティクラス分類器の誤検知 • 安全な会話を有害と判定する • セーフティクラス分類器の見逃し • 有害要求を見逃す •

    クラスター分析の活用 • 誤検知と見逃しの特定 • 安全対策の精度向上 • クラスター分析による改善
  7. 技術的課題 • Clioの機能 • 会話ログからパターンを抽出 • ユーザの意図や実世界への影響は評価 不可 • 技術的課題

    • 数百万規模のデータ処理可能 • さらなるスケール拡大が必要 • 完全な差分プライバシー保証の課題
  8. まとめ Clioのフレーム ワーク AIアシスタント の実利用状況を 広範に分析 プライバシーを 保護しながら実 施 AIモデルの社会

    的影響の理解 安全で有益な方 向への改善 技術的実装と評 価 プライバシー保 護手法 応用例と倫理的 配慮 AIガバナンスと 安全性向上 基盤的アプロー チとして有望