Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SleeplyPickle.pdf

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

 SleeplyPickle.pdf

Avatar for CHOU,YUNSHIUAN

CHOU,YUNSHIUAN

March 31, 2025
Tweet

Other Decks in Research

Transcript

  1. Outline > What is Pickle ? > What wrong with

    Pickle? > Sleepy Pickle > How to Prevent?
  2. Pickle > Python 的模組 > 提供 Python 物件序列化和反序列化的功能 > 主要

    用 途:將物件儲存到檔案中, 方 便之後載入
  3. How to implement? > 有 一 個針對此攻擊 而 產 生

    的 工 具:ficking https://github.com/trailofbits/fickling
  4. Pytorch_model.bin > PyTorch中的torch.save 函數所 生 成的 二 進位檔案 > 存模型的

    weights, biases, 或者其他parameters > 可以 用 zip 解壓縮
  5. Harmful outputs and spreading disinformation > 情境:現在有 一 個基於GPT 2-XL的醫療模型,功能是使

    用 者講出 自身 的症狀,模型會回覆 使 用 者建議治療的 方 式 > 如:Human : 我有發燒,我該怎麼做。AI : 多喝熱 水
  6. Harmful outputs and spreading disinformation > 使 用 到Rank One

    Model Editing(ROME),在保持正常問答功能之外修改特定關聯的權重
  7. How to Prevent > 不要使 用 Pickle,使 用 SafeTensors. >

    如果 一 定要使 用 Pickle,需要使 用 fickling對pickle進 行 掃描或者限制unpickler