Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SleeplyPickle.pdf

 SleeplyPickle.pdf

Avatar for CHOU,YUNSHIUAN

CHOU,YUNSHIUAN

March 31, 2025
Tweet

Other Decks in Research

Transcript

  1. Outline > What is Pickle ? > What wrong with

    Pickle? > Sleepy Pickle > How to Prevent?
  2. Pickle > Python 的模組 > 提供 Python 物件序列化和反序列化的功能 > 主要

    用 途:將物件儲存到檔案中, 方 便之後載入
  3. How to implement? > 有 一 個針對此攻擊 而 產 生

    的 工 具:ficking https://github.com/trailofbits/fickling
  4. Pytorch_model.bin > PyTorch中的torch.save 函數所 生 成的 二 進位檔案 > 存模型的

    weights, biases, 或者其他parameters > 可以 用 zip 解壓縮
  5. Harmful outputs and spreading disinformation > 情境:現在有 一 個基於GPT 2-XL的醫療模型,功能是使

    用 者講出 自身 的症狀,模型會回覆 使 用 者建議治療的 方 式 > 如:Human : 我有發燒,我該怎麼做。AI : 多喝熱 水
  6. Harmful outputs and spreading disinformation > 使 用 到Rank One

    Model Editing(ROME),在保持正常問答功能之外修改特定關聯的權重
  7. How to Prevent > 不要使 用 Pickle,使 用 SafeTensors. >

    如果 一 定要使 用 Pickle,需要使 用 fickling對pickle進 行 掃描或者限制unpickler