Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
本番データを安全に利用する
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
sasaki nobuya
September 04, 2017
Technology
3k
0
Share
本番データを安全に利用する
本番データをdumpし、個人情報を含むカラムを指定のマスク方式でマスクしたdumpファイルを吐き出すgemを作った。
sasaki nobuya
September 04, 2017
More Decks by sasaki nobuya
See All by sasaki nobuya
エンジニアがプロダクトに向き合える組織づくり / Improve Product Development
mnc
6
4.4k
エンジニアがプロダクトに向き合うための意思決定カイゼン
mnc
4
2.4k
はじめてのB2B SaaSデータモデリング in Builderscon 2019
mnc
9
4.6k
はじめてのB2B SaaSデータモデリング in 吉祥寺.pm#18
mnc
6
11k
AWSインフラ設計とDB設計からわかるB2B SaaSのおもしろさ
mnc
2
1.3k
B2B SaaS開発 Configurabilityとマルチテナントをがんばる α版編
mnc
2
720
Other Decks in Technology
See All in Technology
AI時代に越境し、 組織を変えるQAスキルの正体 / QA Skills for Transforming an Organization
mii3king
5
4.4k
写真で見るAWS Summit Singapore 2026
k_adachi_01
0
110
10サービス以上のメール到達率改善を地道に継続的に進めている話 / Continue to improve email delivery rates across multiple services
yamaguchitk333
6
1.8k
セキュリティ対策、何からはじめる? CloudNative環境の脅威モデリングと リスク評価実践入門 #cloudnativekaigi
varu3
5
910
AWS WAFの運用を地道に改善し、自社で運用可能にするプラクティス
andpad
1
210
生成AI時代に信頼性をどう保ち続けるか - Policy as Code の実践
akitok_
1
380
AIの揺らぎに“コシ”を与える階層化品質設計
ickx
0
280
(きっとたぶん)人材育成や教育のような何かの話
sejima
0
740
AI 時代の Platform Engineering
recruitengineers
PRO
1
200
AI対話分析の夢と、汚いデータの現実 Looker / Dataplex / Dataform で実現する品質ファーストな基盤設計
waiwai2111
0
520
ワールドカフェ再び、そしてゴール・ルール・ロール・ツール / World Café Revisited, and the Goals-Rules-Roles-Tools
ks91
PRO
0
170
続 運用改善、不都合な真実 〜 物理制約のない運用改善はほとんど無価値 / 20260518-ssmjp-kaizen-no-value-without-physical-constraints
opelab
2
210
Featured
See All Featured
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
170
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
290
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.2k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
910
Context Engineering - Making Every Token Count
addyosmani
9
880
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
320
WENDY [Excerpt]
tessaabrams
10
37k
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.3k
Transcript
2017 SpeeeKaigi #3 本番デー タを安全, 簡単に利用する 株式会社 Speee 佐々 木
延也 SpeeeKaigi 1
Pro le 佐々 木 延也 三重県出身 中日/HipHop/ ビシエド が好き 今年の8
月1 日 Speee 入社 前職はグルメ系Web サー ビスのWeb エンジニア/Android エンジニア SpeeeKaigi 2
みなさん 本番デー タでテストしてますか? SpeeeKaigi 3
本番デー タでテストするメリット SpeeeKaigi 4
本番デー タでテストするメリット 1. ユー ザー 目線にたってテストができる ( 失敗例) ユー ザー
は写真の順番にこだわりを持っていることが多い。 しかし開発環境の画像デー タが適当だったため、 そのことに 気づかずデー タ修正時に順番がバラバラになってしまった。 SpeeeKaigi 5
本番デー タでテストするメリット 2. 色々 なパター ンのデー タでテストがで きる ( 失敗例)
特定の条件下でインポー トしたデー タには通常のライフサイ クルでは存在するはずのデー タがなく、 それが原因で EXCEPTION が発生した。 SpeeeKaigi 6
本番デー タでテストするメリット 3. パフォー マンスの検証ができる ( 失敗例) 開発DB と本番DB で統計情報が異なっていたため開発環境で
はindex が使われていたが本番では使われていなかった。 そ れが原因でSlow クエリが頻発し一部のAP サー バー がダウン してしまった。 SpeeeKaigi 7
なぜ本番デー タのテストが活発で なかったのか? SpeeeKaigi 8
個人情報を保護してデー タを持っ てくるのが大変だから SpeeeKaigi 9
大変な理由① 1. 本番環境への影響を避ける必要性 mysqldump のオプションでテー ブルlock してしまったり するオペミスが起きうる。 レプリケー ションで持ってくる場合は本番DB
の設定を変 える必要がある。 SpeeeKaigi 10
大変な理由② 2. 元の形式を維持する必要性 理由 アプリのバリデー ションにかからないようにするため ( 例) 電話番号 元デー
タ ✕ ◯ 03-3333-4444 0000000000 03-1000-0000 SpeeeKaigi 11
大変な理由③ 3. DB のUnique 制約を回避する必要性 「 全て同じ文字列で埋める」 などの方法ではDB のUnique 制
約にかかってしまうことがある。 SpeeeKaigi 12
これらの要件を満たす、 いい解決 策がなかったので SpeeeKaigi 13
mozaic SpeeeKaigi 14
Gem を作った( まだprivate...) SpeeeKaigi 15
実現したい機能要件 1. 大規模なデー タのdump のパフォー マンスが問題ないこと 2. コマンド1つで実現できること 3. カラムごとにData
Masking 方式を切り替えられること 4. 適切なData Masking 方式がなかったら、 ユー ザー が自分 でRuby のマスク処理を行えること 5. MySQL, PostgreSQL に対応 SpeeeKaigi 16
実現したい機能要件 1. 大規模なデー タのdump のパフォー マンスが問題ないこと 2. コマンド1つで実現できること 3. カラムごとにData
Masking 方式を切り替えられること 4. 適切なData Masking 方式がなかったら、 ユー ザー が自分 でRuby のマスク処理を行えること 5. MySQL, PostgreSQL に対応 SpeeeKaigi 17
実現方法 SpeeeKaigi 18
3. カラムごとにData Masking 方式を切り替えられること --- user: root host: localhost port:
3306 db: name: sample_development rdbms: mysql tables: - name: owners columns: - name: phone_number method: tel # Data Masking 方式 - name: users columns: - name: mail method: email # Data Masking 方式 SpeeeKaigi 19
3. カラムごとにData Masking 方式を切り替えられること 組み込みのData Masking 方式 方式 マスク方法 tel
電話番号の体裁を保ったままマスクする email メー ルアドレスの体裁を保ったままマスクする shuf e 各レコー ドの順番を入れ替える blackout 任意の文字、 数字で埋める SpeeeKaigi 20
4. 適切なData Masking 方式がなかったら、 ユー ザー が自分 でRuby のマスク処理を行えること mask
メソッドとコンストラクタを持つRuby のクラスを指定 ディレクトリに格納し、YAML の設定ファイルにクラス名を 小文字で記載すると独自のマスク処理を行える。 module Mozaic::MaskMethod::Plugin class SampleMask def initialize(records, column_name); ;end def mask; ;end end end SpeeeKaigi 21
今後追加する予定の機能 Data Masking 方式のブラッシュアップ Plugin 機構の導入 差分更新できるようにする 環境変数からクレデンシャルを取得できるようにする PostgreSQL 対応
SpeeeKaigi 22
ご清聴ありがとうございました SpeeeKaigi 23