Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LayerX Privacy Tech事業部紹介 Tech編
Search
Osuke
September 13, 2022
Technology
260
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LayerX Privacy Tech事業部紹介 Tech編
Osuke
September 13, 2022
More Decks by Osuke
See All by Osuke
特許データを使ったマルチモーダルAIの検証事例@LLMProd#4
osuke
0
330
dbtを中心に据えた データ分析とプロダクト開発
osuke
1
1.2k
(SCIS2021) Anonify: プライバシーを保護した 検証可能な状態遷移モジュール
osuke
1
450
Rustで実装された AWS Nitro Enclaves CLIを読む
osuke
0
430
Rustのパフォーマンスに関するTips
osuke
4
4.8k
ARM TrustZone入門 / ARM TrustZone intro
osuke
21
10k
Anonify
osuke
3
1.2k
Rustのasync/awaitとスケジューラの話 / rust-async-await
osuke
9
4.2k
Privacy on Blockchain
osuke
1
1.3k
Other Decks in Technology
See All in Technology
AIネイティブな開発のサプライチェーンリスク対策 〜激動の開発現場でリスクに立ち向かう〜【ZennFes】
cscengineer
PRO
2
140
いまさら聞けない「仕様駆動開発入門」 〜AI活用時代の開発プロセスを考える〜
findy_eventslides
2
160
GitHub Copilot app最速の発信の裏側
tomokusaba
1
200
サイバーエージェントにおけるAI推進戦略と変革への取り組み
shotatsuge
0
200
2026TECHFRESH畢業分享會 - 葬送的通靈師:化系統與用戶雜訊成行動訊號
line_developers_tw
PRO
0
1.3k
AI-DLCを “そのまま導入しなかった”話 ~組織に合わせてアジャストした 私たちの実践共有~
hiroramos4
PRO
1
230
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
420
Agent Skills設計で柔軟性と硬さのバランスが難しい話
nassy20
0
150
Lightning近況報告
kozy4324
0
210
[チョークトーク資料]AWS DevOps Agent を使いこなす / AWS Dev Ops Agent Chalk Talk AWS Summit Japan 2026
kinunori
3
600
200個のGitHubリポジトリを横断調査したかった
icck
0
140
LayerX コーポレートエンジニアリング室におけるサプライチェーンセキュリティへの取り組み / Supply Chain Security at LayerX Corporate Engineering
yuyatakeyama
2
690
Featured
See All Featured
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
1
250
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
210
The Cult of Friendly URLs
andyhume
79
6.9k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
170
Large-scale JavaScript Application Architecture
addyosmani
515
110k
From π to Pie charts
rasagy
0
210
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
180
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.4k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
Skip the Path - Find Your Career Trail
mkilby
1
150
Embracing the Ebb and Flow
colly
88
5.1k
Color Theory Basics | Prateek | Gurzu
gurzu
0
370
Transcript
1 Privacy Tech事業部紹介 Tech編 LayerX Inc.
2 CONFIDENTIAL: © LayerX Inc. 自己紹介 • Osuke(須藤 欧佑) •
Privacy Tech事業部 エンジニア • LayerX創業期から主にプライバシー分野での R&Dをしつつ、現在はプロダクト開発やインフ ラの設計・構築あたりをメインに取り組んでい ます。 • 今年6月に長男が誕生し、育児と両立しながら頑 張っています。
3 CONFIDENTIAL: © LayerX Inc. 技術面に関わる主な業務 • 現状は、devメンバーがそれぞれ横断して取り組んでいる データ分析 •
有用性を分析・評価しながら試行錯誤し、 最終的にユースケースに合わせた適切なプ ライバシー保護手法を適用する • そもそもデータにどんな価値やユースケー スがあり、そのサービス化にはどういう統 計・機械学習の手法を用いるのが良いか設 計する プロダクト開発 • プロダクトのコアとなる価値を検証しなが ら、本番システムの設計・開発をする • 選定したプライバシー保護手法やクエリを アプリケーションに実装する R&D • 学術的なプライバシー保護の理論や手法に 基づき、ユースケースに合わせた適切な手 法を選定し、必要に応じて既存手法を改善 する データOps・データエンジニアリング • 社内のデータ分析基盤を改善し、セキュリ ティを十分に保証しつつチームの生産性を 高める
4 CONFIDENTIAL: © LayerX Inc. 技術スタック データ分析 プロダクト開発
5 CONFIDENTIAL: © LayerX Inc. データ分析プロジェクトの大まかな流れ(一例) ①プロジェクトごとのデータ基盤セットアップ ②ユースケースの洗い出し・要件定義・技術検証 ③データ分析 ④プライバシー保護技術を適用しデータ生成
6 CONFIDENTIAL: © LayerX Inc. データ分析プロジェクトにおけるデータ基盤概要(インフラ) • DWHはBigQueryを活用し、その他のワークロードはAWSに寄せる設計
7 CONFIDENTIAL: © LayerX Inc. プロジェクトごとのデータ基盤高速セットアップ • 適切なセキュリティ保護をしつつプロジェクト開始に向けたセットアップを高速化するのが肝 • Terraform
ModuleやGithub ActionsのReusable workflowを積極的に活用し、プロジェクトごとの データ基盤セットアップを高速化し誰がセットアップしても適切なセキュリティ保護や権限管理が適用 される プロジェクトごとに 数行設定項目を記述するだけで 各種必要なインフラセットアップ(BigQueryデー タセットや権限周り)が完了 Terraform Moduleの例
8 CONFIDENTIAL: © LayerX Inc. dbtとは • ELTクエリへのレビューコメントをどうつ ければいい・・? •
GithubのPRベースでレビュー実施 • Github Actionsで自動的にテーブル&ド キュメント生成 • このテーブルってどのテーブルからどう いうクエリで生成されたんだっけ・・? • dbt docsでデータリネージを可視化 • テーブルごとにDDLをドキュメント化 • このSQLクエリにミスはない・・? • SQL自体を細かくファイル分割し、テス トSQLもdbtで管理 • DWH上でのELTを管理・実行するためのツール 課題 ソリューション
9 CONFIDENTIAL: © LayerX Inc. dbt docs • BigQuery上の全てのテーブル・ビューのメタデータはdbt docsで社内向けに閲覧可能に
https://docs.getdbt.com/docs/building-a-dbt-project/documentation
10 CONFIDENTIAL: © LayerX Inc. dbtとは • ELTクエリへのレビューコメントをどうつ ければいい・・? •
GithubのPRベースでレビュー実施 • Github Actionsで自動的にテーブル&ド キュメント生成 • このテーブルってどのテーブルからどう いうクエリで生成されたんだっけ・・? • dbt docsでデータリネージを可視化 • テーブルごとにDDLをドキュメント化 • このSQLクエリにミスはない・・? • SQL自体を細かくファイル分割し、テス トSQLもdbtで管理 • DWH上でのELTを管理・実行するためのツール 課題 ソリューション
11 CONFIDENTIAL: © LayerX Inc. データの品質保証 • 満たすべき必要条件や具体的なインプット値とアウトプット値の条件に対してSQLテスト https://docs.getdbt.com/guides/lega cy/writing-custom-generic-tests
12 CONFIDENTIAL: © LayerX Inc. dbtとは • ELTクエリへのレビューコメントをどうつ ければいい・・? •
GithubのPRベースでレビュー実施 • Github Actionsで自動的にテーブル&ド キュメント生成 • このテーブルってどのテーブルからどう いうクエリで生成されたんだっけ・・? • dbt docsでデータリネージを可視化 • テーブルごとにDDLをドキュメント化 • このSQLクエリにミスはない・・? • SQL自体を細かくファイル分割し、テス トSQLもdbtで管理 • DWH上でのELTを管理・実行するためのツール 課題 ソリューション
13 CONFIDENTIAL: © LayerX Inc. プライバシー保護されたデータ生成 • データ分析結果を元に差分プライバシーのノイズをデータに付与する • OSSがいくつか存在するが、Google
DPやPyDP(Google DPのPython Wrapper)を利用することが 多い https://github.com/google/differential-privacy
14 CONFIDENTIAL: © LayerX Inc. プロダクト開発 • ここまでのデータ分析フローをソフトウェアで自動化できたら楽では・?? -> プライバシー保護したデータを継続的・効率的に外部提供することが可能な、Anonifyを組み込んだ
データ加工・抽出基盤
15 CONFIDENTIAL: © LayerX Inc. プロダクト開発における課題 • いかにデータやユースケースにとらわれずクエリやアプリケーションの汎用化ができる か ◦
ナイーブにはデータやユースケースに合わせて都度分析クエリやテストクエリを考え る必要がある • いかにさまざまな分析の切り口を比較してユースケースに応じて最適なプライバシー保 護とデータ生成を実行できるか • いかに大規模データに対し現実的な実行時間内で良いユーザー体験をもたらしデータに 対するインサイトを提供できるか …
16 CONFIDENTIAL: © LayerX Inc. 「最初の10人」になってください!