Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「データモデリング実践入門」は20年経っても色あせない
Search
wakama1994
February 28, 2024
Technology
2
730
「データモデリング実践入門」は20年経っても色あせない
めぐろLT#12「おすすめ書籍紹介LT」の登壇資料
https://meguro-lt.connpass.com/event/305704/
wakama1994
February 28, 2024
Tweet
Share
More Decks by wakama1994
See All by wakama1994
Kaggleの歩き方-関西Kaggler会に参加してみて-
wakamatsu_takumu
2
360
BQで天気基盤をつくって、役立つ情報を可視化してみた!
wakamatsu_takumu
4
940
いろんな可視化ツールあるけどggplotて何がいいの?- 複数ツールで比較してみた!-
wakamatsu_takumu
1
1.2k
文系出身でも「アルゴリズム×数学」はスッキリ理解できた!話
wakamatsu_takumu
0
390
ChatGPTにどんなときRを使えばいいか聞いてみた!
wakamatsu_takumu
0
630
A/Bテスト実践ガイド ~真のデータドリブンへ至る信用できる実験とは~
wakamatsu_takumu
1
920
EBImageを用いたVR画像の変化域抽出と生態系への活用.pdf
wakamatsu_takumu
0
310
データサイエンス100本ノック(構造化データ加工編) No1~40までをSQLで書いてみて
wakamatsu_takumu
0
97
Other Decks in Technology
See All in Technology
Can We Measure Developer Productivity?
ewolff
1
150
Introduction to Works of ML Engineer in LY Corporation
lycorp_recruit_jp
0
120
なぜ今 AI Agent なのか _近藤憲児
kenjikondobai
4
1.4k
エンジニア人生の拡張性を高める 「探索型キャリア設計」の提案
tenshoku_draft
1
120
IBC 2024 動画技術関連レポート / IBC 2024 Report
cyberagentdevelopers
PRO
0
110
信頼性に挑む中で拡張できる・得られる1人のスキルセットとは?
ken5scal
2
530
【令和最新版】AWS Direct Connectと愉快なGWたちのおさらい
minorun365
PRO
5
750
EventHub Startup CTO of the year 2024 ピッチ資料
eventhub
0
110
安心してください、日本語使えますよ―Ubuntu日本語Remix提供休止に寄せて― 2024-11-17
nobutomurata
1
990
The Rise of LLMOps
asei
7
1.5k
B2B SaaSから見た最近のC#/.NETの進化
sansantech
PRO
0
780
SREによる隣接領域への越境とその先の信頼性
shonansurvivors
2
520
Featured
See All Featured
Designing on Purpose - Digital PM Summit 2013
jponch
115
7k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
0
89
Why Our Code Smells
bkeepers
PRO
334
57k
Thoughts on Productivity
jonyablonski
67
4.3k
Art, The Web, and Tiny UX
lynnandtonic
297
20k
Building an army of robots
kneath
302
43k
Building Better People: How to give real-time feedback that sticks.
wjessup
364
19k
Agile that works and the tools we love
rasmusluckow
327
21k
Intergalactic Javascript Robots from Outer Space
tanoku
269
27k
Raft: Consensus for Rubyists
vanstee
136
6.6k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
Statistics for Hackers
jakevdp
796
220k
Transcript
「実践的データモデリング入門」は 20年経っても色あせない @wakama1994 2024.02.28 めぐろLT #12
AGENDA 自己紹介 書籍の紹介 書籍のここがすごい! 最新の技術を使うとより凄い! さいごに 01. 02. 03. 04.
05.
©primeNumber Inc. 3 若松 拓夢 WHO AM I? primeNumber.Inc ソリューション本部 データアナリスト
北海道出身 1994年6月生まれ 国立大学の法学部で計量経済学に出会い 理工系の大学院で修士号を取る 新卒は気象会社で分析とサービス開発 更なるスキルアップを考え primeNumberに転職 趣味は自転車・秘境駅めぐり・Kaggle ・勉強会(懇親会) etc 1 3 @wakama1994 Takumu Wakamatsu
©primeNumber Inc. 書籍の紹介 Introduction of Book 4
©primeNumber Inc. 5 書籍の概要 • 2003年3月出版 • データの構造〜DB設計まで抑えた書籍 • 実践編が充実しており、実務に役立つ
◦ 20年前のビジネスモデルだが十分使える • 1回の通読程度では不十分 ◦ 初学者向きではない ◦ 何度も読み返す必要あり 実践的データモデリング入門 翔泳社 真野正 著
©primeNumber Inc. 6 • データの概観-ER図- 実際のDB設計までを指す ◦ 概念モデル ◦ 論理モデル
◦ 物理モデル • ER図だけを指すものではない データモデリングとは? 図1-4 システム工程とデータモデリング 著作権の都合上 speaker deck非公開
©primeNumber Inc. 書籍のここがすごい! Attractive point of this Book 7
©primeNumber Inc. 8 ① データの把握~DB構築まで一気通貫で! 図0-3モデリング手法と章立て 図0-2 モデリング手法と章立て 著作権の都合上 speaker
deck非公開 著作権の都合上 speaker deck非公開
©primeNumber Inc. 9 • 章末のポイントページで学ぶべきことが整理! ② 各章のポイントページがすごい! ❏ データモデルはエンティティ、属性 (アトリビュート)、リレーション
シップの3要素で構成される ❏ エンティティには独立エンティティと 従属エンティティがある ❏ リレーションシップには実線で表す依 存関係と破線で表す非依存関係がある ❏ 属性は、エンティティ内のインスタン スを一意に識別する主キーと主キー以 外から構成される ❏ リレーションシップはビジネスを如実 に表す …. 第2章 : モデルの基本作法より 第6章: ネーミング標準とドメイン ❏ システム間での同音異義語、異音同義 語の発生を避けるためにはあ、ネーミ ング標準が必要である ❏ データの項目名はエンティティから離 れても一意に識別できるのが理想であ る。 ❏ データ定義とは、データ項目を因数分 解し、新名称を付加することである。 ❏ データ項目の構成要素は、名称、意味 定義、ドメイン、データタイプ、長さ などから構成される …. ※書籍から一部を抜粋
©primeNumber Inc. 10 • 具体的なビジネスモデルに基づく設計も掲載! ③ 実践編の充実度がすごい! エンティティ 名 エンティティ定
義 SEQ 属性名 属性定義 論理デー タタイプ 桁数 PK ドメイン名 クレジット会 員 ネット書店での 購入代金の支 払いをクレジッ トカードで行お うとした顧客の クレジットカード 情報 1 種別 クレジットカード 会社 CHAR 2 Yes クレジットカー ド種別 2 番号 XXXX-XXXX- XXXX-XXX (ハイフンなし) CHAR 12 Yes クレジットカー ド番号 3 名義人 カード名義人 VARCHAR 40 No 氏名 4 有効期限 有効期限 Yyyy/mm-期限 (年月) DATE No 期限 (年月) 5 会社コード クレジットカードの 会社コード CHAR 10 No 法人コード 第9章 トップダウンモデルとボトムアップモデルの融合 表9-4 エンティティ定義表 ※書籍から一部を抜粋 30種類のエンティティ名
©primeNumber Inc. 最新の技術を使うともっと凄い! Adding to New technology with this book
11
©primeNumber Inc. 12 • 昨今のクラウドサービスの普及によ り、容量に神経を使う必要がなくなっ ている ◦ 例えば、AWSのクラウドデータ ベースでは、従量課金制で用途に
合わせた利用が可能 ◦ GCPでも同様のサービスがあった AWSなどのクラウドサービスも併用できる! ①各テーブルのレコード長を算出する ②レコード長をもとに最適なサイズを決める ③レコードあるいはレコード単位の付加情報 の長さを考慮して、1ブロックあたりの格納 レコード数を算出する ④最大格納データ件数を算出する ⑤必要サイズ数を算出する(初期値、増分) ⑥追加/更新の頻度を考慮してブロックあたり のフリースペースサイズを決める 第15章 物理実装のポイント 容量の見積もり手順より ※書籍から一部を抜粋
©primeNumber Inc. 13 • 第12章「モデリングツールの利用法」 ではErwinやER/studioといったUIでモ デリングできるツールの紹介 ◦ 「依存関係を双方向で引けない」 等の修正可能だが、紐付けが冗長
や複雑な場合は修正不可 • Geminiの登場で精緻なチェックまで 実施可能性あり! LLMの応答での可能性も! ER/studio Geminiの応答例
©primeNumber Inc. さいごに Conclusion 14
©primeNumber Inc. 15 • 実践的データモデリング入門は20年経っても色あせない! ◦ 実践編の充実が実務に役立つ ◦ 章末のポイントページで初学者でも安心 ◦
最新の技術と組み合わせてさらに充実 • 繰り返し読むことで理解を深めよう! ◦ DB初学者は書籍で出てくる単語も難解 ◦ 1冊でDB構築まで至れるため、本業に活かせそう まとめ
©primeNumber Inc. 16 現所属チームの業務 16 コンサルティングからデータ基盤構築・運用、活用領域(BI/機械学習)の構築まで、 データエンジニアリングカンパニーとして、データ基盤の構築からデータ活用を一気通貫でサポートしています。 データ分析・機械学習 BI導入
統合・蓄積・ビジネスロジック実装 前処理構築 データ整備 後処理構築 データ可視化 DWH構築 転送・加工マネジメント データレイク構築 データバリデーション 業務の見える化 コンサルテーション • ダッシュボード構築 • メンテナンス etc. • データの学習 • データ蓄積方針 • データの品質 • 業務の棚卸し • 業務整理 BigQuery Snowflake Redshift Tableau Looker Studio Looker • バッチデータ転送 • 転送方法・頻度 • マート作成粒度 • ガバナンス etc. 機械学習基盤選定 パイプライン構築 学 習 推 論 SaaS/ DB / その他サービス • 各種コネクタの追加 trocco®による シームレスなデータ連携 • リアルタイム処理 pN-Ops pN-Integration 弊社ソリューションのサービス提供範囲
あらゆるデータを、 ビジネスの力に変える。 primeNumberは、データテクノロジーカンパニー。 あらゆるデータが爆発的に増えていく時代に、 誰もがすばやく、簡単にデータを使える環境を構築し、 データ活用までのプロセスを最適化。 高度なテクノロジーと独自のアイデアで、 世界中のビジネスを支援します。 V I
S I O N