Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「データモデリング実践入門」は20年経っても色あせない
Search
wakama1994
February 28, 2024
Technology
4
1.4k
「データモデリング実践入門」は20年経っても色あせない
めぐろLT#12「おすすめ書籍紹介LT」の登壇資料
https://meguro-lt.connpass.com/event/305704/
wakama1994
February 28, 2024
Tweet
Share
More Decks by wakama1994
See All by wakama1994
Rで始めるML・LLM活用入門
wakamatsu_takumu
0
160
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
2
2k
「実践DataOps」書籍紹介
wakamatsu_takumu
0
56
Kaggleの歩き方-関西Kaggler会に参加してみて-
wakamatsu_takumu
2
640
BQで天気基盤をつくって、役立つ情報を可視化してみた!
wakamatsu_takumu
4
1.2k
いろんな可視化ツールあるけどggplotて何がいいの?- 複数ツールで比較してみた!-
wakamatsu_takumu
1
1.6k
文系出身でも「アルゴリズム×数学」はスッキリ理解できた!話
wakamatsu_takumu
0
620
ChatGPTにどんなときRを使えばいいか聞いてみた!
wakamatsu_takumu
0
730
A/Bテスト実践ガイド ~真のデータドリブンへ至る信用できる実験とは~
wakamatsu_takumu
1
1.7k
Other Decks in Technology
See All in Technology
Secure Boot 2026 - Aggiornamento dei certificati UEFI e piano di adozione in azienda
memiug
0
140
生成AIの利用とセキュリティ /gen-ai-and-security
mizutani
1
1.2k
Exadata Fleet Update
oracle4engineer
PRO
0
1.3k
チームメンバー迷わないIaC設計
hayama17
5
3.8k
Oracle Cloud Infrastructure:2026年2月度サービス・アップデート
oracle4engineer
PRO
0
220
Devinを導入したら予想外の人たちに好評だった
tomuro
0
880
名刺メーカーDevグループ 紹介資料
sansan33
PRO
0
1.1k
OpenClawで回す組織運営
jacopen
2
400
自動テストが巻き起こした開発プロセス・チームの変化 / Impact of Automated Testing on Development Cycles and Team Dynamics
codmoninc
1
1.1k
バクラクのSREにおけるAgentic AIへの挑戦/Our Journey with Agentic AI
taddy_919
2
1k
「ヒットする」+「近い」を同時にかなえるスマートサジェストの作り方.pdf
nakasho
0
110
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
44k
Featured
See All Featured
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
65
Designing Powerful Visuals for Engaging Learning
tmiket
0
260
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.4k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.1k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.6k
The untapped power of vector embeddings
frankvandijk
2
1.6k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.1k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
760
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
130
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
190
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
The Language of Interfaces
destraynor
162
26k
Transcript
「実践的データモデリング入門」は 20年経っても色あせない @wakama1994 2024.02.28 めぐろLT #12
AGENDA 自己紹介 書籍の紹介 書籍のここがすごい! 最新の技術を使うとより凄い! さいごに 01. 02. 03. 04.
05.
©primeNumber Inc. 3 若松 拓夢 WHO AM I? primeNumber.Inc ソリューション本部 データアナリスト
北海道出身 1994年6月生まれ 国立大学の法学部で計量経済学に出会い 理工系の大学院で修士号を取る 新卒は気象会社で分析とサービス開発 更なるスキルアップを考え primeNumberに転職 趣味は自転車・秘境駅めぐり・Kaggle ・勉強会(懇親会) etc 1 3 @wakama1994 Takumu Wakamatsu
©primeNumber Inc. 書籍の紹介 Introduction of Book 4
©primeNumber Inc. 5 書籍の概要 • 2003年3月出版 • データの構造〜DB設計まで抑えた書籍 • 実践編が充実しており、実務に役立つ
◦ 20年前のビジネスモデルだが十分使える • 1回の通読程度では不十分 ◦ 初学者向きではない ◦ 何度も読み返す必要あり 実践的データモデリング入門 翔泳社 真野正 著
©primeNumber Inc. 6 • データの概観-ER図- 実際のDB設計までを指す ◦ 概念モデル ◦ 論理モデル
◦ 物理モデル • ER図だけを指すものではない データモデリングとは? 図1-4 システム工程とデータモデリング 著作権の都合上 speaker deck非公開
©primeNumber Inc. 書籍のここがすごい! Attractive point of this Book 7
©primeNumber Inc. 8 ① データの把握~DB構築まで一気通貫で! 図0-3モデリング手法と章立て 図0-2 モデリング手法と章立て 著作権の都合上 speaker
deck非公開 著作権の都合上 speaker deck非公開
©primeNumber Inc. 9 • 章末のポイントページで学ぶべきことが整理! ② 各章のポイントページがすごい! ❏ データモデルはエンティティ、属性 (アトリビュート)、リレーション
シップの3要素で構成される ❏ エンティティには独立エンティティと 従属エンティティがある ❏ リレーションシップには実線で表す依 存関係と破線で表す非依存関係がある ❏ 属性は、エンティティ内のインスタン スを一意に識別する主キーと主キー以 外から構成される ❏ リレーションシップはビジネスを如実 に表す …. 第2章 : モデルの基本作法より 第6章: ネーミング標準とドメイン ❏ システム間での同音異義語、異音同義 語の発生を避けるためにはあ、ネーミ ング標準が必要である ❏ データの項目名はエンティティから離 れても一意に識別できるのが理想であ る。 ❏ データ定義とは、データ項目を因数分 解し、新名称を付加することである。 ❏ データ項目の構成要素は、名称、意味 定義、ドメイン、データタイプ、長さ などから構成される …. ※書籍から一部を抜粋
©primeNumber Inc. 10 • 具体的なビジネスモデルに基づく設計も掲載! ③ 実践編の充実度がすごい! エンティティ 名 エンティティ定
義 SEQ 属性名 属性定義 論理デー タタイプ 桁数 PK ドメイン名 クレジット会 員 ネット書店での 購入代金の支 払いをクレジッ トカードで行お うとした顧客の クレジットカード 情報 1 種別 クレジットカード 会社 CHAR 2 Yes クレジットカー ド種別 2 番号 XXXX-XXXX- XXXX-XXX (ハイフンなし) CHAR 12 Yes クレジットカー ド番号 3 名義人 カード名義人 VARCHAR 40 No 氏名 4 有効期限 有効期限 Yyyy/mm-期限 (年月) DATE No 期限 (年月) 5 会社コード クレジットカードの 会社コード CHAR 10 No 法人コード 第9章 トップダウンモデルとボトムアップモデルの融合 表9-4 エンティティ定義表 ※書籍から一部を抜粋 30種類のエンティティ名
©primeNumber Inc. 最新の技術を使うともっと凄い! Adding to New technology with this book
11
©primeNumber Inc. 12 • 昨今のクラウドサービスの普及によ り、容量に神経を使う必要がなくなっ ている ◦ 例えば、AWSのクラウドデータ ベースでは、従量課金制で用途に
合わせた利用が可能 ◦ GCPでも同様のサービスがあった AWSなどのクラウドサービスも併用できる! ①各テーブルのレコード長を算出する ②レコード長をもとに最適なサイズを決める ③レコードあるいはレコード単位の付加情報 の長さを考慮して、1ブロックあたりの格納 レコード数を算出する ④最大格納データ件数を算出する ⑤必要サイズ数を算出する(初期値、増分) ⑥追加/更新の頻度を考慮してブロックあたり のフリースペースサイズを決める 第15章 物理実装のポイント 容量の見積もり手順より ※書籍から一部を抜粋
©primeNumber Inc. 13 • 第12章「モデリングツールの利用法」 ではErwinやER/studioといったUIでモ デリングできるツールの紹介 ◦ 「依存関係を双方向で引けない」 等の修正可能だが、紐付けが冗長
や複雑な場合は修正不可 • Geminiの登場で精緻なチェックまで 実施可能性あり! LLMの応答での可能性も! ER/studio Geminiの応答例
©primeNumber Inc. さいごに Conclusion 14
©primeNumber Inc. 15 • 実践的データモデリング入門は20年経っても色あせない! ◦ 実践編の充実が実務に役立つ ◦ 章末のポイントページで初学者でも安心 ◦
最新の技術と組み合わせてさらに充実 • 繰り返し読むことで理解を深めよう! ◦ DB初学者は書籍で出てくる単語も難解 ◦ 1冊でDB構築まで至れるため、本業に活かせそう まとめ
©primeNumber Inc. 16 現所属チームの業務 16 コンサルティングからデータ基盤構築・運用、活用領域(BI/機械学習)の構築まで、 データエンジニアリングカンパニーとして、データ基盤の構築からデータ活用を一気通貫でサポートしています。 データ分析・機械学習 BI導入
統合・蓄積・ビジネスロジック実装 前処理構築 データ整備 後処理構築 データ可視化 DWH構築 転送・加工マネジメント データレイク構築 データバリデーション 業務の見える化 コンサルテーション • ダッシュボード構築 • メンテナンス etc. • データの学習 • データ蓄積方針 • データの品質 • 業務の棚卸し • 業務整理 BigQuery Snowflake Redshift Tableau Looker Studio Looker • バッチデータ転送 • 転送方法・頻度 • マート作成粒度 • ガバナンス etc. 機械学習基盤選定 パイプライン構築 学 習 推 論 SaaS/ DB / その他サービス • 各種コネクタの追加 trocco®による シームレスなデータ連携 • リアルタイム処理 pN-Ops pN-Integration 弊社ソリューションのサービス提供範囲
あらゆるデータを、 ビジネスの力に変える。 primeNumberは、データテクノロジーカンパニー。 あらゆるデータが爆発的に増えていく時代に、 誰もがすばやく、簡単にデータを使える環境を構築し、 データ活用までのプロセスを最適化。 高度なテクノロジーと独自のアイデアで、 世界中のビジネスを支援します。 V I
S I O N