Slide 1

Slide 1 text

「実践的データモデリング入門」は 20年経っても色あせない @wakama1994 2024.02.28 めぐろLT #12

Slide 2

Slide 2 text

AGENDA 自己紹介 書籍の紹介 書籍のここがすごい! 最新の技術を使うとより凄い! さいごに 01. 02. 03. 04. 05.

Slide 3

Slide 3 text

©primeNumber Inc. 3 若松 拓夢 WHO AM I? primeNumber.Inc ソリューション本部 データアナリスト 北海道出身 1994年6月生まれ 国立大学の法学部で計量経済学に出会い 理工系の大学院で修士号を取る 新卒は気象会社で分析とサービス開発 更なるスキルアップを考え primeNumberに転職  趣味は自転車・秘境駅めぐり・Kaggle ・勉強会(懇親会) etc 1
 3 @wakama1994 Takumu Wakamatsu

Slide 4

Slide 4 text

©primeNumber Inc. 書籍の紹介 Introduction of Book 4

Slide 5

Slide 5 text

©primeNumber Inc. 5 書籍の概要 ● 2003年3月出版  ● データの構造〜DB設計まで抑えた書籍 ● 実践編が充実しており、実務に役立つ ○ 20年前のビジネスモデルだが十分使える ● 1回の通読程度では不十分 ○ 初学者向きではない ○ 何度も読み返す必要あり 実践的データモデリング入門 翔泳社 真野正 著 

Slide 6

Slide 6 text

©primeNumber Inc. 6 ● データの概観-ER図- 実際のDB設計までを指す ○ 概念モデル ○ 論理モデル ○ 物理モデル ● ER図だけを指すものではない データモデリングとは? 図1-4 システム工程とデータモデリング 著作権の都合上 speaker deck非公開

Slide 7

Slide 7 text

©primeNumber Inc. 書籍のここがすごい! Attractive point of this Book 7

Slide 8

Slide 8 text

©primeNumber Inc. 8 ① データの把握~DB構築まで一気通貫で! 図0-3モデリング手法と章立て 図0-2 モデリング手法と章立て 著作権の都合上 speaker deck非公開 著作権の都合上 speaker deck非公開

Slide 9

Slide 9 text

©primeNumber Inc. 9 ● 章末のポイントページで学ぶべきことが整理! ② 各章のポイントページがすごい! ❏ データモデルはエンティティ、属性 (アトリビュート)、リレーション シップの3要素で構成される ❏ エンティティには独立エンティティと 従属エンティティがある ❏ リレーションシップには実線で表す依 存関係と破線で表す非依存関係がある ❏ 属性は、エンティティ内のインスタン スを一意に識別する主キーと主キー以 外から構成される ❏ リレーションシップはビジネスを如実 に表す …. 第2章 : モデルの基本作法より 第6章: ネーミング標準とドメイン ❏ システム間での同音異義語、異音同義 語の発生を避けるためにはあ、ネーミ ング標準が必要である ❏ データの項目名はエンティティから離 れても一意に識別できるのが理想であ る。 ❏ データ定義とは、データ項目を因数分 解し、新名称を付加することである。 ❏ データ項目の構成要素は、名称、意味 定義、ドメイン、データタイプ、長さ などから構成される …. ※書籍から一部を抜粋

Slide 10

Slide 10 text

©primeNumber Inc. 10 ● 具体的なビジネスモデルに基づく設計も掲載! ③ 実践編の充実度がすごい! エンティティ 名 エンティティ定 義 SEQ 属性名 属性定義 論理デー タタイプ 桁数 PK ドメイン名 クレジット会 員 ネット書店での 購入代金の支 払いをクレジッ トカードで行お うとした顧客の クレジットカード 情報 1 種別 クレジットカード 会社 CHAR 2 Yes クレジットカー ド種別 2 番号 XXXX-XXXX- XXXX-XXX (ハイフンなし) CHAR 12 Yes クレジットカー ド番号 3 名義人 カード名義人 VARCHAR 40 No 氏名 4 有効期限 有効期限 Yyyy/mm-期限 (年月) DATE No 期限  (年月) 5 会社コード クレジットカードの 会社コード CHAR 10 No 法人コード 第9章 トップダウンモデルとボトムアップモデルの融合 表9-4 エンティティ定義表 ※書籍から一部を抜粋 30種類のエンティティ名

Slide 11

Slide 11 text

©primeNumber Inc. 最新の技術を使うともっと凄い! Adding to New technology with this book 11

Slide 12

Slide 12 text

©primeNumber Inc. 12 ● 昨今のクラウドサービスの普及によ り、容量に神経を使う必要がなくなっ ている ○ 例えば、AWSのクラウドデータ ベースでは、従量課金制で用途に 合わせた利用が可能 ○ GCPでも同様のサービスがあった AWSなどのクラウドサービスも併用できる! ①各テーブルのレコード長を算出する ②レコード長をもとに最適なサイズを決める ③レコードあるいはレコード単位の付加情報 の長さを考慮して、1ブロックあたりの格納 レコード数を算出する ④最大格納データ件数を算出する ⑤必要サイズ数を算出する(初期値、増分) ⑥追加/更新の頻度を考慮してブロックあたり のフリースペースサイズを決める 第15章 物理実装のポイント 容量の見積もり手順より ※書籍から一部を抜粋

Slide 13

Slide 13 text

©primeNumber Inc. 13 ● 第12章「モデリングツールの利用法」 ではErwinやER/studioといったUIでモ デリングできるツールの紹介 ○ 「依存関係を双方向で引けない」 等の修正可能だが、紐付けが冗長 や複雑な場合は修正不可 ● Geminiの登場で精緻なチェックまで 実施可能性あり! LLMの応答での可能性も! ER/studio Geminiの応答例

Slide 14

Slide 14 text

©primeNumber Inc. さいごに Conclusion 14

Slide 15

Slide 15 text

©primeNumber Inc. 15 ● 実践的データモデリング入門は20年経っても色あせない! ○ 実践編の充実が実務に役立つ ○ 章末のポイントページで初学者でも安心 ○ 最新の技術と組み合わせてさらに充実 ● 繰り返し読むことで理解を深めよう! ○ DB初学者は書籍で出てくる単語も難解 ○ 1冊でDB構築まで至れるため、本業に活かせそう まとめ

Slide 16

Slide 16 text

©primeNumber Inc. 16 現所属チームの業務 16 コンサルティングからデータ基盤構築・運用、活用領域(BI/機械学習)の構築まで、 データエンジニアリングカンパニーとして、データ基盤の構築からデータ活用を一気通貫でサポートしています。 データ分析・機械学習 
 BI導入
 統合・蓄積・ビジネスロジック実装 
 前処理構築 
 データ整備
 後処理構築 
 データ可視化 
 DWH構築
 転送・加工マネジメント 
 データレイク構築 
 データバリデーション 
 業務の見える化 
 コンサルテーション 
 • ダッシュボード構築 
 • メンテナンス etc. 
 • データの学習 
 • データ蓄積方針 
 • データの品質 
 • 業務の棚卸し 
 • 業務整理
 BigQuery
 Snowflake
 Redshift
 Tableau
 Looker Studio 
 Looker
 • バッチデータ転送 
 • 転送方法・頻度 
 • マート作成粒度 
 • ガバナンス etc. 
 機械学習基盤選定 
 パイプライン構築 
 学 習
 推 論
 SaaS/ DB / その他サービス 
 • 各種コネクタの追加 
 trocco®による 
 シームレスなデータ連携 
 • リアルタイム処理 
 pN-Ops
 pN-Integration 
 弊社ソリューションのサービス提供範囲

Slide 17

Slide 17 text

あらゆるデータを、 ビジネスの力に変える。 primeNumberは、データテクノロジーカンパニー。 あらゆるデータが爆発的に増えていく時代に、 誰もがすばやく、簡単にデータを使える環境を構築し、 データ活用までのプロセスを最適化。 高度なテクノロジーと独自のアイデアで、 世界中のビジネスを支援します。 V I S I O N