手を動かしながら学ぶデータモデリング - 論理設計から物理設計まで / Data modeling

JJUG CCC 2025 Fall   手を動かしながら学ぶデータモデリング  - 論理設計から物理設計まで 

タイムテーブル      What is it? 

1. 座学 40分程度  2. データモデリングワークショップ  a. 前半 20分 +
解説 10分  b. 後半 20分 + 解説 10分  3. まとめ  タイムテーブル 

1. データモデルの3層構造の理解  2. 要件からモデリングする過程の体験  3. 変化に強いデータモデルの理解  What is it? 

今日のゴール      What is it? 

データモデリングがなぜ重要か      What is it? 

AIは未来を想像してくれない初期設計

AIは未来を想像してくれない初期設計仕様追加

AIは未来を想像してくれない初期設計仕様追加将来を見据えたテーブルの修正をしないと次の仕様追加に耐えられない

AIは未来を想像してくれない初期設計仕様追加仕様追加

AIは未来を想像してくれない初期設計仕様追加仕様追加マジカルな設計によって開発ができなくなる

データモデリングがなぜ重要か  ↓  AIは未来を想像してくれない  What is it? 

データモデリングがなぜ重要か  ↓  AIは未来を想像してくれない  What is it?  将来の設計を考慮して提案してくれるわけではない

だからこそ、データモデリングが大事！      What is it? 

“大事なのはできるという経験を得ること”    – 宇宙兄弟 145話   What is
it?

できる！を体験して    データモデリングを理解していきましょう  What is it? 

1. 自己紹介  2. データモデリングの3層構造  3. データモデリングの進め方  4. 駐車場のデータモデリング  5. おわりに 
あじぇんだ 

自己紹介  曽根壮大（41歳）  Have Fun Tech LLC 代表社員  株式会社リンケージ CTO
兼 COO    そ  • 日本PostgreSQLユーザ会勉強会分科会担当  • 3人の子供がいます（長女、次女、長男）  • 技術的にはWeb/LL言語/RDBMSが好きです  • コミュニティが好きたけ  ね  とも 

あじぇんだ 

データモデリングの3層構造      データモデリングの3層構造

データモデリングの3層構造  ↓  データモデルと3層スキーマ  データモデリングの3層構造

データモデリングの3層構造外部スキーマ概念スキーマ内部スキーマ論理スキーマ物理スキーマユーザから見えている部分概念データモデル論理データモデル物理データモデル
ANSI/SPARC 3層スキーマアプリケーションの画面やインターフェース

概念スキーマデータモデリングの3層構造外部スキーマ内部スキーマ論理スキーマ物理スキーマユーザから見えている部分概念データモデル論理データモデル物理データモデル
今日の対象概念データモデル論理データモデル物理データモデルザックマンフレームワークのデータモデル分類

概念データモデル      概念データモデル 

概念データモデル  ↓  必要な概念を整理する  概念データモデル 

• 対象(エンティティ)と関係(リレーション)を整理したもの  • 概念データモデルはER図ではない  ◦ ER図より一段抽象度が高い  ◦ オブジェクト図やドメインモデル図が近い  • リソースとイベントに分けて考えると良い 
概念データモデル 

エンティティ  ||  リソースとイベント  概念データモデル 

リソース（モノ）とイベント（コト）      概念データモデル 

リソース（モノ）とイベント（コト）  ↓  5w1h  概念データモデル 

リソース  ↓  登録するモノ  概念データモデル 

リソースとは  • 事実を生み出す元になるモノ  • 物理的なモノも概念も定義できる  ◦ 例えば未来も定義できる  • 時間依らず「存在する」モノ  •
リソースはWhenとHow to 以外  ◦ Where(どこで),Who(誰が),What(何を),Why(なぜ) 

イベント  ↓  実際に発生したコト  概念データモデル 

イベントとは  • 事実そのもの  ◦ 事実は常に過去しかない  • 定期的に繰り返される  ◦ 複数の事実の積み重ねもありえる  •
イベントはWhenとHow to  ◦ いつ、どんな事実が実行されたか 

エンティティを洗い出して    関連性を見出してグルーピングする作業  概念データモデル 

論理データモデル      論理データモデル

論理データモデル  ↓  事実の保存される構造を決める  論理データモデル

情報と事実（データ）は違う      論理データモデル

情報と事実（データ）は違う      論理データモデル生年月日は事実年齢はそのタイミングの情報

データモデリングと情報設計は別モノ    分けることが大事  論理データモデル

データモデリング      論理データモデル

データモデリング  ↓  どのように事実を保存するか  論理データモデル

情報設計      論理データモデル

情報設計  ↓  事実を如何に加工し、利用するか  論理データモデル

• エンティティの定義と属性(アトリビュート)を整理して、ライフサイクルを分解していく  • 成果物はER図になる  ◦ 保存されるミドルウェアのことは考えない  ◦ NoSQLやRDBMSかもしれない  ◦
もちろん、両方使うかもしれない  • できるだけ小さい粒度にしていくことが大事  論理データモデル

できるだけ小さい粒度にしていく      論理データモデル

できるだけ小さい粒度にしていく  ↓  正規化  論理データモデル

ここまでシンプルな実装を目指しましょうと強調してきましたが、「シンプルな実装」とはなんでしょうか。RDBMSを使う上でシンプルな実装のヒントは正規化です。正規化のコツは次のように表現できます。   • 事実だけを保存する   • 重複がない 
• 不整合がない  • nullがない  これらを意識して設計していくとシンプルな設計に近づいていきます。  また正規化を行う際はここまで説明したとおり、種別と状態を考えることも重要です。ライフサイクルが違うデータは往々にして状態や種別が異なります。場合によってはnullになるようなカラムやUPDATEが必要なレコードは状態を持っている可能性があります。こうしたテーブルが見つかった場合はより深く考察する必要があります。   https://agilejourney.uzabase.com/entry/2022/07/28/103000

概念を正規化して    適切な粒度に分解していく作業  論理データモデル

物理データモデル      物理データモデル

物理データモデル  ↓  事実を保存する場所に合わせる  物理データモデル

• DBMSの特性に合わせて論理データモデルを整える  • RDBMSなら型やインデックスなど利用するために  必要な条件に合わせていく  • パフォーマンスや利用用途の都合も考慮する  ◦ 例えばキャッシュや非正規化など  •
RDBMS以外のストレージに保存されることもある  ◦ オブジェクトストレージやNewSQLなど  物理データモデル

そして最後にINDEXの数にも注目しましょう。主キーは必ずありますが、外部キー制約とユニーク制約を除いたINDEXは主に検索のために必要なINDEXです。検索のWHEREの対象の数だけそのテーブルの責務が大きいといえ、 4つ以上の INDEXが必要な場合も同じく深く考察する必要があります。隠れた状態をWHEREで絞り込んでいたり、種別をWHEREで絞り込んでいるケースが見えてくることがあります。  
このようにシンプルな設計を目指して考察を繰り返していくことが重要です。そして同じくらい重要なこととして認識すべきはイージーとシンプルは両立できる、ということです。シンプルを目指し考察を繰り返すことがまさにデータモデリングであり、変化に強い設計につながっていくのです。   https://agilejourney.uzabase.com/entry/2022/07/28/103000

実際に保存する場所に    データの姿を合わせていく  物理データモデル

あじぇんだ 

基本的は上から順番に    概念データモデルから始める  データモデリングの進め方 

概念データモデル論理データモデル物理データモデルザックマンフレームワークのデータモデル分類上から下へアプリケーションの画面やインターフェース

概念データモデリング      概念データモデリング

エンティティを列挙して    エンティティの関係を示す  概念データモデリング

イベントリソース概念をリソースとイベントにわけて列挙する  駐車場車両利用者契約入庫出庫予約
支払い

イベントリソース駐車場車両利用者契約入庫出庫予約支払い
時間に依存せず存在するモノ住所 who(誰が) what(何が) what(何が) where(どこで) 概念をリソースとイベントにわけて列挙する 

イベントリソース駐車場車両利用者契約入庫出庫予約支払い
発生した事実住所いつ、入庫した？いつ、支払いした？いつ、予約した？概念をリソースとイベントにわけて列挙する 

エンティティを列挙して    エンティティの関係を示す  概念データモデリング

利用履歴概念データモデル図の例  駐車場車両利用者契約入庫出庫予約支払い

一見、良さそうだが……    本当に？  概念データモデリング

利用履歴概念データモデル図の例  駐車場車両利用者契約入庫出庫予約支払い
月極だった場合は契約に紐づくのでは？複数の車両の考慮は？駐車枠のリソースが必要では？予約の事実も利用履歴では？

こうやって概念を整理して    必要なエンティティを抽出する  概念データモデリング

論理データモデリング      論理データモデリング

エンティティを分解して    適切な粒度にする  論理データモデリング

1. 属性（アトリビュート）を洗い出す  2. データの関係を明確にする  a. 1:1なのか1:NのかN:Nなのか  b. 参照方向の確定（依存の親子関係）   3.
エンティティのライフサイクルで分ける  4. ユースケースごとにデータの流れを整理する  5. 属性のnull、updateを無くすところまで分解する  a. イミュータブルモデリング  b. SELECTとINSERTのみでデータを表現する  エンティティの分解するとき

駐車場属性を洗い出す  • 名称 • 管理番号 • 住所 • 緯度
• 経度 • 最寄り駅 • 収容台数 • 営業時間 • 登録日時支払い • 名称 • 基本料金 • 時間料金 • 1日最大利用料 • 昼間料金 • 夜間料金 • 支払日時 • 支払料金 • 支払者 • 消費税 • 割引額

• 経度 • 最寄り駅 • 収容台数 • 営業時間 • 登録日時支払い • 名称 • 基本料金 • 時間料金 • 1日最大利用料 • 昼間料金 • 夜間料金 • 支払日時 • 支払料金 • 支払者 • 消費税 • 割引額駐車枠に依存する属性なのでやっぱり駐車枠リソースは必要

• 経度 • 最寄り駅 • 収容台数 • 営業時間 • 登録日時支払い • 名称 • 基本料金 • 時間料金 • 1日最大利用料 • 昼間料金 • 夜間料金 • 支払日時 • 支払料金 • 支払者 • 消費税 • 割引額支払い条件の話

支払い駐車場属性を洗い出す  • 名称 • 管理番号 • 住所 •
緯度 • 経度 • 最寄り駅 • 収容台数 • 営業時間 • 登録日時 • 名称 • 基本料金 • 時間料金 • 1日最大利用料 • 昼間料金 • 夜間料金 • 支払日時 • 支払料金 • 支払者 • 消費税 • 割引額支払い内容の話

支払い内容属性を洗い出す  支払い条件 • 名称 • 基本料金 • 時間料金 •
1日最大利用料 • 昼間料金 • 夜間料金 • 支払日時 • 支払料金 • 支払者 • 消費税 • 割引額支払い • 名称 • 基本料金 • 時間料金 • 1日最大利用料 • 昼間料金 • 夜間料金 • 支払日時 • 支払料金 • 支払者 • 消費税 • 割引額分解

エンティティのライフサイクルで分ける  4. ユースケースごとにデータの流れを整理する  5. 属性のnull、updateを無くすところまで分解する  a. イミュータブルモデリング  b. SELECTとINSERTのみでデータを表現する  エンティティの分解するとき ER図で表現する

関係を明確にする 

Userテーブルの分割の場合      Userテーブルの分割

create table users( id bigserial constraint users_pk primary key, name
text not null, birthday date not null, email text not null, hashed_password text not null ); create unique index 　users_email_uindex　on users (email);  

よく見るテーブルだけど？      Userテーブルの分割

？？？「LINE認証を追加したいんだけど」      Userテーブルの分割

？？？「LINE認証を追加したいんだけど」  ↓  カラム追加すればえぇやろ！  Userテーブルの分割

alter table users add line_id text; alter table users add
line_token text; create unique index users_line_token_uindex on users (line_token); create unique index users_line_id_uindex on users (line_id);

これが様々な問題を生み出す…      Userテーブルの分割

• メールアドレスとパスワードは必須  ◦ LINE認証でアカウント登録してもemailとpasswordを登録する必要がある  ◦ ユーザの手間は減っていない（むしろ増える）  • この問題はLINEの認証情報を別テーブルにしても同じ  ◦
emailとpasswordをnullにする必要がある  ◦ nullを許可したときにemailがUNIQUEでなくなる  userテーブルにカラムを追加すると……

大きく捉えて小さく作る      Userテーブルの分割

passwordは認証情報のみの情報です。一方のemailは認証情報のみに使われる情報だとするとpasswordと一緒にしておくのも合理的かもしれません。   　しかし、emailは「email情報単体で変更される」こともあれば、たとえばGitHubのように複数のemailを持つこともあるでしょう。  　このように、emailは認証情報以外の属性も持っています。こうした場合、emailにpinコードを送ってWeb画面で認証する、といったワンタイムトークンのような認証機能を実装すると
passwordは不要になります。   　こうした運用を想定し、今回はemailとpasswordを別テーブルに分ける判断をしました。   　またこの設定であれば以下の図のように新たなログイン情報が必要になった際も対応することができます。   https://agilejourney.uzabase.com/entry/2022/07/28/103000

passwordは認証情報のみの情報です。一方のemailは認証情報のみに使われる情報だとするとpasswordと一緒にしておくのも合理的かもしれません。   　しかし、emailは「email情報単体で変更される」こともあれば、たとえばGitHubのように複数のemailを持つこともあるでしょう。  　このように、emailは認証情報以外の属性も持っています。こうした場合、emailにpinコードを送ってWeb画面で認証する、といったワンタイムトークンのような認証機能を実装すると
passwordは不要になります。   　こうした運用を想定し、今回はemailとpasswordを別テーブルに分ける判断をしました。   　またこの設定であれば以下の図のように新たなログイン情報が必要になった際も対応することができます。   https://agilejourney.uzabase.com/entry/2022/07/28/103000 そもそもUserじゃなくてMemberなって話が記事にはあるので続きは Webで

大きく捉えて小さく作る      Userテーブルの分割

Small is beautiful.    小さいものは美しい  Unixの哲学

Small is beautiful. 小さなプログラムという発想  1. 小さなプログラムはわかりやすい   2. 小さなプログラムは保守しやすい  
3. 小さなプログラムはシステム  リソースに優しい  4. 小さなプログラムは他のツールと組み合わせやすい    https://amzn.to/33QPAdv

Make each program do one thing well.    1つのプログラムには  1つのことをうまくやらせる 
Unixの哲学

Make each program do one thing well. 一つのことに集中することで  プログラムに不要な部分をなくせる。  
不要な部分があると、  実行速度が遅くなり、  不必要に複雑になり、  融通が効かない。    https://amzn.to/33QPAdv

1テーブル、1責務      正規化とSimple is Beautiful

1テーブル、1責務  ↓  Simpleを目指す  正規化とSimple is Beautiful

SimpleとEasyは違う      正規化とSimple is Beautiful

正規化とSimple is Beautiful

イミュータブルに設計する              正規化とSimple is Beautiful
https://scrapbox.io/kawasima/%E3%82%A4%E3%83%9F%E3%83%A5%E3%83%BC%E3%82%BF%E3%83%96%E3%83%AB%E3%83%87%E3%83%BC%E3%82%BF%E3%83%A2%E3%83%87%E3%83%AB [イミュータブルデータモデリング kawasima] [検索]

テーブルはSimpleが美しい      正規化とSimple is Beautiful

テーブルはSimpleが美しい  ↓  EasyではなくSimpleを目指す  正規化とSimple is Beautiful

論理データモデリング中に    新しい概念を見つけることがある  論理データモデリング

概念と論理を繰り返す概念データモデル論理データモデル概念データモデル論理データモデル概念データモデル論理データモデルスタート

概念と論理を繰り返す概念データモデル論理データモデル概念データモデル論理データモデル概念データモデル論理データモデル新しい概念を見つけたら改めて整理する

概念と論理を繰り返す概念データモデル論理データモデル概念データモデル論理データモデル概念データモデル論理データモデル繰り返して完成を目指す

論理データモデリング中は    物理の制約や既存の制約にとらわれない  倫理データモデリング「今のテーブルが◯◯だから～」みたいなセリフがあると危険信号本来の設計から逸脱しているかも

物理データモデリング      物理データモデリング

論理データモデルを    物理の世界にマッピングする  物理データモデリング

1. 論理データモデルを対象のソフトウェアに反映する  a. RDBMSの場合にはDDL  b. 検索のためのインデックスや制約を追加する  2. パフォーマンスの要件のために必要な対応  a. パーテーション 
b. キャッシュ  3. 実際に利用するときのSQLを整理する  a. 参照のためのSELECTや更新の処理  b. そのときの実行計画を確認する  c. 10年後も同じ実行計画になるか  物理データモデリングの進め方

1. 論理データモデルを対象のソフトウェアに反映する  a. RDBMSの場合にはDDL  b. 検索のためのインデックスや制約を追加する  2. パフォーマンスの要件のために必要な対応  a. パーテーション 
b. キャッシュ …など  3. 実際に利用するときのSQLを整理する  a. 参照のためのSELECTや更新の処理  b. そのときの実行計画を確認する  c. 10年後も同じ実行計画になるか  物理データモデリングの進め方日本向けのサービスとグローバルで想定する最大ユーザ数は変わる国内ならuserのpkはintで良いかも、グローバルなら bigintやuuidが必要

論理データモデルを    物理の世界にマッピングする  物理データモデリング RDBMSならDDLにほぼするだけ。 ER図を作る過程で副産物として完成していることも多い

物理設計のフェーズで    新しい概念を見つけることもある  物理データモデリング

物理設計のフェーズで    新しい概念を見つけることもある  物理データモデリング概念データモデリングに戻る

あじぇんだ 

お題「駐車場」      駐車場のデータモデリング https://gist.github.com/soudai/dd93d925380e8db27542a3f2904d1f78

サンプル      駐車場のデータモデリング https://github.com/soudai/explain-analyze-training/tree/main/docker/src/design_parking Dockerの環境なども用意しているので使い方がわからない人は質問してください

まずは抽象モデリング    次に論理データモデリング  駐車場のデータモデリング

まずは抽象モデリング    次に論理データモデリング  駐車場のデータモデリング PCを使っても紙を使っても AIを使ってもOK

前半 30分やっていきましょう！      駐車場のデータモデリング各々で適宜休憩は取ってください

前半の解説 10分      駐車場のデータモデリング

後半戦！      駐車場のデータモデリング

前半の論理データモデルを    物理データモデルに変換しましょう  駐車場のデータモデリング

速く終わった人は    仕様変更のステップにチャレンジ！  駐車場のデータモデリング

後半の解説 10分      駐車場のデータモデリング

あじぇんだ 

AIを活用するためにも    データは必要  おわりに

データの寿命は    アプリケーションよりも長い  おわりに

おわりに

ビジネスに踏み込み    データモデリングを考え抜きましょう  おわりに

データモデリングの歴史は長い      おわりに

データモデリングの歴史は長い  ↓  本もサイトも豊富なので活用しましょう  おわりに

オススメ本      おわりに

ミック本は良い • SQLの基礎本  ミックさんの本は読みやすいし、正しい情報だし、とにかく良い  https://amzn.to/3xHwP8R

DBは本から学べる • DB設計の本  • SQLの本も別にある  ミックさんの本はオススメ。そしてこの本は2012年の本だが、未だ全く色褪せることなく現役で使える知識で、今でもみんなに勧める1冊。  https://amzn.to/3CGNm0p

頼む、読んでくれ！ • 俺たちのt_wada  • 大事なことが沢山書いてある  • 7月に第2版がでた  まぁとりあえず読んでくれ  https://amzn.to/43J8hiR

現実に向き合った本 • 令和の名著（当社調べ）  • PostgreSQL & MySQL 対応  そーだい本、一度は読んで欲しい。あと 5年は現役で読める本だと思っている
し、「失われた事実」とか「キャッシュ中毒」なんかは未だによく話をする。  あと頑張ったら新刊出すかも。  (連載してたやつをまとめて)  https://amzn.to/4jBL4nL

データモデリングはスキルなので    正しく学べば身につけることができる  おわりに

      おわりに Simple is Beautiful     

      おわりに Simple is Beautiful  ↓  常に追求した者だけが辿り着ける 

今、こだわり抜いた設計が    未来の自分を救うことになる  おわりに

      おわりに

昨日の自分に誇れる    今日の自分になろう  おわりに

ご清聴ありがとうございました      おわりに

手を動かしながら学ぶデータモデリング - 論理設計から物理設計まで / Data modeling

手を動かしながら学ぶデータモデリング - 論理設計から物理設計まで / Data modeling

More Decks by soudai sone

Other Decks in Technology

Featured

Transcript