Slide 29
Slide 29 text
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY
29
10億ドキュメント JSONチャレンジ
半構造化された JSON ドキュメントの大規模なデータセットをどれだけ
効率的に保存し、集計できるかを測定する。
# TABLE DDL
CREATE TABLE bluesky
(
`data` JSON
kind LowCardinality(String),
commit.operation LowCardinality(String),
commit.collection LowCardinality(String),
did String,
time_us UInt64
)
)
ORDER BY (
data.kind,
data.commit.operation,
data.commit.collection,
data.did,
fromUnixTimestamp64Micro(data.time_us)
);
# データセットのサンプル
{
"account": {
"active": true,
"did":
"did:plc:kjealuouxn3l6v4byxh2fhff",
"seq": "706717212",
"time": "20241127T180002.429Z"
},
"did": "did:plc:kjealuouxn3l6v4byxh2fhff",
"kind": "account",
"time_us": "1732730402720719"
}