Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2024年時系列データベースの最新動向と最適な選択基準

GridDB
July 11, 2024

 2024年時系列データベースの最新動向と最適な選択基準

2024.7.11 (木) 16:30 - 17:00
2024年時系列データベースの最新動向と最適な選択基準

梶 信也
株式会社フィックスターズ
ソリューション第四事業部
事業部長

時系列データベースは、現代のデータ駆動型ビジネスにおいて不可欠な要素となっています。適切な時系列データベースの選択は、ビジネスの成功に直結します。本セッションでは、市場の最新動向を概観し、選択基準の詳細な解説、主要な選択肢の比較検討、そして最終的な選択のための実践的なガイドラインを提供します。ビジネスの競争力を高めるために、最適な時系列データベースを選ぶための知識と洞察を共有します。

GridDB

July 11, 2024
Tweet

More Decks by GridDB

Other Decks in Technology

Transcript

  1. Copyright© Fixstars Group 本⽇のAgenda • はじめに • フィックスターズのご紹介 • 『2024年時系列データベースの最新動向と最適な選択基準』

    • 時系列データ、時系列データベースとは︖ • 時系列データベースの最新動向 • 時系列データベースの選択基準 • 活⽤事例とユースケース • 未来展望 • まとめ 2
  2. Copyright© Fixstars Group 発表者紹介 5 写真 梶 信也 Shinya KAJI

    株式会社フィックスターズ ソリューション第四事業部 執⾏役員 事業部⻑ クラウド⾼速化や AI ⾼速化の新規事業⽴ち上 げを経て、現在ではデータベース活⽤、FPGA 開発、HPC 等のプロジェクト推進を担当。
  3. Copyright© Fixstars Group フィックスターズの強み コンピュータの性能を最⼤限に引き出す、ソフトウェア⾼速化のエキスパート集団 ハードウェアの知⾒ アルゴリズム実装⼒ 各産業・研究分野の知⾒ 7 ⽬的の製品に最適なハードウェアを⾒抜き、

    その性能をフル活⽤するソフトウェアを開 発します。 ハードウェアの特徴と製品要求仕様に合わ せて、アルゴリズムを改良して⾼速化を実 現します。 開発したい製品に使える技術を⾒抜き、実 際に動作する実装までトータルにサポート します。
  4. Copyright© Fixstars Group サービス提供分野 8 半導体 ⾃動⾞ 産業機器 ⽣命科学 ⾦融

    • NAND型フラッシュメモリ向け ファームウェア開発 • 次世代AIチップの開発環境基盤 • ⾃動運転の⾼性能化、実⽤化 • 次世代パーソナルモビリティの 研究開発 • Smart Factory実現への⽀援 • マシンビジョンシステムの⾼速化 • ゲノム解析の⾼速化 • 医⽤画像処理の⾼速化 • AI画像診断システムの研究開発 • デリバティブシステムの⾼速化 • HFT(アルゴリズムトレード)の⾼速化
  5. Copyright© Fixstars Group サービス領域 様々な領域でソフトウェア⾼速化サービスを提供しています。⼤量データの⾼速処理は、 お客様の製品競争⼒の源泉となっています。 9 組込み⾼速化 画像処理・ アルゴリズム開発

    分散並列システム開発 GPU向け⾼速化 FPGAを活⽤した システム開発 量⼦コンピューティング AI・深層学習 ⾃動⾞向け ソフトウェア開発 フラッシュメモリ向け ファームウェア開発
  6. Copyright© Fixstars Group 時系列データとは︖ 時系列データ (time series data) は、時間情報(タイムスタンプ)が記録されたデータまたは その時点で発⽣したイベントに対応する⼀連の値。データの間隔は、定期的な間隔と変動する間

    隔どちらに設定することもできる。例えば、温度記録は設定された時間、毎分または毎時間に記 録され、株価は取引が完了するたびに記録される。 11 時系列データの特徴︓ 1. 時間の順序: 時系列データは時間の経過に従って記録さ れるため、データポイントの順序が重要。 2. ⾃⼰相関: 時系列データは時間的に関連しているため、 過去の値が現在や将来の値に影響を与えることがある。 3. 季節性: ⼀定の周期でデータが繰り返される傾向を持つ ことがある(例︓毎⽉の売上や気温)。 出典: https://medium.com/@namnguyenthe/time-series-data- characteristics-994e43c470c6
  7. Copyright© Fixstars Group 時系列データベースとは︖ 時系列データベース(Time Series Database, TSDB)は、時系列データの効率的な 格納、管理、検索、分析に特化したデータベース。時系列データは、時間とともに変 動するデータであり、センサーデータ、⾦融取引データ、気象データ、IoT

    デバイス からのデータなど、多くの分野で利⽤されている。 時系列データベースの主な特徴︓ 1. ⾼い書き込みスループット 2. 効率的なクエリ処理 3. 圧縮とアグリゲーション 12 出典: https://blog.senx.io/which-time-series-database-suited-to-your-needs/
  8. Copyright© Fixstars Group 時系列データベースの最新動向 1. データの増加とスケーラビリティ 2. リアルタイム処理と分析 3. 分散型アーキテクチャ

    4. 新しいデータモデリングとクエリ機能 5. オープンソースと商⽤ソリューション 6. セキュリティとプライバシー 15
  9. Copyright© Fixstars Group 時系列データベースの最新動向 (cont.) 1.『データの増加とスケーラビリティ』 • IoT とセンサー技術の普及︓IoT デバイスやセンサーの普及に伴い、膨⼤な

    量の時系列データが⽣成されている。これに対応するため、TSDB はスケー ラビリティとパフォーマンスの向上が求められている。 • エッジコンピューティング︓エッジデバイスでのデータ収集と処理が進んで おり、エッジとクラウド間のデータ連携が重要となっている。 16
  10. Copyright© Fixstars Group 時系列データベースの最新動向 (cont.) 2.『リアルタイム処理と分析』 • ストリーム処理︓リアルタイムのデータ分析が求められる場⾯が増えており、 データのインジェストからクエリまでの⼀連の処理をリアルタイムで⾏う機 能が強化されている。

    • 機械学習との統合︓リアルタイムデータを⽤いた機械学習モデルのトレーニ ングと推論が可能な TSDB が注⽬されている。これにより、予測分析や異常 検知が効率的に⾏える。 17
  11. Copyright© Fixstars Group 時系列データベースの最新動向 (cont.) 3.『分散型アーキテクチャ』 • クラウドネイティブ︓クラウド上での運⽤を前提とした TSDB が増えており、

    オートスケーリングや⾼可⽤性の確保が可能となっている。 • 分散ストレージ︓分散ストレージを利⽤することで、データの冗⻑性と耐障 害性が向上している。 18
  12. Copyright© Fixstars Group 時系列データベースの最新動向 (cont.) 4.『新しいデータモデリングとクエリ機能』 • ハイブリッドデータモデル︓時系列データとリレーショナルデータを統合的に扱 えるデータモデルが登場している。これにより、より複雑なクエリや分析が可能 になる。

    • クエリ⾔語の進化︓時系列データ専⽤のクエリ⾔語が進化しており、 より直感的で効率的なデータ抽出が可能。例えば Prometheus の『PromQL』、 InfluxDB の『InfluxQL』、GridDB の『TQL』などが例として挙げられる。 19
  13. Copyright© Fixstars Group 時系列データベースの最新動向 (cont.) 5.『オープンソースと商⽤ソリューション』 • オープンソース TSDB の成⻑︓InfluxDB,

    TimescaleDB, GridDB などの オープンソースプロジェクトが活発に開発されており、コミュニティによる サポートやエコシステムが充実している。 • 商⽤ソリューションの強化︓商⽤の TSDB ソリューションも多く提供されて おり、企業のニーズに応じたカスタマイズやサポートが⾏われている。 20
  14. Copyright© Fixstars Group 時系列データベースの選択基準 1. データのスケーラビリティとパフォーマンス 2. データ圧縮とストレージ効率 3. クエリ機能

    4. インテグレーションとエコシステム 5. 耐障害性とリカバリ 6. 運⽤と管理の容易さ 7. コスト 22
  15. Copyright© Fixstars Group 時系列データベースの選択基準 (cont.) 1.『データのスケーラビリティとパフォーマンス』 • 時系列データは⾮常に⼤量のデータポイントを⽣成するため、データベース のスケーラビリティが重要。 •

    ⾼い書き込み速度やクエリ性能が求められる。 23 出典:『 GridDB と InfluxDB を使用した 時系列データベースのパフォーマンス比較 』 https://griddb.net/ja/docs/TimeSeries_Database_Benchmark_GridDB_InfluxDB.pdf
  16. Copyright© Fixstars Group 時系列データベースの選択基準 (cont.) 3.『クエリ機能』 • ⾼度なクエリ機能が提供されているかどうか。 • e.g.,

    PromQL, InfluxQL, TQL • 時系列特有のクエリ(例えば、範囲検索、グルーピング、集計など)が効率 的に実⾏できること。 25
  17. Copyright© Fixstars Group 時系列データベースの活⽤事例とユースケース 1. ⾦融市場のデータ解析 2. IoT センサーデータのモニタリング 3.

    エネルギー管理とスマートグリッド 4. 気象データの解析 5. 医療データの管理 6. スポーツデータの解析 30
  18. Copyright© Fixstars Group 時系列データベースの活⽤事例とユースケース (cont.) 『⾦融市場のデータ解析』 ⾦融市場では、株価、為替、商品価格などの時間的な変動をリアルタイムで追 跡し、分析するために TSDB が広く使⽤されている。例えば、投資銀⾏やヘッ

    ジファンドは、⾼頻度取引(HFT)や市場の動向予測に TSDB を活⽤している。 31 出典:『 Python Pandas, Plotly, GridDBによる株式市場分析』 https://griddb.net/ja/blog/stock-market-analysis-with-python-pandas-plotly-and-griddb/
  19. Copyright© Fixstars Group 時系列データベースの活⽤事例とユースケース (cont.) 『 IoT センサーデータのモニタリング』 スマートシティや⼯場の⾃動化において、IoT デバイスから得られる⼤量のセ

    ンサーデータを効率的に処理するために TSDB が利⽤されている。例えば、気 温、湿度、振動などのデータをリアルタイムで収集し、異常検知や予防保全に 役⽴てられている。 32 出典:『Python Sklearnを使ってGridDBのデータから異常値を検出する』 https://griddb.net/ja/blog/detecting-anomalies-from-data-in-griddb-with-python-sklearn/
  20. Copyright© Fixstars Group 時系列データベースの未来展望 1. エッジコンピューティングとの統合 ◦ エッジデバイスからのデータ収集が増加し、TSDB はこれらのデータを リアルタイムで処理・分析する役割を担うことが重要になる。

    ◦ エッジコンピューティングと TSDB の統合により、データの伝送遅延が減少し、 リアルタイムでの意思決定が可能になる。 2. AI および機械学習との連携 ◦ TSDB は AI および機械学習モデルのトレーニングデータとして利⽤されることが 増えていく。 ◦ 時系列データの予測や異常検知において、TSDB が重要な役割を果たし、 リアルタイムでのデータ解析と意思決定を⽀援する。 37
  21. Copyright© Fixstars Group まとめ •時系列データ︓ • 多くのビジネスや研究分野での時系列データの役割が増⼤している • データ分析や意思決定における価値の源泉になり得る •時系列データベースの最新動向︓

    • データの増加とスケーラビリティ、リアルタイム処理と分析、分散型アーキテクチャ、新しいデー タモデリングとクエリ機能、オープンソースと商⽤ソリューション、セキュリティとプライバシー •選択基準︓ • パフォーマンス&スケーラビリティ、ストレージ効率、クエリ機能、インテグレーションとエコシ ステム、信頼性(耐障害性とリカバリ)、運⽤の容易さ、コストと TCO •活⽤事例︓ • ⾦融からスポーツまで幅広い業界で時系列データおよび時系列データベースが活⽤されている 38