Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
FOSS4G 2023 Japan@FUKUI 熊谷康太様発表資料
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
OSGeo.JP
September 26, 2023
Technology
0
220
FOSS4G 2023 Japan@FUKUI 熊谷康太様発表資料
FOSS4G 2023 Japan@FUKUI
スポンサー講演7:デジタル社会を目指して~分散DBと分散処理の連携に関する調査
熊谷 康太様(株式会社NTTデータグループ) 発表資料
OSGeo.JP
September 26, 2023
Tweet
Share
More Decks by OSGeo.JP
See All by OSGeo.JP
Advancing the 3D Geospatial Ecosystem in Japan via Global Collaborations
osgeojp
0
3k
農業用ダム監視を目的とした衛星SAR 干渉解析の適用性について
osgeojp
0
3k
FOSS4G 山陰Meetup 2024/ QGIS Processing でのGRASSのエラーの調査
osgeojp
0
24
FOSS4G 2023 Japan@FUKUI 佐橋 功一様、 新垣 仁様 発表資料
osgeojp
0
310
FOSS4G 2023 Japan@FUKUI 白土 洋介様 発表資料
osgeojp
0
750
FOSS4G 2023 Japan@FUKUI 小林裕之様発表資料
osgeojp
0
750
吉中輝彦様 QGISで扱うラスタレイヤ (FOSS4G 2022 Japan Online)
osgeojp
0
71
原田 豊様 Windows版『聞き書きマップ』のQGISプラグイン化
osgeojp
0
420
吉中輝彦様 QGISと点群とPLATEAUと
osgeojp
0
2k
Other Decks in Technology
See All in Technology
親子 or ペアで Mashup for the Future! しゃべって楽しむ 初手AI駆動でものづくり体験
hiroramos4
PRO
0
100
[JAWSDAYS2026][D8]その起票、愛が足りてますか?AWSサポートを味方につける、技術的「ラブレター」の書き方
hirosys_
3
120
OCHaCafe S11 #2 コンテナ時代の次の一手:Wasm 最前線
oracle4engineer
PRO
1
100
「ストレッチゾーンに挑戦し続ける」ことって難しくないですか? メンバーの持続的成長を支えるEMの環境設計
sansantech
PRO
3
640
[2026-03-07]あの日諦めたスクラムの答えを僕達はまだ探している。〜守ることと、諦めることと、それでも前に進むチームの話〜
tosite
0
180
タスク管理も1on1も、もう「管理」じゃない ― KiroとBedrock AgentCoreで変わった"判断の仕事"
yusukeshimizu
5
2.5k
身体を持ったパーソナルAIエージェントの 可能性を探る開発
yokomachi
1
100
Claude Code のコード品質がばらつくので AI に品質保証させる仕組みを作った話 / A story about building a mechanism to have AI ensure quality, because the code quality from Claude Code was inconsistent
nrslib
13
5.8k
製造業ドメインにおける LLMプロダクト構築: 複雑な文脈へのアプローチ
caddi_eng
1
550
JAWS DAYS 2026 楽しく学ぼう!ストレージ 入門
yoshiki0705
2
140
S3はフラットである –AWS公式SDKにも存在した、 署名付きURLにおけるパストラバーサル脆弱性– / JAWS DAYS 2026
flatt_security
0
1.7k
vLLM Community Meetup Tokyo #3 オープニングトーク
jpishikawa
0
320
Featured
See All Featured
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.3k
From π to Pie charts
rasagy
0
150
Git: the NoSQL Database
bkeepers
PRO
432
66k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
1
1.3k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
410
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
A designer walks into a library…
pauljervisheath
210
24k
Darren the Foodie - Storyboard
khoart
PRO
3
2.8k
Marketing to machines
jonoalderson
1
5k
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
320
Transcript
© 2023 NTT DATA Group Corporation © 2023 NTT DATA
Group Corporation デジタル社会を目指して~分散DBと分散処理の連携に関する調査 2023年9月18日 株式会社NTTデータグループ 技術革新統括本部 技術開発本部 IOWN推進室 熊谷康太
© 2023 NTT DATA Group Corporation 2 目指すべき未来社会の姿として第5期科学技術基本計画においてSociety5.0が提唱された。 Society5.0とは情報社会(Society4.0)における課題がIT等を活用したデジタル技術によって解決されている社会である。 デジタル社会(Society
5.0)とは Society 5.0までの変遷 Society 5.0で実現する世界 狩猟社会(Society 1.0)、農耕社会(Society 2.0)、工業社会(Society 3.0)、 情報社会(Society 4.0)に続く、新たな社会のことであり、 経済発展と社会的課題の解決を両立する、人間中心の社会(Society) IoTや人工知能、ロボット、自動走行車などの技術により社会変革(イノベーション)が起き、 情報社会(Society 4.0)における課題を解決できる。 例えば、人手不足のために十分な配送サービスを享受できないという地域の課題に対して、 地理空間情報やドローン技術などを活用することで 自動配送サービスを実現し解決することがあげられる。 参考: 内閣府 Society5.0 (https://www8.cao.go.jp/cstp/society5_0/)
© 2023 NTT DATA Group Corporation 3 Society 5.0の実現に求められること Society5.0はサイバー空間(仮想空間)とフィジカル空間(現実空間)を高度に融合させたシステムによって実現される。
このシステムを実現するためには多様で膨大な地理空間情報をリアルタイムに収集し、効率的に分析することが必要となる。 サイバー空間(仮想空間)とフィジカル空間(現実空間)を 高度に融合させたシステムによって実現される。 Society 5.0のしくみ 参考: 内閣府 Society5.0 (https://www8.cao.go.jp/cstp/society5_0/) 東京都デジタルツインプロジェクト(https://info.tokyo-digitaltwin.metro.tokyo.lg.jp/) サイバー空間とフィジカル空間を高度に融合させたシステムの例 (東京都デジタルツインプロジェクト) 現実空間の様々なIoTセンサデータ(地理空間情報)などをリアルタイムに収集し、 効率的に分析して、現実世界にリアルタイムにフィードバックする必要がある
© 2023 NTT DATA Group Corporation 4 従来技術の課題と先進技術の動向 従来技術について PostGISは多様な地理空間の情報収集、分析に役立つ。
ただし、モノリシックな構成であるためスケーラビリティに課題がある。 (データ、トランザクションの規模の増加に対応することが難しい) 先進技術の動向 水平スケール可能な分散DBが登場。 社会課題と技術動向を踏まえた取組 PostgreSQLとの互換性を持つ分散DBであるYugabyteDBについて地理空間情報の収集(書き込み)と分析(読み込み)の処理性能がスケールするか調査する。 YugabyteDBに書き込みと読み込みを行うアプリケーションについては大規模データのリアルタイム処理に適したApache Sparkを用いる。 参考:PLATEAU (https://www.mlit.go.jp/plateau/use-case/uc22-008/)(https://www.mlit.go.jp/plateau/use-case/uc23-05/), Japan Comuputer Technology(https://www.jctechno.co.jp/system/case1/index.html), 株式会社スポットライト(https://www.pgecons.org/wp-content/uploads/2013/12/7c14ac1727a38c22295af840fc613321.pdf), RESAS(https://resas.go.jp/population-future-mesh/#/map/13/13101/2/2050/0/0/0.5/10.079484783826816/35.6939726/139.7536284/2050/0) PostgreSQL互換 MySQL互換 多様な地理空間情報の収集、分析に役立つ技術としてPostGISがあるがスケーラビリティに課題がある。 一方で近年高いスケーラビリティを特徴とする分散DBが登場している。 3D都市モデル ハザードマップ ヒートマップ ナビゲーション PostGISの活用事例
© 2023 NTT DATA Group Corporation 5 YugabyteDBとは Yugabyte社が中心に開発しているOSSプロダクト。 PostgreSQLとの高い互換性を目指しており、PostGISとも互換性を持っている
YugabyteDBクラスタ YugabyteDBノード#1 YB-Master YB-Tserver YugabyteDBノード#2 YB-Master YB-Tserver YugabyteDBノード#3 YB-Master YB-Tserver YB-Masterはクラスタ全体の メタデータを管理 YB-Tserverはクエリ処理や ユーザデータの保管を担当 ユーザデータの配置先・ユーザ・権限などのメタデータを管理する「YB-Master」と、 ユーザデータを保持するとともに、ユーザリクエストを処理する「YB-Tserver」の2つのコンポーネントから構成される。 複数のYB-MasterとYB-Tserverで構成されるクラスタをYugabyteDBクラスタと呼ぶ。
© 2023 NTT DATA Group Corporation 6 Apache Sparkとは 大量のデータを
たくさんのサーバを並べて並 列分散処理し、 現実的な時間(数分~数時間)で 目的の処理結果を得る ビッグデータのリアルタイム分析に適したOSSの分散処理フレームワークである。 ◼ 分散処理フレームワークの概要 ◼ Apache Sparkを用いる理由 ディスクIOを少なくしてなるべくインメモリで処理する設計となっており高速に動作することが特徴である。 この特徴を活かしてYugabyteDBと組み合わせることで今まで困難であった大規模な地理空間情報の リアルタイムな収集、分析が実現できるのではないかと考えて採用する。
© 2023 NTT DATA Group Corporation 7 取組の概略 YugabyteDBに対するApache Sparkを用いた地理空間情報の書き込みと読み込みについて調査し、
実機を用いて動作を確認した。 AWS Apache Sparkクラスタ YugabyteDBクラスタ クライアント ノード Spark クライアントアプリ メトリクス収集・ 監視ノード Master ノード#3 Master ノード#2 Master ノード#1 Worker ノード#3 Worker ノード#2 Worker ノード#1 YugabyteDB ノード#3 YugabyteDB ノード#2 YugabyteDB ノード#1 C1 C2 C3 xxx yyy zzz .. .. .. .. .. .. STEP1 YugabyteDBにテーブルを作成し、 27万レコードを挿入 ※日本全国の橋梁数の約3/1に相当 C1 C2 C3 xxx yyy zzz .. .. .. .. .. .. STEP2 Sparkクライアントアプリでの操作をトリガとして YugabyteDBのテーブルをSpark上に読み込み C1 C2 C3 xxx yyy zzz .. .. .. .. .. .. STEP3 Sparkクライアントアプリでの操作をトリガとして Spark上に読み込んだデータを別名テーブルとして YugabyteDBに書き込み 各ノードのスペックは以下 • t3.xlarge(4CPU, 16GiB) • gp2(100GiB, 300IOPS) 参考: 国土交通省 道路の維持管理について https://www8.cao.go.jp/kisei-kaikaku/kisei/meeting/wg/seicho/20191219/191219seicho03.pdf
© 2023 NTT DATA Group Corporation 8 実行結果(読み込み) YugabyteDBノード別 読み込み処理実行中のスループット(SELECT)
読み込みによるYugabyteDBのメトリクス変化量 SELECTに関するメトリクス 変化量 YugabyteDB ノード#1 実行ステートメント数 885 YugabyteDB ノード#2 実行ステートメント数 913 YugabyteDB ノード#3 実行ステートメント数 927 合計 実行ステートメント数 2725 27万レコードのデータ読み込みが411秒で実行できた。 また、読み込みリクエストが概ね均等に各YugabyteDBノードに分散されることが確認できた。 YugabyteDBの各ノードに 大きなスループットの偏りは 見られなかった リクエストがほぼ均等に 分散している
© 2023 NTT DATA Group Corporation 9 実行結果(書き込み) YugabyteDBノード別 書き込み処理実行中のスループット(INSERT)
書き込みによるYugabyteDBのメトリクス変化量 INSERTに関するメトリクス 変化量 YugabyteDB ノード#1 実行ステートメント数 90025 YugabyteDB ノード#2 実行ステートメント数 85942 YugabyteDB ノード#3 実行ステートメント数 94033 合計 実行ステートメント数 270000 27万レコードのデータ書き込みが450秒で実行できた。 また、読み込みと同様、書き込みリクエストが概ね均等に各YugabyteDBノードに分散されることが確認できた。 YugabyteDBの各ノードに 大きなスループットの偏りは 見られなかった 読み込みと同様、 リクエストがほぼ均等に 分散している
© 2023 NTT DATA Group Corporation 10 まとめと今後の展望 ◼ まとめ
Society5.0に向けた社会課題と技術動向を踏まえてPostgreSQLと互換性のある分散DBであるYugabyteDBと 分散処理フレームワークであるApache Sparkを用いて地理空間情報の読み込みと書き込みの処理性能がスケールするかについて調査した。 調査の結果、今回検証で用いた構成においては27万件レコードの処理について、読み込み処理の場合は411秒で完了し、書き込み処理の 場合は450秒で完了することが確認できた。また、書き込みと読み込みのいずれについてもSparkノードからのリクエストが 各YugabyteDBノードにおよそ均等に分散することから、Sparkクラスタを構成するノード数とYugabyteDBクラスタを構成するノード数を 水平スケールさせることで地理空間情報の読み込みと書き込みの処理性能がスケールする可能性があると考える。 ◼ 今後の展望 従来技術で課題となっていたスケーラビリティの部分が分散DBによって解決することができれば、大規模な地理空間情報をリアルタイムに収集し、 効率的に分析して、現実世界にフィードバックすることが求められるシステムの実現に寄与できると考える。