東京大学工学部計数工学科、計数工学特別講義の説明資料

さくらインターネット研究所菊地俊介さくらインターネットを取り巻くデータセンター業界状況と、さくらの研究開発 2026年4⽉14⽇

© SAKURA internet Inc. • 本資料では、クラウド基盤を提供するさくらインターネットの視点から、⽣成AIの普及で激変するデータセンター業界の最新動向を解説し、その上で、計算資源の安定供給という課題に対し、研究開発の側⾯からどうアプローチしているのか、研究所の取り組みを詳述します。更に具体的に、ワットビット構想やエッジコンピューティ
ング、最新スパコン「さくらＯＮＥ」による挑戦について説明します。 • データセンター業界状況とさくらインターネットの取り組み • さくらインターネット研究所の研究開発の紹介 • ワットビット、エッジコンピューティング、さくらONEの概要はじめに（本資料の構成） 2

© SAKURA internet Inc. 菊地俊介（東京都出⾝）⾃⼰紹介 3 所属
さくらインターネット研究所学歴早稲⽥⼤学⼤学院理⼯学研究科電⼦・情報通信学専攻修⼠課程修了早稲⽥⼤学⼤学院国際情報通信研究科博⼠課程単位取得退学職歴富⼠通（株）富⼠通研究所に就職ネットの研究やったり、SEやったり、NICTに出向したり、トイレIoT作ったりさくらインターネットに転職データ流通（FIWARE, NGSI）、OpenFogコンソーシアム（標準化）、量⼦（アニーリング）コンピュータ、Erlang/Elixir、分散システム専⾨エッジ・Fogコンピューティング（分散系システム）、スマートシティビジョナリーとして技術・社会、会社の将来を思い描く新規領域調査、PoC実施、社内適⽤コンサル、講師・講演趣味新技術調査、読書、最近はガンプラ作り @kikuzokikuzo https://note.mu/kikuzokikuzo https://www.facebook.com/ kikuzokikuzo https://twitter.com/kikuzokikuzo

© SAKURA internet Inc. さくらインターネットについて 5 商号さくらインターネット株式会社（SAKURA
internet Inc.）代表取締役社⻑⽥中邦裕創業 1996年12⽉23⽇設⽴ 1999年8⽉17⽇事業内容クラウドコンピューティングサービスなどの提供データセンター運営本社所在地〒530-0011 ⼤阪府⼤阪市北区⼤深町6-38 グラングリーン⼤阪北館 JAM BASE 3F 拠点⼤阪（本社）、東京、北海道（データセンター）、福岡、沖縄資本⾦ 112億8,316万円上場証券取引所東京証券取引所プライム市場（証券コード：3778）従業員数連結 1,116名（2025年9⽉末）

© SAKURA internet Inc. 主な事業領域の変遷 6 インターネット黎明期より顧客ニーズの変遷とともにサービスの軸⾜を変えながら成⻑ 0 200 400
600 800 1000 1200 0 5,000 10,000 15,000 20,000 25,000 30,000 35,000 40,000 '00/3期 '01/3期 '02/3期 '03/3期 '04/3期 '05/3期 '06/3期 '07/3期 '08/3期 '09/3期 '10/3期 '11/3期 '12/3期 '13/3期 '14/3期 '15/3期 '16/3期 '17/3期 '18/3期 '19/3期 '20/3期 '21/3期 '22/3期 '23/3期 '24/3期 '25/3期 '26/3期サービスカテゴリ別売上⾼・従業員数クラウドサービス GPUクラウドサービス物理基盤サービスその他従業員数（売上⾼ / 単位：百万円）（従業員数 / 単位：⼈）（予想）レンタルサーバ事業で創業サーバビジネスへ転向クラウドサービスへ集中事業の多⾓化効率化追求 →停滞期経営者として成⻑コミット →再び成⻑基調へコロナ禍クラウド集中成⻑へ向けた変遷

© SAKURA internet Inc. 飽和しつつあるIT市場 7 -80% -60% -40% -20%
0% 20% 40% 60% 80% 100% 120% $- $1,000 $2,000 $3,000 $4,000 $5,000 $6,000 $7,000 2021Q 1 2021Q 2 2021Q 3 2021Q 4 2022Q 1 2022Q 2 2022Q 3 2022Q 4 2023Q 1 2023Q 2 2023Q 3 2023Q 4 2024Q 1 2024Q 2 2024Q 3 2024Q 4 2025Q 1 世界のクラウド/SaaS業界における四半期新規ARR増加額とその前年同期⽐成⻑率新規ARR増加額前年⽐成⻑率線形 (前年⽐成⻑率) 引⽤ https://www.saastr.com/the-great-saas-slowdown-what-q1-2025-numbers-reveal-about-the-cloud-software-market/ IT市場の成⻑率は鈍化している成熟したIT市場 AIの台頭 IT投資、SaaSの減速 AIによる新しい市場加速する AI の流れ

© SAKURA internet Inc. 8 AI-Enabled vs AI-Native AI-Enabled AIの役割
データ活⽤設計基準補助ツール効率化の⼿段既存プロセスへの追加・置換特定の業務改善に利⽤意思決定 AIの役割設計基準データ活⽤意思決定⼈間が主導 AIがサポートビジネスの根幹プロダクトそのもの AI主導の根本的な再設計ビジネス全体を動かす燃料として活⽤ AIエージェント主導⼈間はオーケストレーター AI-Native AI-NativeではAIは「導⼊する対象」ではなく「前提条件」 AIが⽌まる＝事業が⽌まる

© SAKURA internet Inc. 9 AIの社会実装「AIはコンピュータの中だけではない時代へ」 ChatGPTなどのAIエージェントが「デジタル同僚」としてオフィスに浸透次の波は「AIが⾝体を持ち、現実空間で⼈と共に働く」時代となるこれまでの10年：デジタルAI
ChatGPTやCopilotなどの「デジタル同僚」がオフィスに浸透。コンピュータの中だけで完結する情報処理・⽣成が中⼼。これからの10年：フィジカルAI AIが「⾝体」を持ち、現実空間で⼈と共に働く時代。認識・判断に加え、物理的な⾏動を伴う「ロボット同僚」が登場する。これまではAIが頭脳を得た10年これからは⾝体を得る10年になる

© SAKURA internet Inc. 10 ⽐較：デジタルAI vs フィジカルAI デジタルAI AIの居場所
協働形態コミュニケーション画⾯の中 Inside Screens テキスト・⾳声効率化・代⾏ Text / Voice 必要な能⼒ Efficiency / Automation AIの居場所コミュニケーション協働形態必要な能⼒情報処理現場（空間）⾝体・動作・空気感共創・補完物理的理解・倫理・安全 Information Processing Physical World Body / Motion / Presence Co-creation / Supplement Physical Understanding / Safety フィジカルAI フィジカルAIが前提となると、ヒトの仕事が変わるのではなく「仕事の概念」そのものが変わる

© SAKURA internet Inc. AIとデータが国⼒を左右する時代、計算基盤（計算⼒）をどう築くかが国家の未来を決める 11 l ⽣成AIとクラウドの拡⼤により、データセンターは社会を⽀える中枢インフラへ l
AIの進化とフィジカルAIの台頭で「計算基盤（計算⼒）」が国⼒を左右する時代に l いま「計算資源をどこに、どれだけ持つか」が国家戦略の核⼼になっている AI時代に問われる「新しい基盤の条件」

© SAKURA internet Inc. 世界のデータセンター市場 12 参考：GRAND VIEW HORIZONE (https://www.grandviewresearch.com/horizon/)の情報を加⼯
世界のデータセンター市場予測 2024 2030 2024 2030 2024 2030 2024 2030 $139.4B (44.0% OF GLOBAL MARKET) $253.3B (42.8%) growth rate：181.7% $87.3B (27.6%) $154.3B (26.1%) growth rate：176.7% $71.7B (44.0%) $150.4B (42.8%) growth rate：209.8% $18.3B (44.0%) $33.8B (42.8%) growth rate：184.7% • 世界的にデータセンター市場は、⽣成AIの急速な進展を背景に、今後も⼤きく成⻑すると予測される。 • APACは中国やインドを中⼼に⾼い成⻑が⾒込まれ、他のリージョンを上回る拡⼤が期待さる。 • ⼀⽅で、市場の定義や算定⽅法に⼤きな差があり、発表される数値や予測にはばらつきが⾒られる。 • 世界情勢の不安定化やエネルギー・環境制約の深刻化も加わり、従来の成⻑モデルでは先⾏きを正確に⾒通すことが難しい状況にある。 • データセンターが直⾯する課題は過去に例を⾒ないほど⼤きく、エネルギー需給や環境負荷の⾯で地球規模の影響を及ぼす可能性がある。 • 「チャンスは⾮常に⼤きいが、供給・運⽤側の課題も拡⼤している」これが、今の世界のデータセンター産業が直⾯する現実である。

© SAKURA internet Inc. 13 従来の社会基盤電気⽔道道路次世代の社会基盤
クラウドデータセンター AI データセンターは、電気・⽔道・道路に並ぶ、次世代の社会基盤の⼀つ「AI」や「クラウド」が注⽬される⼀⽅で、データセンターは意識されにくい存在。しかし、今やデータセンターは電⼒・通信・知・経済をつなぐ社会基盤そのもの。これからは、テクノロジーを⽀える⼟台であるデータセンターが、⽇本の未来を築く要になる。データセンターの役割データセンターは、電⼒・通信だけでなく、知・経済をつなぎ、⽇本の未来を築く社会基盤

© SAKURA internet Inc. 進化するデータセンター「預かる場所」から「価値を⽣み出す基盤」へ 14 データを守るだけの時代は終わり、社会の知と成⻑を⽀える時代へこれからのデータセンターは、価値・未来を創る「知のエンジン」となる n かつてのデータセンター
データを預かる「場所」が中⼼ n これからのデータセンターデータ・ネットワーク・計算の統合制御を担い価値を⽣む「知のエンジン」 • 物理的なスペース提供が中⼼ • 電源・空調・監視の基本機能 • 受動的なサービス形態 • 知識を⽣み出す処理基盤 • AIや分析機能の組み込み • 能動的な価値を創造する

© SAKURA internet Inc. さくらインターネットの挑戦と展望 15 国産インフラへの挑戦「⽇本のデジタル主権を守り未来の成⻑を⾃国で⽀えるために」ガバメントクラウド：国のデータを国内で守る体制づくりが進展 AI基盤整備：国家レベルの計算基盤が整い、⺠間投資が活性化経済安全保障：過度な外資依存を減らし、経済安全保障とデジタル主権を両⽴
分散と再エネの活⽤「集中から分散へ。各地域が社会インフラを担う時代へ」東京への⼀極集中の是正と地域特性を活かしたデータセンターの配置冷涼気候・再エネ利⽤・⼟地活⽤など、地域資源を活かす各地域がデジタル産業の現場となり、エネルギー・⼈材・経済の再循環を社会に必要とされる持続性の⾼い運営「効率の先にある信頼を社会とともに育てる」求められるのは効率だけでなく、社会・環境・地域との共存を前提とした持続性と責任「安⼼してデータを預けられる国」＝⽇本らしい社会インフラの形品質・安全・信頼を重んじる⽇本の⽂化・価値観をDC運営に活かし「信頼を設計できる国」として世界に貢献

© SAKURA internet Inc. 当社は垂直統合型・⾃前主義のビジネスモデル市場の変化に強く、顧客ニーズに応える国産クラウドを提供当社のビジネスモデル 16 サポートサービス運⽤
サービス開発・技術研究データセンター • バリューチェーンを最適化 • 顧客のニーズに柔軟かつスピーディに対応可能強み販売さくらのモノプラットフォームさくらのセキュアモバイルコネクトクラウドサービス IoT ブロックチェーン AI・ディープラーニングエッジコンピューティング

© SAKURA internet Inc. ⽯狩データセンター 17 2010年6⽉クラウドに特化した郊外型データセンターとして⽯狩データセンターの建設を発表し2011年3⽉に着⼯。 2011年11⽉に1・2号棟を開所し、2016年12⽉には3号棟を開所。 2025年5⽉に、敷地内にコンテナ型データセンターを開所。 1号棟
2号棟 3号棟コンテナ棟敷地⾯積 51,448㎡（⽯狩湾新港地域全体で3,022ha）竣⼯ 2011年11⽉ 2016年12⽉ 2025年5⽉建物構造地上2階建・鉄⾻造地上3階建・鉄⾻造コンテナ型建設⾯積 7,091㎡ 6,487㎡延床⾯積 11,392㎡ 12,270㎡⽯狩データセンター1･2号棟⽯狩データセンター3号棟コンテナ型データセンター

© SAKURA internet Inc. 学習⽤途向け戦略推論⽤途向け戦略世界49位の処理性能を持つ⾃社スパコン（さくらONE）と新型GPU
「NVIDIA B200」を早期提供。⼤⼝・エンタープライズニーズに応える差別化戦略を実⾏当社の強みである「国産クラウド×⼿厚い⽀援」で⾃由度が⾼く柔軟性のあるプラットフォームサービスを提供開始。計算基盤あたりの収益性を向上 18 学習（開発）向け推論（利⽤）向けさくらONE （スパコン）⾼⽕⼒ PHY ⾼⽕⼒ DOK さくらの⽣成 AIプラットフォームサービス⾼⽕⼒ VRT 多様なニーズに応える⾼付加価値サービスラインアップシリーズ当社の強みであるクラウド型サービスへリソースを集中⾼成⻑・⾼収益領域への注⼒で計算基盤の収益性を最⼤化 ① ② さくらインターネットの取り組み「さくらのAI」基盤

© SAKURA internet Inc. さくらインターネット研究所とは • インターネット技術に関する研究を⾏う • 成果の発信と利⽤を通じて社会と会社に寄与する中・⻑期のビジョンに⽴ち、３〜５年後に役⽴ちそうなことを考える
モットーさくらインターネット研究所のミッション 21 ⾯⽩いと思うテーマにどしどし取り組んでいく

© SAKURA internet Inc. 未来を正確に予想することは困難特にインターネット分野では！研究所の役割 - 選択肢を増やす 22
︖ 選択多様性⾊々なアイデアを試しておき、本当に必要なときにパッと出せるようにしておく流⾏・成功を正確に予想する必要はない斥候として先回りするのが研究所の任務

研究所の研究領域・注⽬領域研究領域 • コンピューティング・ネットワーク • クラウド・コンピューティングの未来を形作る技術の研究開発。「システムプラットフォーム」「システム要素技術」「システムエンジニアリング」のサブカテゴリ。 • データ・機械学習・⼈⼯知能（AI） •
コンピューティングプラットフォーム上で取り扱われるデータの記録・管理・流通、データ駆動で複雑な構造の理解や多様なシステムタスクの⾃動化に関する研究等。 • 教育・社会・組織 • デジタル社会に根ざした教育学や、研究開発組織のマネジメントに関する研究等。注⽬領域（調査・ウォッチ対象） • 量⼦コンピューティング、バイオインフォマティクス、有機コンピューティングなど 23

研究領域図クラウドコンピューティングエッジ・フォグコンピューティング SRE （Site Reliability Engineering） AIインフラ⾼性能計算（HPC）量⼦暗号通信
さくらインターネット博物館教育学研究組織開発 AI for Science AI for コンピューティングコンピューティング・ネットワークデータ・機械学習・⼈⼯知能（AI）教育・社会・組織データ流通 HPC向けデータライフサイクルデザインラボ・インフォマティクスシステムソフトウェアメール基盤ミドルウェアマテリアルズ・インフォマティクス AI創薬量⼦コンピュータ分散コンピューティングフィジカルAI ロボティクス 24

研究テーマ⼀覧各研究員の最新取り組みテーマコンピューティング・ネットワークデータ・機械学習・⼈⼯知能（AI）教育・社会・組織 • 超個体型データセンターの実現に関する研究 • AI/HPCクラスタ「さくらONE」の構築と性能検証
• AI/HPCクラスタのためのSRE • GPU計算基盤の性能最適化 • セルフホストに特化したWebAssemblyランタイム • アプリケーションのライブマイグレーション • 異種OS機能連携によるコンテナサンドボックス機構 • SMTPにおける可観測性を向上させる透過型Proxy • 宣⾔的デプロイメントを可能にするミドルウェア • エッジ・Fogコンピューティングに関する研究 • 量⼦暗号通信のクラウド・DCへの導⼊に関する検討 • クラウド⾃律運⽤基盤の構築 • ⼤規模⾔語モデル(LLM)を⽤いた知識抽出と構造化 • データのライフサイクルデザインに関する研究 • 電⼦実験ノートeurecoの開発 • チェンジラボラトリーによる組織改⾰のプロセス研究 25

超個体型データセンターの実現に関する研究 s-kikuchi • 研究の⽬的 • ⾃律的に結合・離合しつつシームレスなタスク処理を実現できるシステムの構築⾃律的に分散と集中のハイブリッド構造を取れるデータセンターシステムの実現 • 研究の意義 •
クラウドによる無制限のバックエンド処理を可能にしつつ、必要・状況に応じてコンピューティングリソースの局所利⽤も⾃動実現する • 研究の⼿法など • ⾃然由来エネルギーの揺らぎなども考慮したデータセンターへのタスクスケジューリング⼿法の開発分散し増⼤するコンピューティングインフラコンピューティングリソース（PC）コンピューティングリソース（MEC）コンピューティングリソース（Device）クラウドエッジ現場超個体型データセンター（超個体型データセンターOS）遍在するデータと、それを処理するプロセスが⾃律分散する現場センターコンピューティング・ネットワーク 26

GPUマネージドHPCクラスタの構築とベンチマーキング • 研究の⽬的 • マネージドHPCクラスタを商⽤サービスとして展開するとともに、 AI/HPC計算機基盤の性能検証と利⽤傾向分析を⾏う • 研究の意義 • ベンダー中⽴な国産のAI/HPC計算機基盤の実現と実運⽤データ
の公開により「持続可能なAI開発エコシステム」へ貢献する • 研究の⼿法など • 数百から1000基規模のGPUとEthernetベースの⾼速インターコネクトから成る複数のクラスタを構築し、 HPL/HPC-MxP/HPCG/MLPerf Trainingによる多⾓的な性能評価とジョブ履歴データとテレメトリの分析を⾏う AI/HPCクラスタ「さくらONE」の構築と性能検証コンピューティング・ネットワーク f-konishi, tak-yamashita, y-tsubouchi, hi-tsuruta 27

信頼性向上のためのAI/HPC特有のオブザーバビリティ技術の確⽴ • 研究の⽬的 • クラウドネイティブ分野と⽐較して不⾜しているAI/HPC 特有のシステム観測⼿法を確⽴する • 研究の意義 • アプリケーション、GPUサーバ、ネットワーク、スト
レージなどの⼀連の処理の中でボトルネックや障害の原因を特定できる • 研究の⼿法など • 「さくらONE」を対象にテレメトリーデータを収集・可視化するシステムを構築する AI/HPCクラスタのためのSRE コンピューティング・ネットワーク y-tsubouchi 28

AI向け演算精度アーキテクチャの活⽤と、HPC向けレガシーコードのGPU向け最適化 • 研究の⽬的 • マネージドHPCクラスタ「さくらONE」の安定的な運⽤体制を確⽴し、ユーザが容易にかつ効率的にGPUリソースを利⽤できる環境の開発・整備を⾏う • 研究の意義 • ユーザがHPCインフラ構築の複雑さから解放され、本来のシミュレーション研
究開発やAI学習といった⽬的に専念できる環境を提供することで、新たな価値創出や社会安全の推進に寄与する技術の実装に関われる • 研究の⼿法など • GPU演算精度のAI特化への対策として「尾崎スキーム」を調査し、既存HPC コードへの実装・評価を⾏い、HPC／AIモデル利⽤の両⽅でGPU計算基盤の利⽤効率化を探求 • AIエージェントを活⽤し、HPC向けレガシーコードをGPUのアーキテクチャ／コンパイラ／ライブラリ向けに最適化するための⼿法の検討と確⽴ GPU計算基盤の性能最適化研究を説明する図 tak-yamashita, f-konishi コンピューティング・ネットワーク 29

ランタイム拡張機能をランタイム⾮依存に実現セルフホストに特化したWebAssemblyランタイム y-nakata (公⽴はこだて未来⼤学との共同研究) Self-hosted Runtime Host Runtime (E.g., Wasmtime)
Wasm Bytecode コンピューティング・ネットワーク • 研究の⽬的 • Wasmに存在する多くの新仕様と仕様対応に差がある多様なランタイム実装のギャップを埋める • 多くのランタイムに適応可能なランタイム拡張 • 研究の意義 • ランタイムや性能最適化の差異を意識せずにランタイム拡張や最新仕様への対応が可能 • 研究の⼿法など • WasmにコンパイルされたミニマムなセルフホストWasmランタイムに拡張機能を実装 30

アプリケーションのライブマイグレーション y-nakata (公⽴はこだて未来⼤学との共同研究) 異種環境なクラウド・エッジ間ライブマイグレーションに関する研究 • 研究の⽬的 • 異なるCPUアーキテクチャやランタイム、最適化⽅式間での効率的なライブマイグレーションを可能にする • 研究の意義
• 特性の異なるコンピューティングリソースを組み合わせ低遅延・⾼速処理を両⽴するアプリケーションを実現可能 • 研究の⼿法など • アーキテクチャ中⽴な仮想命令セットアーキテクチャである WebAssembly（Wasm）を活⽤ • 各環境に特化したWasmランタイム間でライブマイグレーションを実現コンピューティング・ネットワーク 31

軽量なOS互換レイヤによってOS固有の脆弱性を悪⽤した攻撃を防⽌異種OS機能連携によるコンテナサンドボックス機構 y-nakata (公⽴はこだて未来⼤学との共同研究) コンピューティング・ネットワーク • 研究の⽬的 • コンテナの軽量さを維持しつつコンテナの隔離性を向上させるサンドボックス⼿法
• 研究の意義 • クラウドのようなマルチテナント環境で悪意のあるユーザによる攻撃を防ぎながらアプリケーション性能や起動時間への影響を最⼩限に • 研究の⼿法など • 軽量なOSエミュレーション機構（FreeBSD）を⽤いてコンテナを実⾏するOSとコンテナから⾒えるOSを別のものに • OSカーネル固有の脆弱性を悪⽤した攻撃を失敗させる 32

共有環境におけるレピュテーションの可視化と送信品質の⾃動制御を実現する • 研究の⽬的 • メール基盤における共有IP、共有ネットワークのレピュテーション問題の緩和を⽬指す • 研究の意義 • 共有メールホスティングやクラウド環境での
メール送信で⾼到達率や低遅延といった品質向上につながる SMTPにおける可観測性を向上させる透過型Proxy t-oda（九州⼤学と岡⼭⼤学との共同研究） • 研究の⼿法 • SMTPのコマンドレベルで制御可能な透過型Proxyを開発することで、可観測性を向上させ柔軟な対応を⾃動化する透過型Proxy Warpの動作概要図コンピューティング・ネットワーク ※レピュテーション：メール送信者評価 33

宣⾔的デプロイメントを可能にするミドルウェア CloudNativeアプローチをスタンドアロンなミドルウェアで実現する • 研究の⽬的 • アプリケーションの最新バージョンをアプリケーション⾃⾝が継続的に最新となるよう動作する • 研究の意義 •
⾮Kubernetes環境でのデプロイメントにおいて⾼いセキュリティと⾃動化による運⽤効率化を実現する • 研究の⼿法 • サーバーモードではファイルディスクリプタを新旧バージョンで共有しシグナルによって旧をグレースフルシャットダウンさせ、コンテナモードではTCPプロキシとしてリクエストを適切に新旧振り分けを⾏う t-oda ミドルウェア Dewyの動作概要図コンピューティング・ネットワーク 34

エッジ・Fogコンピューティングに関する研究 • 研究の⽬的 • エッジ（地域DC）・クラウドをシームレスに利⽤できるコンピューティング環境の実現エッジや現場のコンピューティングリソースとデバイスのシームレスな結合を⽬指す地域IP網 =フレッツ網コア網＝インターネット網
携帯電話網クラウドクラウドクラウド⾃営網地域設置DC （有線）キャリアネットワーク携帯ネットワーク • 研究の意義 • どんな場所でもコンピューティングの恩恵を受けられる世界の実現（フィジカルAI向け） • コンピューティングおよびネットワーク利⽤の最適化（地産地消化） • 研究の⼿法など • 地域網や携帯網から利⽤可能な地域DCへのネットワーク接続を実現 s-kikuchi コンピューティング・ネットワーク 35

量⼦暗号通信のクラウド・DCへの導⼊に関する検討 • 研究の⽬的 • 量⼦暗号通信に対応した、⾼セキュアクラウド、またサービスプラットフォームの実現 • 研究の意義 • 医療・ゲノム、ヘルスケア、政府、防衛など、⾼セキュリティが求められる顧客向けに、クラウドサービスを提供可能にする
• 研究の⼿法など • 「量⼦クラウド」構想の⼀翼を担う形で、データセンター間の量⼦暗号通信⽅式、データセンター間横断の秘密分散ストレージ、それ等を組み込んだサービスプラットフォームの試作検討を実施する • 量⼦暗号通信⽅式については、複数⽅式（OTP⽅式、QKD⽅式）をデータセンター間通信に適⽤するトライアルを実施する安全性の担保された通信路によって接続されたセキュアクラウドサービスを実現 s-kikuchi コンピューティング・ネットワーク 36

クラウドやAI/HPCシステム特化型の時系列基盤モデルの開発 • 研究の⽬的 • 「さくらONE」などの複数の商⽤サービスから多次元時系列テレメトリーデータや熟練運⽤者の作業記録を統合解析し、特化型の時系列基盤モデルを開発する • 研究の意義 •
障害の将来予測、検出、原因特定などの運⽤やリソース最適化を基盤モデルにより⾃律化できる • 研究の⼿法など • 時系列テレメトリーデータに適したトークン化⼿法や深層学習アーキテクチャを設計する • Chaos Engineeringにより実験環境で障害を意図的に発⽣させ⾃動検証するクラウド⾃律運⽤基盤の構築 f-konishi, y-tsubouchi, hi-tsuruta, tak-yamashita データ・機械学習・⼈⼯知能（AI） 37

⼤規模⾔語モデル(LLM)を⽤いた知識抽出と構造化 hi-tsuruta 科学論⽂などの専⾨⽂書から材料の合成⼿順や物性を抽出・構造化する⼿法の研究開発 • 研究の⽬的 • LLMを⽤いて、材料科学の専⾨⽂書から有⽤な情報を⾼精度に抽出し、機械可読なデータベースを構築する • 研究の意義
• 膨⼤な専⾨⽂書に散在する知識を抽出・構造化することで、データ駆動型研究を加速できる • 研究の⼿法など • LLMを⽤いた⾃然⾔語処理により、⽂書中の合成⼿順・材料物性を⾃動的に抽出する • 取得データをJSON-LDなどの標準フォーマットで構造化し、データベース化するデータ・機械学習・⼈⼯知能（AI） 38

データのライフサイクルデザインに関する研究 f-konishi リサーチデータのライフサイクルデザインを最適化し、データ作成・保存・利⽤・移動・同期・修正・共有・⻑期保管・破棄の効率性と持続可能性を向上させる。 • 研究の⽬的 • 計算資源の最適化/データ管理の標準化と⾃動化/ストレージのアクセスの最適化/エネルギー効率の向上/データの保全とセキュリティ強化 •
研究の意義 • 近年のAI技術の⾶躍の源となるあらゆるデータに対して、その全ライフステージでのデザインを⾏う事で、意図した利活⽤を実現する事ができる • 研究の⼿法など • データフロー分析：研究データの⽣成からアーカイブまでの各フェーズをモデル化し、計算リソースの利⽤効率をシミュレーションする • ワークロード最適化：データ転送や計算負荷のボトルネックを特定し、 HPCクラスタ内での適切なタスクスケジューリングを設計 • メタデータ管理の強化：HPC環境向けに適したメタデータレイヤーを設計し、データの検索・アクセスの効率を向上データ・機械学習・⼈⼯知能（AI） 39

実験科学者の試⾏錯誤を加速する電⼦実験ノート • 研究の⽬的 • 散らばる実験記録を構造化・集約・関連付けし、いつでも再利⽤・再現できる知⾒へと転換する電⼦実験ノートを開発する。 • 研究の意義 •
「あのデータ、どこだっけ？」を解消：散らばる情報を⼀元管理し、記録の再利⽤が容易になる • 「これ、どうやったんだっけ？」を解消：実験記録を構造化し、再現性を向上できる • 研究の⼿法など • 5つのアプローチで段階的に開発： • 集約：あらゆる記録を1つのノートに集める • 構造化：「積み⽊」のように知⾒を整える • 関連付け：データやプロセスを紐づける • 利⽤：ノート上でデータ加⼯・可視化する • 安⼼：安⼼できる場所で管理する電⼦実験ノートeurecoの開発研究を説明する図 m-kumagai データ・機械学習・⼈⼯知能（AI） 40

チェンジラボラトリーによる組織改⾰のプロセス研究函館⻄⾼校校内研修に着⽬して • 研究の⽬的 • 研究の意義 • 変化する⽣徒の学びに対し、教師の学びが追い付いていないという課題を組織的に克服する事例創出によって学校改⾰の⽷⼝を発⾒できる
• 研究の⼿法など • 校内研修にチェンジラボラトリーを導⼊、参加教師と協働でプロジェクトを作り、実践する教育・社会・組織研究を説明する図 m-asakura • 教師の校内研修にチェンジラボラトリー1を適⽤し、組織改⾰のプロセスや教師の変⾰的エージェンシー2の変化を分析する →校内研修のデザイン実験拡張的学習のサイクルにおける学習諸⾏為の継起出典：Engeström（2016 p.49） 1. 拡張的学習のサイクルに基づき、組織の抱える⽭盾を打ち破り新たな解決策のモデルを⽣み出す介⼊研究⼿法 2. 既存の⾏動枠組みを打破し、システムの⽭盾を乗り越え変⾰の主導権を握ろうとする協働の意思と実践的努⼒ 41

◆なぜ校内研修改⾰が必要なのか • 総合的な探究の時間などの正解のない学びに対し、従来の学校構造では⼗分に対応（評価、進度や内容の個性化）ができないため、良い実践事例があってもカリキュラムの「カプセル化」「⼿順化」が起こり後に形骸化する • 校内研修は教師が⾃発的、組織的に学ぶ唯⼀の場であり、ボトムアップで改⾰が可能なコミュニティであるが、従来型学校構造（ヒエラルキー、知識・⽂化の再⽣産）に縛られている
• 校内研修の改⾰を「教師の探究活動」として実施することにより、⽣徒に求められる学びへの転移が期待できる • 校内研修改⾰の成功体験は、学校改⾰をボトムアップで進める変⾰的エージェンシーを⽣み出すチェンジラボラトリーによる組織改⾰のプロセス研究（続） m-asakura 交換価値 vs 使⽤価値テストの点数を上げる偏差値の⾼い⼤学への合格者数を増やすじっくり探究する働き⽅改⾰のための効率化⾼校の存続をかけた魅⼒化出世、昇給保護者の圧⼒不登校対策いじめ問題⽣徒の⼈⽣と幸せ etc… 学校のシステムにある⽭盾に着⽬し、それを打破しようとすることによってブレークスルーを⽣み出す教育・社会・組織函館⻄⾼校校内研修に着⽬して 42

© SAKURA internet Inc. 44 AI需要の急拡⼤と電⼒の壁 • ⽣成AIの普及によるデータセンター(DC)建設(計画)ラッシュ • AI⽤DCには莫⼤な電⼒(例：1DCあたり100メガワット)が必要
• 電⼒供給網の逼迫により、新規DC建設は困難な状況（電気がない）ハイパースケール型DC・リテール型DC それぞれの累積ラック数（2017年〜 2031年） OCCTO(電⼒広域的運営推進機関)による全国の電⼒重要想定

© SAKURA internet Inc. 45 再⽣可能エネルギーの偏在と出⼒抑制 • 太陽光発電は順調？に導⼊が拡⼤している • 地域・季節・時間帯により発電量には偏りがある
• 「電気が余っている場所」と「電⼒が必要なDC」がミスマッチ太陽光発電の⽇内変動と出⼒抑制（概念図）資源エネルギー庁：再⽣可能エネルギーの出⼒制御の抑制に向けて IUUQTXXXFOFDIPNFUJHPKQDBUFHPSZTBWJOH@B OE@OFXTBJFOFHSJE@TZVUVSZPLVTFJHZPIUNM IUUQTXXXNFUJHPKQTIJOHJLBJFOFDIPEFOSZPLV@HBT EFOSZPLV@HBTQEG@@QEG

© SAKURA internet Inc. 46 「ワット・ビット構想」 • 電⼒網（送電線）の増強には莫⼤なコストと時間がかかる • 通信線（ファイバ）の敷設コストは送電線の1/100
• 電気を運ぶのではなく、データ(DC)を電気のある場所へ運ぶ Transfer cost ... ... = Energy Productivity… Material >> Electricity >> Digital bits ( Power) (digital Function) x0000 : x00 : 1 100 1 By Digital Twin 8*%&ϓϩδΣΫτ׆ಈใࠂʢߐ࡚ઌੜʣΑΓ

© SAKURA internet Inc. 47 ワット・ビット構想の課題 • 太陽光発電は、天候・⽇照により出⼒が激しく変動する • 単⼀のDCでは安定したサービス提供が困難
• そこで：発電状況（電⼒余⼒）に応じて、複数のDC間で計算処理（ワークロード）を移動させる技術が必要に • →晴れている地域のDCにワークロードを送る

© SAKURA internet Inc. 48 既存電⼒系統の最⼤活⽤ APN／ワークロードシフト • ウェルカムゾーンの活⽤で既存系統を早期に最⼤活⽤
• APN（オール光ネットワーク）による拠点間連携を研究・実証 • AI負荷分散で天候・需給に応じた⾼度なワークロードシフト電⼒×通信×DC事業者三位⼀体連携 • 官⺠横断でワット・ビット連携を推進し、『GX』『レジリエンス』『国際展開』を視野に整備 • ”電⼒“”通信“”DC事業者“が⼀体で計画・技術・制度を連携 DCが電⼒調整の担い⼿へ • 蓄電池・コジェネ等の導⼊で需給調整（DR）に貢献 • 余剰電⼒を活⽤し、分散DC でレジリエンスと効率を両⽴ワット・ビット連携が切り拓く新しいデータセンター像参考：経産省・総務省『ワット・ビット連携官⺠懇談会取りまとめ1.0』（2025/6/12） https://www.meti.go.jp/press/2025/06/20250612001/20250612001.html / PDF: https://www.meti.go.jp/shingikai/economy/watt_bit/pdf/20250612_1.pdf

超個体型データセンターの実現に関する研究 • 研究の⽬的 • ⾃律的に結合・離合しつつシームレスなタスク処理を実現できるシステムの構築⾃律的に分散と集中のハイブリッド構造を取れるデータセンターシステムの実現 • 研究の意義 • クラウドによる無制限のバックエンド処理を可
能にしつつ、必要・状況に応じてコンピューティングリソースの局所利⽤も⾃動実現する • 研究の⼿法など • ⾃然由来エネルギーの揺らぎなども考慮したデータセンターへのタスクスケジューリング⼿法の開発分散し増⼤するコンピューティングインフラコンピューティングリソース（PC）コンピューティングリソース（MEC）コンピューティングリソース（Device）クラウドエッジ現場超個体型データセンター（超個体型データセンターOS）遍在するデータと、それを処理するプロセスが⾃律分散する現場センターコンピューティング・ネットワーク 49 ワークロードシフトを実現するための具体的な実装形態として「超個体型データセンター」を研究開発する

「超個体型データセンターと超個体データワールド」コンセプト 1. 現在はデータセンターに巨⼤なコンピューティングリソースが存在しているが、今後は、レイテンシ・セキュリティ・コスト等の要件から、あらゆる場所や社会（組織）にコンピューティングリソースが溶け込んでいくことになる。 2. それら分散したコンピューティングリソースは、単独でコンピューティングパワーを提供するにとどまらず、その場所や社会の要求に応じて、⾃律的に、分散あるいは有機的に結合し、現場・クラウドそれぞれが縦横に結びついた
ハイブリッド構造をとれるように機能する。 3. そのようなシステムにより実現されるものは、バックエンド側が有機的に結合することによりかつてないマシンパワーとリソースによってデータを処理し、それにより⼈々の⾝近でリアルタイムかつインテリジェンスに社会を⽀える超個体データワールドである。 4. さくらインターネット研究所はこのようなビジョンのもと、超個体データワールドを実現する超個体型データセンターシステム、それらを統括管理する超個体型データセンターOS等の研究開発を推進していく。 50

インターネット以前のネットワーク（1980年代）(1/3) サーバ : ホストコンピュータとダム端末 52 Lawrence Livermore National Laboratory, Attribution,
https://commons.wikimedia.org/w/index.php?curid=1565787による Retro-Computing Society of Rhode Island - 投稿者自身による作品, CC 表示-継承 3.0, https://commons.wikimedia.org/w/index.php?curid=7354001による https://openmedia.jp/blog/?p=336

インターネット以前のネットワーク（1980年代）(2/3) ネットワーク : 公衆電話網と広域パケット交換ネットワーク(X25) 53 公衆電話網 (PSTN/POTS) http://www.funkygoods.com/gara kuta/pc_8268/pc_8268.htm

インターネット以前のネットワーク（1980年代）(3/3) アプリ : ホストシステム、パソコン通信 54 http://jr7ibw.way-nifty.com/blog/2011/04/nifty-serve-dc7.html より公衆電話網 NIFTY-Serve のサーバ
各家庭のパソコン

LANをつないだネットワークの時代 (1990年代) (1/5) サーバ : UNIXサーバとクライアントネットワーク : LAN(Local Area
Network) アプリ : プリンタやファイルサーバの共有 55 Urpo Lankinen (User:Wwwwolf). - 投稿者自身による作品, CC 表示 2.5, https://commons.wikimedia.org/w/index.php?curid=1356567による Robert Harker - http://en.wikipedia.org/wiki/File:Sun3_60_Dis k_Tape.jpg, CC 表示-継承 2.5, https://commons.wikimedia.org/w/index.php ?curid=7216642による CC 表⽰-継承 3.0, https://commons.wikime dia.org/w/index.php?curi d=15503

LANをつないだネットワークの時代 (1990年代) (2/5) ネットワーク : UUCP (Unix-to-Unix-CoPy) アプリ : ネットニュースとメールの交換
56 サーバ LAN LAN LAN LAN UUCP接続 UUCP接続のための回線（ネットワーク）には、電話回線などを利⽤

LANをつないだネットワークの時代 (1990年代) (3/5) 57 ネットワーク : TCP/IP アプリ : よそのコンピュータを使う
(リモートログイン) LAN LAN LAN LAN TCP/IP接続のための回線（ネットワーク）には専⽤線接続を利⽤ TCP/IP接続

LANをつないだネットワークの時代 (1990年代) (4/5) 58 アプリ : WWW(World Wide Web)の発明 LAN
LAN LAN LAN TCP/IP接続 TCP/IP接続のための回線（ネットワーク）には専⽤線接続を利⽤コアネットワークを形成

LANをつないだネットワークの時代 (1990年代) (5/5) 59 アプリ : WWW(World Wide Web)の発明 http://www.os-museum.com/netscape/w31ncsamosaic.gif
http://netpr.jp/trend/1856/ LANをつないだネットワークの時代 (1990年代) (5/5)

インターネット商⽤開放 (1990年代後半) (1/3) • サーバ : 企業や⼤学が⾃社でUNIXサーバを持ち、そこにパソコンでアクセスする。 • ネットワーク
: 公衆網経由でのモデムによるダイアルアップ (PPP)接続。 60 サーバサーバサーバ⾃宅等ダイアルアップ（PPP）接続⼤学・企業LAN 公衆電話網 IPコア網

インターネット商⽤開放 (1990年代後半) (2/3) • ネットワーク : インターネットサービスプロバイダ（ISP）の成⽴ 61 サーバ
⾃宅等ダイアルアップ（PPP）接続⼤学・企業LAN 公衆電話網 ISP IPコア網

ホームページを一覧にして集めたサービスが登場インターネット商⽤開放 (1990年代後半) (3/3) • アプリ :
⾃社サーバ、ISPサービスによるホームページ公開 • さくらインターネット創業 • アプリ : 検索エンジンの発明(Yahoo、千⾥眼、goo, google) 62 ISP 企業のホームページが増えていく個⼈のホームページが増えていく https://internet.watch.impress.co.jp/cda/ news/2008/06/09/19866.html よりサーバやホームページをレンタルできるサービス IPコア網

インターネット普及期 (2000年代) (1/2) • サーバ : 続々企業がホームページを⽴ち上げる。ホームページブームの到来。猫も杓⼦もインターネット。 • ネットワーク
: フレッツ網の利⽤拡⼤。ADSLによる常時接続。 • ネットワーク : iモードサービス。(モバイル網の成⽴と普及) 63 地域IP網 =フレッツ網 … コア網 ADSL 常時接続携帯電話網 … 様々なサイトとサーバ携帯電話＆i モード

インターネット普及期 (2000年代) (2/2) • アプリ : SNSが出始める。(Twitter, Facebook, GREE, MIXI)
64 地域IP網 =フレッツ網 … コア網携帯電話網 … 様々なサイトとサーバ Twitter Facebook mixi

スマホ時代の始まり (2000年代後半) (1/2) • サーバ : サーバが⼤規模になり始める。端末はスマートフォンに。 • サーバ :
AWSサービス開始(2004年︖) 65 地域IP網 =フレッツ網 … コア網携帯電話網 … SAKURA internet

スマホ時代の始まり (2000年代後半) (2/2) 2000年代後半の、エポックメーキング 66 https://www.itmedia.co.jp/mobile/articles/1708/10/news036.html

クラウド時代 (2010年代) (1/3) • 仮想化技術の普及 • クラウド上でスマホアプリの中⾝(サービス)を動かす 67 地域IP網 =フレッツ網
コア網携帯電話網クラウドクラウドクラウド

クラウド時代 (2010年代) (2/3) サーバ : 「さくらのクラウド」サービス開始(2011年) 68 地域IP網 =フレッツ網コア網
携帯電話網クラウドクラウドクラウド

クラウド時代 (2010年代) (3/3) ネットワーク : 携帯電話網においてLTE(4G)サービス開始 69 地域IP網 =フレッツ網コア網
携帯電話網 =LTE(4G) クラウドクラウドクラウド

IoT時代 (2010年代後半) • ⼈(スマホ、PC)ではなく機械(モノ)がネットワークにつながるように • ビッグデータ解析、機械学習 70 地域IP網 =フレッツ網コア網
携帯電話網クラウドクラウドクラウド IoT = Internet of Things GPGPU搭載サーバ

現在のインターネットのかたち 71 地域IP網 =フレッツ網コア網携帯電話網クラウドクラウドクラウド IoT
• サーバ︓⽣成AIがクラウドの主役に • ネットワーク︓コア網・地域網・携帯電話網で構成 • アプリ︓スマホアプリ、動画、IoT制御、フィジカルAI GPGPU搭載サーバ⽣成AI =

さくらインターネット研究所の取り組み事例紹介その３︓エッジコンピューティング IoTの登場をキーポイントに、ネットワークの質的変化が求められるように 72 クラウド IoT 往復伝搬遅延＝間に合わない︕︕
【参考】 • ⾃動⾞(100km/h)が1秒に進む距離︓28m • ⾃動⾞に対応できる応答速度︓10msec • ⼈(4.8km/h)が1秒間に進む距離︓1.3m • ⼈に対応できる応答速度︓100msec • ⼈の反応速度︓300msec • ⼈がWebページに待てる時間 : 3秒⼈の反応速度より早く反応するシステムが求められる

さくらインターネット研究所の取り組み事例紹介その３︓エッジコンピューティング • フィジカルAIの実現には、クラウドを現場側に延伸していくエッジコンピューティングが不可⽋ 73 地域IP網 =フレッツ網コア網携帯電話網クラウド
クラウドクラウドフィジカルAI エッジコンピューティング実現のための関連研究開発を推進 GPGPU搭載サーバ⽣成AI =

エッジ・Fogコンピューティングに関する研究 • 研究の⽬的 • エッジ（地域DC）・クラウドをシームレスに利⽤できるコンピューティング環境の実現エッジや現場のコンピューティングリソースとデバイスのシームレスな結合を⽬指す地域IP網 =フレッツ網コア網＝インターネット網
携帯電話網クラウドクラウドクラウド⾃営網地域設置DC （有線）キャリアネットワーク携帯ネットワーク • 研究の意義 • どんな場所でもコンピューティングの恩恵を受けられる世界の実現（フィジカルAI向け） • コンピューティングおよびネットワーク利⽤の最適化（地産地消化） • 研究の⼿法など • 地域網や携帯網から利⽤可能な地域DCへのネットワーク接続を実現 s-kikuchi コンピューティング・ネットワーク 74

© SAKURA internet Inc. • さくらインターネット研究所が主導して構築した、マネージド HPCクラスタ • ＝スーパーコンピュータ •
研究所開発技術の投⼊先でもあるさくらONE 、とは 79 HPCクラスタ概念図 https://www.weka.io/learn/guide/hpc/what-are-hpc-and-hpc-clusters/

© SAKURA internet Inc. スーパーコンピュータ、とは（1/2） 80 スーパーコンピュータとは、極めて⾼速な計算能⼒を持つコンピュータであり、主に科学技術計算、⼤規模なシミュレーション、気象予測、⼈⼯知能の学習、原⼦核研究など、⾮常に膨⼤なデータ処理や⾼精度な計算を必要とする分野で使⽤されます。
特徴的な点： • 膨⼤な並列処理能⼒（数⼗万〜数百万のプロセッサを同時に動作） • ⾼速な通信・データ転送性能 • 専⽤に最適化されたハードウェアとソフトウェア構成 • 特定の科学技術課題に特化した構造を持つ場合もある

© SAKURA internet Inc. スーパーコンピュータ、とは（2/2） 81 項⽬ PCクラスタ型（現代型）専⽤ハードウェア型（旧型）構成要素
汎⽤CPUやGPUを多数組み合わせたノード専⽤設計のプロセッサ・アーキテクチャ設計思想商⽤サーバやPC部品を多数連結（クラスタ）性能最適化を重視した⼀体型設計拡張性・柔軟性⾼い（ノード単位で増設可能）低い（設計に応じた固定構成）コスト⽐較的低コスト（商⽤部品活⽤）⾮常に⾼価（専⽤開発・製造）開発期間短い（既存技術の組み合わせ）⻑い（専⽤設計・開発が必要）メンテナンス容易（部品交換がしやすい）難しい（特注部品、供給困難）性能効率（理論性能/実効性能）効率は低め（通信・同期のオーバーヘッド）⾼効率（密結合・⾼速通信）代表例 Fugaku（富岳）、Summit、 Frontierなど Earth Simulator、Cray-1、SXシリーズなどネットワーク接続⾼速インターコネクト（InfiniBand など）内部バスや独⾃ネットワーク設計⽐較：PCクラスタ型 vs 専⽤ハードウェア型スーパーコンピュータ

© SAKURA internet Inc. • さくらのデータセンター内に展開 • NVIDA社GPU H100を8基搭載したノードｘ100ノードで構成 •
GPU間のインターコネクトを⾼⽕⼒PHY H100構成の倍 (400Gbps x 8)に強化 • ストレージ⽤に独⽴したIF • Slurmスケジューラ等（ソフトウェア）が整備 • LLMの学習⽤に最適化された構成さくらONE構成 83

© SAKURA internet Inc. • ⾃家⽤⾞で乗り付ける事ができるスケルトンのコテージ
• ⾃分の好きな壁紙や家具を置ける • 隣近所のコテージを親族⽤に確保したりできる⾼⽕⼒PHYとさくらONEの⽐較（イメージ） 84 • 50部屋ある棟が、2棟あるホテル • ロビーやエレベータ、コインランドリーやプールのような共有スペース • 契約した部屋の数だけ予約され、直ぐに利⽤する事ができる • 必要なサービスは概ね揃っていて、メンテナンスしてくれたり、相談にのってもらえるコンシェルジュが常駐している

© SAKURA internet Inc. Linux上で動くジョブスケジューラー • 世界中の多くのスーパーコンピュータやコンピュータクラスタで利⽤されている • ジョブは事前に分割（並列化）しておく必要がある Slurm
(スラーム) Simple Linux Utility for Resource Management 86 IUUQTTMVSNTDIFENEDPNPWFSWJFXIUNM

© SAKURA internet Inc. ノード（サーバ１台）の内部構成 88 PCIe Gen5 x16 の転送速度
(双⽅向)は 128 GB/s NIC(インターコネクト⽤)の転送速度は、400 Gb/s (=50 GB/s) GPU間の相互接続である NVSwitchの転送速度は1.8 TB/s

© SAKURA internet Inc. GPU間のRDMA通信 89 3%." 3FNPUF%JSFDU.FNPSZ"DDFTT ͱ͸ɿ$16Λհͣ͞ʹɺ͋Δϗετ΍ αʔόʔͷϝϞϦ͔Βผͷϗετ΍αʔόʔͷϝϞϦʹ௚઀ϝϞϦɾΞΫηεΛՄ
ೳʹ͢Δ௨৴ํࣜ IUUQTRJJUBDPN'4DPN@+BQBOJUFNT DBDBFGCDGF

© SAKURA internet Inc. インターコネクトネットワークの構成 90 このような構成をRail- Optimized Topologyと呼ぶこの部分のネットワーク制御
にはEVPN (Ethernet VPN) が⽤いられる

© SAKURA internet Inc. インターコネクトネットワークの構成⽅法 94 • NIC越しのRDMAを実現する技術 • ２種類ある（本当は3種類あるがiWARPは省略）
• InfiniBandは、専⽤ネットワークで⾼いスループットと低いレイテンシーを実現できる通信⽅式。ただし⾼価。 • RoCE(v2) (RDMA over Converged Ethernet)は、Ethernet技術を⽤いて（そこそこ）⾼スループットとレイレイテンシーを実現している通信⽅式。汎⽤機材(NIC/スイッチ)を利⽤できる。

© SAKURA internet Inc. RoCEv2（RDMA over Converged Ethernet） 95 RoCE(v2)は、Ethernet上にRDMAを流すための通信⽅式。v2ではUDPベース
となり、L2/L3のネットワーク上で利⽤できるようになった。

© SAKURA internet Inc. RoCEv2（RDMA over Converged Ethernet） 96 RoCE(v2)では、Ethernetでロスレス通信を実現するために、スイッチのフロー制御
であるPFC(Priority-based Flow Control)を有効にする(利⽤する)必要がある。

© SAKURA internet Inc. さくらONEの注⽬すべき点 99 • インターコネクトネットワークがEthernetで構成されている点 • 更に、オープン規格のSONiCベースで構成されている点
• TOP500の順位のうち、Ethernetベースで構成されているシステム(HPE Slingshotを除く)に限れば２番⽬、更に、SONiCベースで限定すれば１番！

© SAKURA internet Inc. • データセンター業界の状況として、AIデータセンターが今後国⼒を⽀える存在になっていくことを解説 • さくらインターネットは⽇本においてAIデータセンターを⽀える存在として機能していくことを説明
• その中で、さくらインターネット研究所がどの様な研究開発を推進しているかを解説 • 研究所が⼿掛ける技術のうち、ワットビット、エッジコンピューティング、さくらONE（スパコン）について解説 • 業界と⽇本を⽀える気概のさくらインターネットの取り組みについて理解いただければ幸いですまとめ 100

© SAKURA internet Inc. ベンチマークについて 104 ベンチマーク：コンピュータの性能や処理能⼒を客観的に評価・⽐較するためのテストや指標のこと。スーパーコンピュータの性能⽐較のための、いくつかの国際的なランキングがある。 •
TOP500(LINPACK) • HPCG • HPL-AI • MLPerf • IO500 スパコンベンチマークで⾼いスコアを出すためには、システム全体を⻑時間にわたって⾼負荷で安定稼働させる必要があり、ベンチマーク結果には、単なる性能だけでなく信頼性の⾼さも反映されるとされる。

© SAKURA internet Inc. TOP500 :最も有名なスーパーコンピュータランキング 105 世界で最も⾼速なスーパーコンピュータを年に2回（6⽉と11⽉）ランキング形式で発表するプロジェクトで、1993年に始まったもの。このランキングでは「LINPACK （リンパック）」というベンチマークプログラムの実⾏性能が指標として使われる。
https://www.top500.org/ LINPACKでは、倍精度浮動⼩数点演算（⼩数点以下約16桁の精度で計算）に基づく処理速度を測定し、それによってコンピュータの「計算能⼒」を評価する。

© SAKURA internet Inc. HPCG : より実⽤的な処理に近いベンチマーク 106 近年の科学技術計算ではより複雑で通信やメモリアクセスが多い処理が求められることが増えており、LINPACKだけでは現実的な性能を評価しきれないという課題が
あった。そこでLINPACKに代わる新たなベンチマークとしてHPCG（High Performance Conjugate Gradients）が開発された。 https://www.hpcg-benchmark.org/ HPCGでは、「疎な⾏列（0が多い⾏列）」に対して、共役勾配法という⼿法を使って連⽴⼀次⽅程式を解く、という処理をモデル化している。LINPACKよりも現実に近い計算負荷や通信パターンを反映するため、実⽤性重視の性能指標として注⽬されている。

© SAKURA internet Inc. HPL-AI : AI時代のスーパーコンピュータ性能指標 107 近年の⼈⼯知能（AI）分野では、低精度演算（約5〜10桁程度の精度）でも⼗分な学習が可能であることが分かってきた。GPUやAI専⽤チップなどは低精度の演算器を多
数搭載し⾮常に⾼速に処理できるため、従来の倍精度ベンチマークでは最新のAI向けスーパーコンピュータの能⼒を⼗分に評価できないという課題が⽣まれた。そこで提案されたのが、 HPL-AI（High Performance Linpack for AI）。 https://hpl-mxp.org/ HPL-AI（High Performance Linpack for AI）は、LINPACKの基本構造を活かしながら、連⽴⼀次⽅程式の解法において低精度演算を許可し、最終的に反復改良（Iterative Refinement）という技術を使って、最終的な計算結果の精度を確保するベンチマーク。⾼速な低精度演算と、⾼精度な仕上げ処理を組み合わせた2段階構成で、AI時代におけるスーパーコンピュータの性能を評価する。

© SAKURA internet Inc. MLPerf : AIの実⼒を測る世界標準のベンチマーク 108 MLPerf（エムエルパフォーマンス）は、⼈⼯知能（AI）・機械学習（ML）モデルの性能を公平に評価するための国際的なベンチマークスイート。2018年に、Google、
NVIDIA、Meta（旧Facebook）、スタンフォード⼤学などの企業・研究機関が中⼼となって設⽴した⾮営利団体「MLCommons」が主催している。 MLPerfは、利⽤シーン（ターゲット）に応じた複数のカテゴリ分け（Training(学習)、Inference(推論)、Tiny/Edge(⼩型デバイス・組み込み)、Mobile(モバイル端末)）がある。 MLPerf Inference v5.0 ・2025年4⽉に発表された MLPerf Inference v5.0 では、これまでのAIモデルに加え、左記の新しいベンチマークワークロードが導⼊され、特に⽣成AIやLLM（⼤規模⾔語モデル）を重視した構成となっている。ベンチマーク名概要・特徴 Llama 2 70B (Interactive) 約700億パラメータのLLMを使った対話型AI向け推論。低レイテンシー（応答の速さ）も評価軸。 RGAT (Relational Graph Attention Network) ソーシャルグラフや薬物発⾒などに使われるGNNモデル。グラフ構造データを扱う新分野の評価。 PointPainting (3D Object Detection) ⾃動運転などのエッジAIで使われる、カメラ＋Lidar による3D物体検出。リアルタイム性が重視される。これらはすべて実世界のアプリケーションに即した処理内容となっている

© SAKURA internet Inc. IO500 :ストレージシステムの総合性能 109 IO500 は、スーパーコンピュータや⾼性能コンピューティング（HPC）システムにおけるストレージ性能を評価するための国際的なベンチマーク。
TOP500が計算性能（FLOPS）を指標にしているのに対し、IO500では、ストレージの読み書き速度やメタデータ処理性能など、実際のアプリケーションに近いI/O性能を総合的に測定する。 https://io500.org/

© SAKURA internet Inc. ベンチマークの種類まとめ 110 ベンチマーク⽬的評価対象特徴
TOP500 HPC全体の計算性能倍精度演算⻑年使われている定番ランキング HPCG 実アプリに近い負荷疎⾏列×共役勾配法通信やメモリアクセスも評価 HPL-AI AI/HPCハイブリッド低精度＋反復改良 AI向けチップの性能も反映 MLPerf AI性能評価実アプリのAIワークロード LLM・⽣成AI・GNNなども含む、実⽤性重視 IO500 ストレージ性能（I/O 性能）評価・⽐較するファイルの読み書き速度（帯域幅）- メタデータ処理性能（ファイル作成・削除など）実際のHPCアプリを模したリアルなI/O負荷- 総合スコア（幾何平均）で性能を集約

© SAKURA internet Inc. HPL(High Performance LINPACK)で⾼性能を引き出すには？ 111 HPLは複雑な数式（「連⽴⼀次⽅程式」）を⾼速に解くことで、コンピュータが1秒間にどれだけの計算を⾏えるか（FLOPS
‒ FLoating-point Operations Per Second）を評価する。このソフトは、⾮常に⼤きな⾏列（たとえば100万⾏×100万列のような）を使って計算を⾏う。そして、それを複数のコンピュータ（またはCPU/GPUのコア）で分担して処理する。したがって、HPLで⾼性能を引き出すには... • できるだけ⼤きな⾏列サイズ（N）を使う • ⾼速な数値計算ライブラリ（BLASなど）を使う • プロセス格⼦（PとQ）を適切に選び、通信の無駄を減らす

© SAKURA internet Inc. プロセス格⼦とその配置 112 HPLでは、参加するプロセス（≒並列で動く作業ユニット）をP⾏×Q列のグリッド状（格⼦状）に並べて管理する。これを「プロセス格⼦」と呼ぶ。例えば、8個のプロセスを使う場合には、次のような配置が考えられる。 •
P=2, Q=4 (2⾏4列) • P=4, Q=2 (4⾏2列) • P=1, Q=8 (1 ⾏8列) このプロセス格⼦を単位にして、ＮｘＮの巨⼤な⾏列を複数のプロセスに分割して処理をするのがHPLの実装になっている。この配置は、計算性能や通信効率に影響する重要な設計ポイント

© SAKURA internet Inc. PとQの設計⽅針 113 HPLでは、⾏列をこのP×Qの格⼦に沿って分割して配置し、それぞれのプロセスが⾃分の担当分を計算する。計算の中には、 • ⾏⽅向に情報を送る（Qに依存）
• 列⽅向に情報を送る（Pに依存）といった通信（データのやり取り）が発⽣する。つまり、P,Qのバランスによって、 • 通信が効率的にできるか • 計算の負荷が均等に分散されるかが決まってくる。⼀般には、PとQの⽐率が偏りすぎない（例えば、P≒Qのように近い値）⽅が良いとされる。加えて、HPLでは、プロセス間の通信に「バイナリ交換（binary exchange）」アルゴリズムが使⽤されている。このアルゴリズムは、プロセス数が2の累乗である場合に最も効率的に動作する。具体的には、プロセス数が2の累乗であると、通信ステップ数が最⼩限に抑えられ、全体の通信時間が短縮される。

© SAKURA internet Inc. PとQの設計の実際（さくらONEの場合） 114 (ノード、GPU数(ノード数x8)、P、Q)の組み合わせで、 88、704、32、22 92、736、16、46 92、736、
8、 92 96、768、32、24 96、768、16、48 96、768、 8、96 98、784、16、49 と試して、最終的には (98、784、16、49)が最良。

東京大学工学部計数工学科、計数工学特別講義の説明資料

東京大学工学部計数工学科、計数工学特別講義の説明資料

More Decks by KIKUCHI Shunsuke

Other Decks in Research

Featured

Transcript