Upgrade to Pro — share decks privately, control downloads, hide ads and more …

東京大学工学部計数工学科、計数工学特別講義の説明資料

 東京大学工学部計数工学科、計数工学特別講義の説明資料

2026/04/14に実施した、東京大学工学部計数工学科の学生さん向けの、計数工学特別講義の説明スライドです。

データセンター業界を取り巻く状況の説明、また、さくらインターネット研究所の研究テーマの紹介、さらに、ワットビット、エッジコンピューティング、さくらのスーパーコンピュータ(さくらONE)などについて紹介しています。

Avatar for KIKUCHI Shunsuke

KIKUCHI Shunsuke

April 14, 2026

More Decks by KIKUCHI Shunsuke

Other Decks in Research

Transcript

  1. © SAKURA internet Inc. • 本資料では、クラウド基盤を提供するさくらインターネットの視点 から、⽣成AIの普及で激変するデータセンター業界の最新動向を解 説し、その上で、計算資源の安定供給という課題に対し、研究開発 の側⾯からどうアプローチしているのか、研究所の取り組みを詳述 します。更に具体的に、ワットビット構想やエッジコンピューティ

    ング、最新スパコン「さくらONE」による挑戦について説明しま す。 • データセンター業界状況とさくらインターネットの取り組み • さくらインターネット研究所の研究開発の紹介 • ワットビット、エッジコンピューティング、さくらONEの概要 はじめに(本資料の構成) 2
  2. © SAKURA internet Inc. 菊地 俊介 (東京都出⾝) ⾃⼰紹介 3 所属

    さくらインターネット研究所 学歴 早稲⽥⼤学⼤学院 理⼯学研究科 電⼦・情報通信学専攻 修⼠課程修了 早稲⽥⼤学⼤学院 国際情報通信研究科 博⼠課程単位取得退学 職歴 富⼠通(株)富⼠通研究所に就職 ネットの研究やったり、SEやったり、NICTに出向したり、 トイレIoT作ったり さくらインターネットに転職 データ流通(FIWARE, NGSI)、OpenFogコンソーシアム(標準化)、 量⼦(アニーリング)コンピュータ、Erlang/Elixir、分散システム 専⾨ エッジ・Fogコンピューティング(分散系システム)、スマートシティ ビジョナリーとして技術・社会、会社の将来を思い描く 新規領域調査、PoC実施、社内適⽤コンサル、講師・講演 趣味 新技術調査、読書、最近はガンプラ作り @kikuzokikuzo https://note.mu/kikuzokikuzo https://www.facebook.com/ kikuzokikuzo https://twitter.com/kikuzokikuzo
  3. © SAKURA internet Inc. さくらインターネットについて 5 商 号 さくらインターネット株式会社 (SAKURA

    internet Inc.) 代表取締役社⻑ ⽥中 邦裕 創 業 1996年12⽉23⽇ 設 ⽴ 1999年8⽉17⽇ 事 業 内 容 クラウドコンピューティングサービスなどの提供 データセンター運営 本 社 所 在 地 〒530-0011 ⼤阪府⼤阪市北区⼤深町6-38 グラングリーン⼤阪 北館 JAM BASE 3F 拠 点 ⼤阪(本社)、東京、北海道(データセンター)、福岡、沖縄 資 本 ⾦ 112億8,316万円 上場証券取引所 東京証券取引所プライム市場(証券コード:3778) 従 業 員 数 連結 1,116名 (2025年9⽉末)
  4. © SAKURA internet Inc. 主な事業領域の変遷 6 インターネット黎明期より顧客ニーズの変遷とともにサービスの軸⾜を変えながら成⻑ 0 200 400

    600 800 1000 1200 0 5,000 10,000 15,000 20,000 25,000 30,000 35,000 40,000 '00/3期 '01/3期 '02/3期 '03/3期 '04/3期 '05/3期 '06/3期 '07/3期 '08/3期 '09/3期 '10/3期 '11/3期 '12/3期 '13/3期 '14/3期 '15/3期 '16/3期 '17/3期 '18/3期 '19/3期 '20/3期 '21/3期 '22/3期 '23/3期 '24/3期 '25/3期 '26/3期 サービスカテゴリ別売上⾼・従業員数 クラウドサービス GPUクラウドサービス 物理基盤サービス その他 従業員数 (売上⾼ / 単位:百万円) (従業員数 / 単位:⼈) ( 予 想 ) レンタル サーバ事業 で創業 サーバ ビジネス へ転向 クラウド サービス へ集中 事業の 多⾓化 効率化追求 →停滞期 経営者として成⻑ コミット →再び成⻑基調へ コロナ禍 クラウド集中 成⻑へ向けた 変遷
  5. © SAKURA internet Inc. 飽和しつつあるIT市場 7 -80% -60% -40% -20%

    0% 20% 40% 60% 80% 100% 120% $- $1,000 $2,000 $3,000 $4,000 $5,000 $6,000 $7,000 2021Q 1 2021Q 2 2021Q 3 2021Q 4 2022Q 1 2022Q 2 2022Q 3 2022Q 4 2023Q 1 2023Q 2 2023Q 3 2023Q 4 2024Q 1 2024Q 2 2024Q 3 2024Q 4 2025Q 1 世界のクラウド/SaaS業界における四半期新規ARR増加額と その前年同期⽐成⻑率 新規ARR増加額 前年⽐成⻑率 線形 (前年⽐成⻑率) 引⽤ https://www.saastr.com/the-great-saas-slowdown-what-q1-2025-numbers-reveal-about-the-cloud-software-market/ IT市場の成⻑率は鈍化している 成熟したIT市場 AIの台頭 IT投資、SaaSの減速 AIによる新しい市場 加 速 す る AI の 流 れ
  6. © SAKURA internet Inc. 8 AI-Enabled vs AI-Native AI-Enabled AIの役割

    データ活⽤ 設計基準 補助ツール 効率化の⼿段 既存プロセスへの追加・置換 特定の業務改善に利⽤ 意思決定 AIの役割 設計基準 データ活⽤ 意思決定 ⼈間が主導 AIがサポート ビジネスの根幹 プロダクトそのもの AI主導の根本的な再設計 ビジネス全体を動かす燃料 として活⽤ AIエージェント主導 ⼈間はオーケストレーター AI-Native AI-NativeではAIは「導⼊する対象」ではなく「前提条件」 AIが⽌まる=事業が⽌まる
  7. © SAKURA internet Inc. 9 AIの社会実装「AIはコンピュータの中だけではない時代へ」 ChatGPTなどのAIエージェントが「デジタル同僚」としてオフィスに浸透 次の波は「AIが⾝体を持ち、現実空間で⼈と共に働く」時代 となる これまでの10年:デジタルAI

    ChatGPTやCopilotなどの「デジタル同僚」がオフィスに浸透。 コンピュータの中だけで完結する情報処理・⽣成が中⼼。 これからの10年:フィジカルAI AIが「⾝体」を持ち、現実空間で⼈と共に働く時代。 認識・判断に加え、物理的な⾏動を伴う「ロボット同僚」が登場する。 これまではAIが頭脳を得た10年 これからは⾝体を得る10年になる
  8. © SAKURA internet Inc. 10 ⽐較:デジタルAI vs フィジカルAI デジタルAI AIの居場所

    協働形態 コミュニケーション 画⾯の中 Inside Screens テキスト・⾳声 効率化・代⾏ Text / Voice 必要な能⼒ Efficiency / Automation AIの居場所 コミュニケーション 協働形態 必要な能⼒ 情報処理 現場(空間) ⾝体・動作・空気感 共創・補完 物理的理解・倫理・安全 Information Processing Physical World Body / Motion / Presence Co-creation / Supplement Physical Understanding / Safety フィジカルAI フィジカルAIが前提となると、ヒトの仕事が変わるのではなく 「仕事の概念」そのものが変わる
  9. © SAKURA internet Inc. AIとデータが国⼒を左右する時代、計算基盤(計算⼒)をどう築くかが国家の未来を決める 11 l ⽣成AIとクラウドの拡⼤により、データセ ンターは社会を⽀える中枢インフラへ l

    AIの進化とフィジカルAIの台頭で「計算基 盤(計算⼒)」が国⼒を左右する時代に l いま「計算資源をどこに、どれだけ持つ か」が国家戦略の核⼼になっている AI時代に問われる「新しい基盤の条件」
  10. © SAKURA internet Inc. 世界のデータセンター市場 12 参考:GRAND VIEW HORIZONE (https://www.grandviewresearch.com/horizon/)の情報を加⼯

    世界のデータセンター市場予測 2024 2030 2024 2030 2024 2030 2024 2030 $139.4B (44.0% OF GLOBAL MARKET) $253.3B (42.8%) growth rate:181.7% $87.3B (27.6%) $154.3B (26.1%) growth rate:176.7% $71.7B (44.0%) $150.4B (42.8%) growth rate:209.8% $18.3B (44.0%) $33.8B (42.8%) growth rate:184.7% • 世界的にデータセンター市場は、⽣成AIの急速な進 展を背景に、今後も⼤きく成⻑すると予測される。 • APACは中国やインドを中⼼に⾼い成⻑が⾒込まれ、 他のリージョンを上回る拡⼤が期待さる。 • ⼀⽅で、市場の定義や算定⽅法に⼤きな差があり、 発表される数値や予測にはばらつきが⾒られる。 • 世界情勢の不安定化やエネルギー・環境制約の深刻 化も加わり、従来の成⻑モデルでは先⾏きを正確に ⾒通すことが難しい状況にある。 • データセンターが直⾯する課題は過去に例を⾒ない ほど⼤きく、エネルギー需給や環境負荷の⾯で地球 規模の影響を及ぼす可能性がある。 • 「チャンスは⾮常に⼤きいが、供給・運⽤側の課題 も拡⼤している」これが、今の世界のデータセン ター産業が直⾯する現実である。
  11. © SAKURA internet Inc. 13 従来の社会基盤 電気 ⽔道 道路 次世代の社会基盤

    クラウド データセンター AI データセンターは、電気・⽔道・道路に並ぶ、次世代の社会基盤の⼀つ 「AI」や「クラウド」が注⽬される⼀⽅で、データセンターは意識されにくい存在。 しかし、今やデータセンターは電⼒・通信・知・経済をつなぐ社会基盤そのもの。 これからは、テクノロジーを⽀える⼟台であるデータセンターが、⽇本の未来を築く要になる。 データセンターの役割 データセンターは、電⼒・通信だけでなく、知・経済をつなぎ、⽇本の未来を築く社会基盤
  12. © SAKURA internet Inc. 進化するデータセンター「預かる場所」から「価値を⽣み出す基盤」へ 14 データを守るだけの時代は終わり、社会の知と成⻑を⽀える時代へ これからのデータセンターは、価値・未来を創る「知のエンジン」となる n かつてのデータセンター

    データを預かる「場所」が中⼼ n これからのデータセンター データ・ネットワーク・計算の統合制御を 担い価値を⽣む「知のエンジン」 • 物理的なスペース提供が中⼼ • 電源・空調・監視の基本機能 • 受動的なサービス形態 • 知識を⽣み出す処理基盤 • AIや分析機能の組み込み • 能動的な価値を創造する
  13. © SAKURA internet Inc. さくらインターネットの挑戦と展望 15 国産インフラへの挑戦「⽇本のデジタル主権を守り未来の成⻑を⾃国で⽀えるために」 ガバメントクラウド:国のデータを国内で守る体制づくりが進展 AI基盤整備:国家レベルの計算基盤が整い、⺠間投資が活性化 経済安全保障:過度な外資依存を減らし、経済安全保障とデジタル主権を両⽴

    分散と再エネの活⽤「集中から分散へ。各地域が社会インフラを担う時代へ」 東京への⼀極集中の是正と地域特性を活かしたデータセンターの配置 冷涼気候・再エネ利⽤・⼟地活⽤など、地域資源を活かす 各地域がデジタル産業の現場となり、エネルギー・⼈材・経済の再循環を 社会に必要とされる持続性の⾼い運営「効率の先にある信頼を社会とともに育てる」 求められるのは効率だけでなく、社会・環境・地域との共存を前提とした持続性と責任 「安⼼してデータを預けられる国」=⽇本らしい社会インフラの形 品質・安全・信頼を重んじる⽇本の⽂化・価値観をDC運営に活かし「信頼を設計できる国」として世界に貢献
  14. © SAKURA internet Inc. 当社は垂直統合型・⾃前主義のビジネスモデル 市場の変化に強く、顧客ニーズに応える国産クラウドを提供 当社のビジネスモデル 16 サポート サービス運⽤

    サービス開発・技術研究 データセンター • バリューチェーンを最適化 • 顧客のニーズに柔軟かつスピーディに対応可能 強み 販売 さくらのモノプラット フォーム さくらのセキュアモバイルコ ネクト クラウドサービス IoT ブロック チェーン AI・ ディープ ラーニング エッジ コンピュー ティング
  15. © SAKURA internet Inc. ⽯狩データセンター 17 2010年6⽉クラウドに特化した郊外型データセンターとして⽯狩データセンターの建設を発表し2011年3⽉に着⼯。 2011年11⽉に1・2号棟を開所し、2016年12⽉には3号棟を開所。 2025年5⽉に、敷地内にコンテナ型データセンターを開所。 1号棟

    2号棟 3号棟 コンテナ棟 敷地⾯積 51,448㎡(⽯狩湾新港地域全体で3,022ha) 竣⼯ 2011年11⽉ 2016年12⽉ 2025年5⽉ 建物構造 地上2階建・鉄⾻造 地上3階建・鉄⾻造 コンテナ型 建設⾯積 7,091㎡ 6,487㎡ 延床⾯積 11,392㎡ 12,270㎡ ⽯狩データセンター1・2号棟 ⽯狩データセンター3号棟 コンテナ型データセンター
  16. © SAKURA internet Inc. 学習⽤途 向け戦略 推論⽤途 向け戦略 世界49位の処理性能を持つ⾃社スパコン (さくらONE)と新型GPU

    「NVIDIA B200」を 早期提供。⼤⼝・エンタープライズニーズに 応える差別化戦略を実⾏ 当社の強みである「国産クラウド×⼿厚い ⽀援」で⾃由度が⾼く柔軟性のある プラットフォームサービスを提供開始。 計算基盤あたりの収益性を向上 18 学習(開発)向け 推論(利⽤)向け さくらONE (スパコン) ⾼⽕⼒ PHY ⾼⽕⼒ DOK さくらの⽣成 AIプラット フォーム サービス ⾼⽕⼒ VRT 多様なニーズに応える⾼付加価値サービスラインアップ シリーズ 当社の強みであるクラウド型サービスへリソースを集中 ⾼成⻑・⾼収益領域への注⼒で計算基盤の収益性を最⼤化 ① ② さくらインターネットの取り組み「さくらのAI」基盤
  17. © SAKURA internet Inc. 未来を正確に予想することは困難 特にインターネット分野では! 研究所の役割 - 選択肢を増やす 22

    ︖ 選 択 多 様 性 ⾊々なアイデアを試しておき、本当に必要なときにパッ と出せるようにしておく 流⾏・成功を正確に予想 する必要はない 斥候として先回りするの が研究所の任務
  18. 研究所の研究領域・注⽬領域 研究領域 • コンピューティング・ネットワーク • クラウド・コンピューティングの未来を形作る技術の研究開発。「システムプラット フォーム」「システム要素技術」「システムエンジニアリング」のサブカテゴリ。 • データ・機械学習・⼈⼯知能(AI) •

    コンピューティングプラットフォーム上で取り扱われるデータの記録・管理・流通、 データ駆動で複雑な構造の理解や多様なシステムタスクの⾃動化に関する研究等。 • 教育・社会・組織 • デジタル社会に根ざした教育学や、研究開発組織のマネジメントに関する研究等。 注⽬領域(調査・ウォッチ対象) • 量⼦コンピューティング、バイオインフォマティクス、有機コンピューティングなど 23
  19. 研究領域図 クラウドコンピューティング エッジ・フォグコンピューティング SRE (Site Reliability Engineering) AIインフラ ⾼性能計算(HPC) 量⼦暗号通信

    さくらインターネット博物館 教育学 研究組織開発 AI for Science AI for コンピューティング コンピューティング ・ネットワーク データ・機械学習 ・⼈⼯知能(AI) 教育・社会・組織 データ流通 HPC向けデータ ライフサイクルデザイン ラボ・インフォ マティクス システム ソフトウェア メール基盤 ミドルウェア マテリアルズ・ インフォマティクス AI創薬 量⼦コンピュータ 分散コンピューティング フィジカルAI ロボティクス 24
  20. 研究テーマ ⼀覧 各研究員の最新取り組みテーマ コンピューティング・ネットワーク データ・機械学習・⼈⼯知能(AI) 教育・社会・組織 • 超個体型データセンターの実現に関する研究 • AI/HPCクラスタ「さくらONE」の構築と性能検証

    • AI/HPCクラスタのためのSRE • GPU計算基盤の性能最適化 • セルフホストに特化したWebAssemblyランタイム • アプリケーションのライブマイグレーション • 異種OS機能連携によるコンテナサンドボックス機構 • SMTPにおける可観測性を向上させる透過型Proxy • 宣⾔的デプロイメントを可能にするミドルウェア • エッジ・Fogコンピューティングに関する研究 • 量⼦暗号通信のクラウド・DCへの導⼊に関する検討 • クラウド⾃律運⽤基盤の構築 • ⼤規模⾔語モデル(LLM)を⽤いた知識抽出と構造化 • データのライフサイクルデザインに関する研究 • 電⼦実験ノートeurecoの開発 • チェンジラボラトリーによる組織改⾰のプロセス研究 25
  21. 超個体型データセンターの実現に関する研究 s-kikuchi • 研究の⽬的 • ⾃律的に結合・離合しつつシームレスなタスク処理を実現できるシステムの構築 ⾃律的に分散と集中のハイブリッド構造を取れるデータセンターシステムの実現 • 研究の意義 •

    クラウドによる無制限のバックエンド処理を可 能にしつつ、必要・状況に応じてコンピュー ティングリソースの局所利⽤も⾃動実現する • 研究の⼿法など • ⾃然由来エネルギーの揺らぎなども考慮した データセンターへのタスクスケジューリング⼿ 法の開発 分散し増⼤するコンピューティングインフラ コンピューティング リソース(PC) コンピューティング リソース(MEC) コンピューティング リソース(Device) クラウド エッジ 現場 超個体型データセンター (超個体型データセンターOS) 遍在するデータと、それを処理するプロセスが⾃律分散する 現場 センター コンピューティング・ネットワーク 26
  22. GPUマネージドHPCクラスタの構築とベンチマーキング • 研究の⽬的 • マネージドHPCクラスタを商⽤サービスとして展開するとともに、 AI/HPC計算機基盤の性能検証と利⽤傾向分析を⾏う • 研究の意義 • ベンダー中⽴な国産のAI/HPC計算機基盤の実現と実運⽤データ

    の公開により「持続可能なAI開発エコシステム」へ貢献する • 研究の⼿法など • 数百から1000基規模のGPUとEthernetベースの⾼速イン ターコネクトから成る複数のクラスタを構築し 、 HPL/HPC-MxP/HPCG/MLPerf Trainingによる多⾓的な 性能評価とジョブ履歴データとテレメトリの分析を⾏う AI/HPCクラスタ「さくらONE」の構築と性能検証 コンピューティング・ネットワーク f-konishi, tak-yamashita, y-tsubouchi, hi-tsuruta 27
  23. 信頼性向上のためのAI/HPC特有のオブザーバビリティ技術の確⽴ • 研究の⽬的 • クラウドネイティブ分野と⽐較して不⾜しているAI/HPC 特有のシステム観測⼿法を確⽴する • 研究の意義 • アプリケーション、GPUサーバ、ネットワーク、スト

    レージなどの⼀連の処理の中でボトルネックや障害の原因 を特定できる • 研究の⼿法など • 「さくらONE」を対象にテレメトリーデータを収集・可 視化するシステムを構築する AI/HPCクラスタのためのSRE コンピューティング・ネットワーク y-tsubouchi 28
  24. AI向け演算精度アーキテクチャの活⽤と、HPC向けレガシーコードのGPU向け最適化 • 研究の⽬的 • マネージドHPCクラスタ「さくらONE」の安定的な運⽤体制を確⽴し、ユーザ が容易にかつ効率的にGPUリソースを利⽤できる環境の開発・整備を⾏う • 研究の意義 • ユーザがHPCインフラ構築の複雑さから解放され、本来のシミュレーション研

    究開発やAI学習といった⽬的に専念できる環境を提供することで、新たな価値 創出や社会安全の推進に寄与する技術の実装に関われる • 研究の⼿法など • GPU演算精度のAI特化への対策として「尾崎スキーム」を調査し、既存HPC コードへの実装・評価を⾏い、HPC/AIモデル利⽤の両⽅でGPU計算基盤の利 ⽤効率化を探求 • AIエージェントを活⽤し、HPC向けレガシーコードをGPUのアーキテクチャ/ コンパイラ/ライブラリ向けに最適化するための⼿法の検討と確⽴ GPU計算基盤の性能最適化 研究を説明する図 tak-yamashita, f-konishi コンピューティング・ネットワーク 29
  25. ランタイム拡張機能をランタイム⾮依存に実現 セルフホストに特化したWebAssemblyランタイム y-nakata (公⽴はこだて未来⼤学との共同研究) Self-hosted Runtime Host Runtime (E.g., Wasmtime)

    Wasm Bytecode コンピューティング・ネットワーク • 研究の⽬的 • Wasmに存在する多くの新仕様と仕様対応に差がある 多様なランタイム実装のギャップを埋める • 多くのランタイムに適応可能なランタイム拡張 • 研究の意義 • ランタイムや性能最適化の差異を意識せずに ランタイム拡張や最新仕様への対応が可能 • 研究の⼿法など • Wasmにコンパイルされたミニマムな セルフホストWasmランタイムに拡張機能を実装 30
  26. アプリケーションのライブマイグレーション y-nakata (公⽴はこだて未来⼤学との共同研究) 異種環境なクラウド・エッジ間ライブマイグレーションに関する研究 • 研究の⽬的 • 異なるCPUアーキテクチャやランタイム、最適化⽅式間での効率的なライブマイグレーションを可能にする • 研究の意義

    • 特性の異なるコンピューティングリソースを組み合わせ 低遅延・⾼速処理を両⽴するアプリケーションを実現可能 • 研究の⼿法など • アーキテクチャ中⽴な仮想命令セットアーキテクチャである WebAssembly(Wasm)を活⽤ • 各環境に特化したWasmランタイム間でライブマイグレーションを実現 コンピューティング・ネットワーク 31
  27. 軽量なOS互換レイヤによってOS固有の脆弱性を悪⽤した攻撃を防⽌ 異種OS機能連携によるコンテナサンドボックス機構 y-nakata (公⽴はこだて未来⼤学との共同研究) コンピューティング・ネットワーク • 研究の⽬的 • コンテナの軽量さを維持しつつ コンテナの隔離性を向上させるサンドボックス⼿法

    • 研究の意義 • クラウドのようなマルチテナント環境で 悪意のあるユーザによる攻撃を防ぎながら アプリケーション性能や起動時間への影響を最⼩限に • 研究の⼿法など • 軽量なOSエミュレーション機構(FreeBSD)を⽤いて コンテナを実⾏するOSとコンテナから⾒えるOSを別のものに • OSカーネル固有の脆弱性を悪⽤した攻撃を失敗させる 32
  28. 共有環境におけるレピュテーションの可視化と送信品質の⾃動制御を実現する • 研究の⽬的 • メール基盤における共有IP、共有ネットワー クのレピュテーション問題の緩和を⽬指す • 研究の意義 • 共有メールホスティングやクラウド環境での

    メール送信で⾼到達率や低遅延といった品質 向上につながる SMTPにおける可観測性を向上させる透過型Proxy t-oda(九州⼤学と岡⼭⼤学との共同研究) • 研究の⼿法 • SMTPのコマンドレベルで制御可能な透過型Proxyを開発することで、可観測性を向上させ柔軟な対応 を⾃動化する 透過型Proxy Warpの動作概要図 コンピューティング・ネットワーク ※レピュテーション:メール送信者評価 33
  29. 宣⾔的デプロイメントを可能にするミドルウェア CloudNativeアプローチをスタンドアロンなミドルウェアで実現する • 研究の⽬的 • アプリケーションの最新バージョンをアプリケーション⾃ ⾝が継続的に最新となるよう動作する • 研究の意義 •

    ⾮Kubernetes環境でのデプロイメントにおいて⾼いセ キュリティと⾃動化による運⽤効率化を実現する • 研究の⼿法 • サーバーモードではファイルディスクリプタを新旧バー ジョンで共有しシグナルによって旧をグレースフルシャッ トダウンさせ、コンテナモードではTCPプロキシとしてリ クエストを適切に新旧振り分けを⾏う t-oda ミドルウェア Dewyの動作概要図 コンピューティング・ネットワーク 34
  30. エッジ・Fogコンピューティングに関する研究 • 研究の⽬的 • エッジ(地域DC)・クラウドをシームレスに利⽤できるコンピューティング環境の実現 エッジや現場のコンピューティングリソースとデバイスのシームレスな結合を⽬指す 地域IP網 =フレッツ網 コア網= インターネット網

    携帯電話網 クラウド クラウド クラウド ⾃営網 地域設置DC (有線)キャリアネット ワーク 携帯ネットワーク • 研究の意義 • どんな場所でもコンピューティングの恩恵を 受けられる世界の実現(フィジカルAI向け) • コンピューティングおよびネットワーク利⽤ の最適化(地産地消化) • 研究の⼿法など • 地域網や携帯網から利⽤可能な地域DCへの ネットワーク接続を実現 s-kikuchi コンピューティング・ネットワーク 35
  31. 量⼦暗号通信のクラウド・DCへの導⼊に関する検討 • 研究の⽬的 • 量⼦暗号通信に対応した、⾼セキュアクラウド、またサービスプラットフォームの実現 • 研究の意義 • 医療・ゲノム、ヘルスケア、政府、防衛など、⾼セキュリティが求められる顧客向けに、クラウドサービスを提 供可能にする

    • 研究の⼿法など • 「量⼦クラウド」構想の⼀翼を担う形で、データセンター間の量⼦暗号通信⽅式、データセンター間横断の秘密 分散ストレージ、それ等を組み込んだサービスプラットフォームの試作検討を実施する • 量⼦暗号通信⽅式については、複数⽅式(OTP⽅式、QKD⽅式)をデータセンター間通信に適⽤するトライア ルを実施する 安全性の担保された通信路によって接続されたセキュアクラウドサービスを実現 s-kikuchi コンピューティング・ネットワーク 36
  32. クラウドやAI/HPCシステム特化型の時系列基盤モデルの開発 • 研究の⽬的 • 「さくらONE」などの複数の商⽤サービスから多次元時系列テレメト リーデータや熟練運⽤者の作業記録を統合解析し、特化型の時系列基 盤モデルを開発する • 研究の意義 •

    障害の将来予測、検出、原因特定などの運⽤やリソース最適化を基盤 モデルにより⾃律化できる • 研究の⼿法など • 時系列テレメトリーデータに適したトークン化⼿法や深層学習アーキ テクチャを設計する • Chaos Engineeringにより実験環境で障害を意図的に発⽣させ⾃動検 証する クラウド⾃律運⽤基盤の構築 f-konishi, y-tsubouchi, hi-tsuruta, tak-yamashita データ・機械学習・⼈⼯知能(AI) 37
  33. ⼤規模⾔語モデル(LLM)を⽤いた知識抽出と構造化 hi-tsuruta 科学論⽂などの専⾨⽂書から材料の合成⼿順や物性を抽出・構造化する⼿法の研究開発 • 研究の⽬的 • LLMを⽤いて、材料科学の専⾨⽂書から有⽤な情報を⾼精度に抽出し、機械 可読なデータベースを構築する • 研究の意義

    • 膨⼤な専⾨⽂書に散在する知識を抽出・構造化することで、データ駆動型 研究を加速できる • 研究の⼿法など • LLMを⽤いた⾃然⾔語処理により、⽂書中の合成⼿順・材料物性を⾃動的に 抽出する • 取得データをJSON-LDなどの標準フォーマットで構造化し、データベース化 する データ・機械学習・⼈⼯知能(AI) 38
  34. データのライフサイクルデザインに関する研究 f-konishi リサーチデータのライフサイクルデザインを最適化し、 データ作成・保存・利⽤・移動・同期・修正・共有・⻑期保管・破棄の効率性と持続可能性を向上させる。 • 研究の⽬的 • 計算資源の最適化/データ管理の標準化と⾃動化/ストレージのアクセスの 最適化/エネルギー効率の向上/データの保全とセキュリティ強化 •

    研究の意義 • 近年のAI技術の⾶躍の源となるあらゆるデータに対して、その全ライフス テージでのデザインを⾏う事で、意図した利活⽤を実現する事ができる • 研究の⼿法など • データフロー分析:研究データの⽣成からアーカイブまでの各フェーズを モデル化し、計算リソースの利⽤効率をシミュレーションする • ワークロード最適化:データ転送や計算負荷のボトルネックを特定し、 HPCクラスタ内での適切なタスクスケジューリングを設計 • メタデータ管理の強化:HPC環境向けに適したメタデータレイヤーを設計 し、データの検索・アクセスの効率を向上 データ・機械学習・⼈⼯知能(AI) 39
  35. 実験科学者の試⾏錯誤を加速する電⼦実験ノート • 研究の⽬的 • 散らばる実験記録を構造化・集約・関連付けし、い つでも再利⽤・再現できる知⾒へと転換する電⼦実 験ノートを開発する。 • 研究の意義 •

    「あのデータ、どこだっけ?」を解消:散らばる情 報を⼀元管理し、記録の再利⽤が容易になる • 「これ、どうやったんだっけ?」を解消:実験記録 を構造化し、再現性を向上できる • 研究の⼿法など • 5つのアプローチで段階的に開発: • 集約 :あらゆる記録を1つのノートに集める • 構造化 :「積み⽊」のように知⾒を整える • 関連付け:データやプロセスを紐づける • 利⽤ :ノート上でデータ加⼯・可視化する • 安⼼ :安⼼できる場所で管理する 電⼦実験ノートeurecoの開発 研究を説明する図 m-kumagai データ・機械学習・⼈⼯知能(AI) 40
  36. チェンジラボラトリーによる組織改⾰のプロセス研究 函館⻄⾼校校内研修に着⽬して • 研究の⽬的 • 研究の意義 • 変化する⽣徒の学びに対し、教師の学びが追い付いて いないという課題を組織的に克服する事例創出によっ て学校改⾰の⽷⼝を発⾒できる

    • 研究の⼿法など • 校内研修にチェンジラボラトリーを導⼊、参加教師と 協働でプロジェクトを作り、実践する 教育・社会・組織 研究を説明する図 m-asakura • 教師の校内研修にチェンジラボラトリー1を適⽤し、組織改⾰のプロセスや教師の変⾰的エー ジェンシー2の変化を分析する →校内研修のデザイン実験 拡張的学習のサイクルにおける学習諸⾏為の継起 出典:Engeström(2016 p.49) 1. 拡張的学習のサイクルに基づき、組織の抱える⽭盾を打ち破り新たな解決策のモデルを⽣み出す介⼊研究⼿法 2. 既存の⾏動枠組みを打破し、システムの⽭盾を乗り越え変⾰の主導権を握ろうとする協働の意思と実践的努⼒ 41
  37. ◆なぜ校内研修改⾰が必要なのか • 総合的な探究の時間などの正解のない学びに対し、従来の学校構 造では⼗分に対応(評価、進度や内容の個性化)ができないため、 良い実践事例があってもカリキュラムの「カプセル化」「⼿順 化」が起こり後に形骸化する • 校内研修は教師が⾃発的、組織的に学ぶ唯⼀の場であり、ボトム アップで改⾰が可能なコミュニティであるが、従来型学校構造 (ヒエラルキー、知識・⽂化の再⽣産)に縛られている

    • 校内研修の改⾰を「教師の探究活動」として実施することにより、 ⽣徒に求められる学びへの転移が期待できる • 校内研修改⾰の成功体験は、学校改⾰をボトムアップで進める変 ⾰的エージェンシーを⽣み出す チェンジラボラトリーによる組織改⾰のプロセス研究(続) m-asakura 交換価値 vs 使⽤価値 テストの点数を上げる 偏差値の⾼い⼤学への合格者数を増やす じっくり探究する 働き⽅改⾰のための効率化 ⾼校の存続をかけた魅⼒化 出世、昇給 保護者の圧⼒ 不登校対策 いじめ問題 ⽣徒の⼈⽣と幸せ etc… 学校のシステムにある⽭盾に着⽬し、それを打破 しようとすることによってブレークスルーを⽣み 出す 教育・社会・組織 函館⻄⾼校校内研修に着⽬して 42
  38. © SAKURA internet Inc. 44 AI需要の急拡⼤と電⼒の壁 • ⽣成AIの普及によるデータセンター(DC)建設(計画)ラッシュ • AI⽤DCには莫⼤な電⼒(例:1DCあたり100メガワット)が必要

    • 電⼒供給網の逼迫により、新規DC建設は困難な状況(電気がない) ハイパースケール型DC・リテール型DC それぞれの累積ラック数(2017年〜 2031年) OCCTO(電⼒広域的運営推進機関)による 全国の電⼒重要想定
  39. © SAKURA internet Inc. 45 再⽣可能エネルギーの偏在と出⼒抑制 • 太陽光発電は順調?に導⼊が拡⼤している • 地域・季節・時間帯により発電量には偏りがある

    • 「電気が余っている場所」と「電⼒が必要なDC」 がミスマッチ 太陽光発電の⽇内変動と出⼒抑制(概念図) 資源エネルギー庁:再⽣可能エネルギーの出⼒制 御の抑制に向けて IUUQTXXXFOFDIPNFUJHPKQDBUFHPSZTBWJOH@B OE@OFXTBJFOFHSJE@TZVUVSZPLVTFJHZPIUNM IUUQTXXXNFUJHPKQTIJOHJLBJFOFDIPEFOSZPLV@HBT EFOSZPLV@HBTQEG@@QEG
  40. © SAKURA internet Inc. 46 「ワット・ビット構想」 • 電⼒網(送電線)の増強には莫⼤なコストと時間がかかる • 通信線(ファイバ)の敷設コストは送電線の1/100

    • 電気を運ぶのではなく、データ(DC)を電気のある場所へ運ぶ Transfer cost ... ... = Energy Productivity… Material >> Electricity >> Digital bits ( Power) (digital Function) x0000 : x00 : 1 100 1 By Digital Twin 8*%&ϓϩδΣΫτ׆ಈใࠂʢߐ࡚ઌੜʣΑΓ
  41. © SAKURA internet Inc. 47 ワット・ビット構想の課題 • 太陽光発電は、天候・⽇照により出⼒が激しく変動する • 単⼀のDCでは安定したサービス提供が困難

    • そこで:発電状況(電⼒余⼒)に応じて、複数のDC間で計算処理 (ワークロード)を移動させる技術が必要に • →晴れている地域のDCにワークロードを送る
  42. © SAKURA internet Inc. 48 既存電⼒系統の最⼤活⽤ APN/ワークロードシフト • ウェルカムゾーンの活⽤で 既存系統を早期に最⼤活⽤

    • APN(オール光ネットワー ク)による拠点間連携を研 究・実証 • AI負荷分散で天候・需給に 応じた⾼度なワークロード シフト 電⼒×通信×DC事業者 三位⼀体連携 • 官⺠横断でワット・ビット 連携を推進し、『GX』『レ ジリエンス』『国際展開』 を視野に整備 • ”電⼒“”通信“”DC事業者“が ⼀体で計画・技術・制度を 連携 DCが電⼒調整の担い⼿へ • 蓄電池・コジェネ等の導⼊ で需給調整(DR)に貢献 • 余剰電⼒を活⽤し、分散DC でレジリエンスと効率を両 ⽴ ワット・ビット連携が切り拓く新しいデータセンター像 参考:経産省・総務省『ワット・ビット連携官⺠懇談会 取りまとめ1.0』(2025/6/12) https://www.meti.go.jp/press/2025/06/20250612001/20250612001.html / PDF: https://www.meti.go.jp/shingikai/economy/watt_bit/pdf/20250612_1.pdf
  43. 超個体型データセンターの実現に関する研究 • 研究の⽬的 • ⾃律的に結合・離合しつつシームレスなタスク処理を実現できるシステムの構築 ⾃律的に分散と集中のハイブリッド構造を取れるデータセンターシステムの実現 • 研究の意義 • クラウドによる無制限のバックエンド処理を可

    能にしつつ、必要・状況に応じてコンピュー ティングリソースの局所利⽤も⾃動実現する • 研究の⼿法など • ⾃然由来エネルギーの揺らぎなども考慮した データセンターへのタスクスケジューリング⼿ 法の開発 分散し増⼤するコンピューティングインフラ コンピューティング リソース(PC) コンピューティング リソース(MEC) コンピューティング リソース(Device) クラウド エッジ 現場 超個体型データセンター (超個体型データセンターOS) 遍在するデータと、それを処理するプロセスが⾃律分散する 現場 センター コンピューティング・ネットワーク 49 ワークロードシフトを実現するための具体的な実装形態として 「超個体型データセンター」を研究開発する
  44. 「超個体型データセンターと超個体データワールド」コンセプト 1. 現在はデータセンターに巨⼤なコンピューティングリソースが存在している が、今後は、レイテンシ・セキュリティ・コスト等の要件から、あらゆる場 所や社会(組織)にコンピューティングリソースが溶け込んでいくことにな る。 2. それら分散したコンピューティングリソースは、単独でコンピューティング パワーを提供するにとどまらず、その場所や社会の要求に応じて、⾃律的に、 分散あるいは有機的に結合し、現場・クラウドそれぞれが縦横に結びついた

    ハイブリッド構造をとれるように機能する。 3. そのようなシステムにより実現されるものは、バックエンド側が有機的に結 合することによりかつてないマシンパワーとリソースによってデータを処理 し、それにより⼈々の⾝近でリアルタイムかつインテリジェンスに社会を⽀ える超個体データワールドである。 4. さくらインターネット研究所はこのようなビジョンのもと、超個体データ ワールドを実現する超個体型データセンターシステム、それらを統括管理す る超個体型データセンターOS等の研究開発を推進していく。 50
  45. インターネット以前のネットワーク(1980年代)(1/3) サーバ : ホストコンピュータとダム端末 52 Lawrence Livermore National Laboratory, Attribution,

    https://commons.wikimedia.org/w/index.php?curid=1565787による Retro-Computing Society of Rhode Island - 投稿者自身による作品, CC 表示-継承 3.0, https://commons.wikimedia.org/w/index.php?curid=7354001による https://openmedia.jp/blog/?p=336
  46. LANをつないだネットワークの時代 (1990年代) (1/5) サーバ : UNIXサーバとクライアント ネットワーク : LAN(Local Area

    Network) アプリ : プリンタやファイルサーバの共有 55 Urpo Lankinen (User:Wwwwolf). - 投稿者自身による作品, CC 表示 2.5, https://commons.wikimedia.org/w/index.php?curid=1356567による Robert Harker - http://en.wikipedia.org/wiki/File:Sun3_60_Dis k_Tape.jpg, CC 表示-継承 2.5, https://commons.wikimedia.org/w/index.php ?curid=7216642による CC 表⽰-継承 3.0, https://commons.wikime dia.org/w/index.php?curi d=15503
  47. LANをつないだネットワークの時代 (1990年代) (2/5) ネットワーク : UUCP (Unix-to-Unix-CoPy) アプリ : ネットニュースとメールの交換

    56 サーバ LAN LAN LAN LAN UUCP接続 UUCP接続のための回線(ネットワーク) には、電話回線などを利⽤
  48. LANをつないだネットワークの時代 (1990年代) (3/5) 57 ネットワーク : TCP/IP アプリ : よそのコンピュータを使う

    (リモートログイン) LAN LAN LAN LAN TCP/IP接続のための回線(ネットワーク)に は専⽤線接続を利⽤ TCP/IP接続
  49. LANをつないだネットワークの時代 (1990年代) (4/5) 58 アプリ : WWW(World Wide Web)の発明 LAN

    LAN LAN LAN TCP/IP接続 TCP/IP接続のための回線(ネットワーク)に は専⽤線接続を利⽤ コアネットワークを形成
  50. インターネット商⽤開放 (1990年代後半) (1/3) • サーバ : 企業や⼤学が⾃社でUNIXサーバを持ち、そこにパ ソコンでアクセスする。 • ネットワーク

    : 公衆網経由でのモデムによるダイアルアップ (PPP)接続。 60 サーバ サーバ サーバ ⾃宅等 ダイアルアップ (PPP)接続 ⼤学・企業LAN 公衆電話網 IPコア網
  51. ホームページ を一覧にして 集めたサービ スが登場 インターネット商⽤開放 (1990年代後半) (3/3) • アプリ :

    ⾃社サーバ、ISPサービスによるホームページ公開 • さくらインターネット創業 • アプリ : 検索エンジンの発明(Yahoo、千⾥眼、goo, google) 62 ISP 企業のホームページが増えていく 個⼈のホームページが増えていく https://internet.watch.impress.co.jp/cda/ news/2008/06/09/19866.html より サーバやホームペー ジをレンタルできる サービス IPコア網
  52. インターネット普及期 (2000年代) (1/2) • サーバ : 続々企業がホームページを⽴ち上げる。ホームページブームの到来。 猫も杓⼦もインターネット。 • ネットワーク

    : フレッツ網の利⽤拡⼤。ADSLによる常時接続。 • ネットワーク : iモードサービス。(モバイル網の成⽴と普及) 63 地域IP網 =フレッツ網 … コア網 ADSL 常時接続 携帯電話網 … 様々なサイトと サーバ 携帯電話&i モード
  53. インターネット普及期 (2000年代) (2/2) • アプリ : SNSが出始める。(Twitter, Facebook, GREE, MIXI)

    64 地域IP網 =フレッツ網 … コア網 携帯電話網 … 様々なサイトと サーバ Twitter Facebook mixi
  54. スマホ時代の始まり (2000年代後半) (1/2) • サーバ : サーバが⼤規模になり始める。端末はスマートフォンに。 • サーバ :

    AWSサービス開始(2004年︖) 65 地域IP網 =フレッツ網 … コア網 携帯電話網 … SAKURA internet
  55. 現在のインターネットのかたち 71 地域IP網 =フレッツ網 コア網 携帯電話網 クラウド クラウド クラウド IoT

    • サーバ︓⽣成AIがクラウドの主役に • ネットワーク︓コア網・地域網・携帯電話網で構成 • アプリ︓スマホアプリ、動画、IoT制御、フィジカルAI GPGPU搭載サーバ ⽣成AI =
  56. さくらインターネット研究所の取り組み事例紹介 その3︓エッジコンピューティング IoTの登場をキーポイントに、ネットワークの質的変化が 求められるように 72 クラウド IoT 往復 伝搬遅延 =間に合わない︕︕

    【参考】 • ⾃動⾞(100km/h)が1秒に進む距離︓28m • ⾃動⾞に対応できる応答速度︓10msec • ⼈(4.8km/h)が1秒間に進む距離︓1.3m • ⼈に対応できる応答速度︓100msec • ⼈の反応速度︓300msec • ⼈がWebページに待てる時間 : 3秒 ⼈の反応速度より早く反応するシステムが求められる
  57. エッジ・Fogコンピューティングに関する研究 • 研究の⽬的 • エッジ(地域DC)・クラウドをシームレスに利⽤できるコンピューティング環境の実現 エッジや現場のコンピューティングリソースとデバイスのシームレスな結合を⽬指す 地域IP網 =フレッツ網 コア網= インターネット網

    携帯電話網 クラウド クラウド クラウド ⾃営網 地域設置DC (有線)キャリアネット ワーク 携帯ネットワーク • 研究の意義 • どんな場所でもコンピューティングの恩恵を 受けられる世界の実現(フィジカルAI向け) • コンピューティングおよびネットワーク利⽤ の最適化(地産地消化) • 研究の⼿法など • 地域網や携帯網から利⽤可能な地域DCへの ネットワーク接続を実現 s-kikuchi コンピューティング・ネットワーク 74
  58. © SAKURA internet Inc. • さくらインターネット研究所が主導して構築した、マネージド HPCクラスタ • =スーパーコンピュータ •

    研究所開発技術の投⼊先でもある さくらONE 、とは 79 HPCクラスタ概念図 https://www.weka.io/learn/guide/hpc/what-are-hpc-and-hpc-clusters/
  59. © SAKURA internet Inc. スーパーコンピュータ、とは(1/2) 80 スーパーコンピュータとは、極めて⾼速な計算能⼒を持つコン ピュータであり、主に科学技術計算、⼤規模なシミュレーション、気 象予測、⼈⼯知能の学習、原⼦核研究など、⾮常に膨⼤なデータ処理 や⾼精度な計算を必要とする分野で使⽤されます。

    特徴的な点: • 膨⼤な並列処理能⼒(数⼗万〜数百万のプロセッサを同時に動作) • ⾼速な通信・データ転送性能 • 専⽤に最適化されたハードウェアとソフトウェア構成 • 特定の科学技術課題に特化した構造を持つ場合もある
  60. © SAKURA internet Inc. スーパーコンピュータ、とは(2/2) 81 項⽬ PCクラスタ型(現代型) 専⽤ハードウェア型(旧型) 構成要素

    汎⽤CPUやGPUを多数組み合わせ たノード 専⽤設計のプロセッサ・アーキテク チャ 設計思想 商⽤サーバやPC部品を多数連結 (クラスタ) 性能最適化を重視した⼀体型設計 拡張性・柔軟性 ⾼い(ノード単位で増設可能) 低い(設計に応じた固定構成) コスト ⽐較的低コスト(商⽤部品活⽤) ⾮常に⾼価(専⽤開発・製造) 開発期間 短い(既存技術の組み合わせ) ⻑い(専⽤設計・開発が必要) メンテナンス 容易(部品交換がしやすい) 難しい(特注部品、供給困難) 性能効率(理論性能/実効性能) 効率は低め(通信・同期のオー バーヘッド) ⾼効率(密結合・⾼速通信) 代表例 Fugaku(富岳)、Summit、 Frontierなど Earth Simulator、Cray-1、SXシリー ズなど ネットワーク接続 ⾼速インターコネクト(InfiniBand など) 内部バスや独⾃ネットワーク設計 ⽐較:PCクラスタ型 vs 専⽤ハードウェア型スーパーコンピュータ
  61. © SAKURA internet Inc. • さくらのデータセンター内に展開 • NVIDA社GPU H100を8基搭載したノードx100ノードで構成 •

    GPU間のインターコネクトを⾼⽕⼒PHY H100構成の倍 (400Gbps x 8)に強化 • ストレージ⽤に独⽴したIF • Slurmスケジューラ等(ソフトウェア)が整備 • LLMの学習⽤に最適化された構成 さくらONE構成 83
  62. © SAKURA internet Inc. • ⾃家⽤⾞で乗 り付ける事が できるスケル トンのコテー ジ

    • ⾃分の好きな 壁紙や家具を 置ける • 隣近所のコ テージを親族 ⽤に確保した りできる ⾼⽕⼒PHYとさくらONEの⽐較(イメージ) 84 • 50部屋ある 棟が、2棟あ るホテル • ロビーやエレ ベータ、コイ ンランドリー やプールのよ うな共有ス ペース • 契約した部屋 の数だけ予約 され、直ぐに 利⽤する事が できる • 必要なサービスは概ね揃っていて、 メンテナンスしてくれたり、相談 にのってもらえるコンシェルジュ が常駐している
  63. © SAKURA internet Inc. ノード(サーバ1台)の内部構成 88 PCIe Gen5 x16 の転送速度

    (双⽅向)は 128 GB/s NIC(インターコネクト⽤)の 転送速度は、400 Gb/s (=50 GB/s) GPU間の相互接続である NVSwitchの転送速度は1.8 TB/s
  64. © SAKURA internet Inc. インターコネクトネットワークの構成⽅法 94 • NIC越しのRDMAを実現する技術 • 2種類ある(本当は3種類あるがiWARPは省略)

    • InfiniBandは、専⽤ネットワークで⾼いスループットと低いレイテンシーを 実現できる通信⽅式。ただし⾼価。 • RoCE(v2) (RDMA over Converged Ethernet)は、Ethernet技術を⽤いて (そこそこ)⾼スループットとレイレイテンシーを実現している通信⽅式。 汎⽤機材(NIC/スイッチ)を利⽤できる。
  65. © SAKURA internet Inc. さくらONEの注⽬すべき点 99 • インターコネクトネットワークがEthernetで構成されている点 • 更に、オープン規格のSONiCベースで構成されている点

    • TOP500の順位のうち、Ethernetベースで構成されているシス テム(HPE Slingshotを除く)に限れば2番⽬、更に、SONiCベー スで限定すれば1番!
  66. © SAKURA internet Inc. • データセンター業界の状況として、AIデータセンターが今後国⼒を ⽀える存在になっていくことを解説 • さくらインターネットは⽇本においてAIデータセンターを⽀える存 在として機能していくことを説明

    • その中で、さくらインターネット研究所がどの様な研究開発を推進 しているかを解説 • 研究所が⼿掛ける技術のうち、ワットビット、エッジコンピュー ティング、さくらONE(スパコン)について解説 • 業界と⽇本を⽀える気概のさくらインターネットの取り組みについ て理解いただければ幸いです まとめ 100
  67. © SAKURA internet Inc. ベンチマークについて 104 ベンチマーク:コンピュータの性能や処理能⼒を客観的に評価・⽐較するためのテス トや指標のこと。 スーパーコンピュータの性能⽐較のための、いくつかの国際的なランキングがある。 •

    TOP500(LINPACK) • HPCG • HPL-AI • MLPerf • IO500 スパコンベンチマークで⾼いスコアを出すためには、システム全体を⻑時間にわたっ て⾼負荷で安定稼働させる必要があり、ベンチマーク結果には、単なる性能だけでな く信頼性の⾼さも反映されるとされる。
  68. © SAKURA internet Inc. HPCG : より実⽤的な処理に近いベンチマーク 106 近年の科学技術計算ではより複雑で通信やメモリアクセスが多い処理が求められるこ とが増えており、LINPACKだけでは現実的な性能を評価しきれないという課題が

    あった。そこでLINPACKに代わる新たなベンチマークとしてHPCG(High Performance Conjugate Gradients)が開発された。 https://www.hpcg-benchmark.org/ HPCGでは、「 疎な⾏列(0が多い⾏列) 」 に対して、共役勾配法 という⼿法を使って 連⽴⼀次⽅程式を解く、という処理をモデル 化している。LINPACKよりも現実に近い計 算負荷や通信パターンを反映するため、実⽤ 性重視の性能指標として注⽬されている。
  69. © SAKURA internet Inc. HPL-AI : AI時代のスーパーコンピュータ性能指標 107 近年の⼈⼯知能(AI)分野では、低精度演算(約5〜10桁程度の精度)でも⼗分な学 習が可能であることが分かってきた。GPUやAI専⽤チップなどは低精度の演算器を多

    数搭載し⾮常に⾼速に処理できるため、従来の倍精度ベンチマークでは最新のAI向け スーパーコンピュータの能⼒を⼗分に評価できないという課題が⽣まれた。そこで提 案されたのが、 HPL-AI(High Performance Linpack for AI)。 https://hpl-mxp.org/ HPL-AI(High Performance Linpack for AI)は、LINPACKの基本構造を活かしなが ら、連⽴⼀次⽅程式の解法において低精度演 算を許可し、最終的に反復改良(Iterative Refinement)という技術を使って、最終的 な計算結果の精度を確保するベンチマーク。 ⾼速な低精度演算と、⾼精度な仕上げ処理を 組み合わせた2段階構成 で、AI時代における スーパーコンピュータの性能を評価する。
  70. © SAKURA internet Inc. MLPerf : AIの実⼒を測る世界標準のベンチマーク 108 MLPerf(エムエルパフォーマンス)は、⼈⼯知能(AI)・機械学習(ML)モデルの 性能を公平に評価するための国際的なベンチマークスイート。2018年に、Google、

    NVIDIA、Meta(旧Facebook)、スタンフォード⼤学などの企業・研究機関が中⼼ となって設⽴した⾮営利団体「MLCommons」が主催している。 MLPerfは、利⽤シーン(ターゲット)に応じた複数のカテゴリ分け(Training(学 習)、Inference(推論)、Tiny/Edge(⼩型デバイス・組み込み)、Mobile(モバイル端 末))がある。 MLPerf Inference v5.0 ・2025年4⽉に発表された MLPerf Inference v5.0 では、 これまでのAIモデルに加え、 左記の新しいベンチマーク ワークロードが導⼊され、特 に⽣成AIやLLM(⼤規模⾔語 モデル)を重視した構成と なっている。 ベンチマーク名 概要・特徴 Llama 2 70B (Interactive) 約700億パラメータのLLMを使った対話型AI向け推論。 低レイテンシー(応答の速さ)も評価軸。 RGAT (Relational Graph Attention Network) ソーシャルグラフや薬物発⾒などに使われるGNNモ デル。グラフ構造データを扱う新分野の評価。 PointPainting (3D Object Detection) ⾃動運転などのエッジAIで使われる、カメラ+Lidar による3D物体検出。リアルタイム性が重視される。 これらはすべて 実世界のアプリケーションに即した処理内容 となっている
  71. © SAKURA internet Inc. IO500 :ストレージシステムの総合性能 109 IO500 は、スーパーコンピュータや⾼性能コンピューティング(HPC)システムに おけるストレージ性能を評価するための国際的なベンチマーク。

    TOP500が計算性能(FLOPS)を指 標にしているのに対し、IO500では、 ストレージの読み書き速度やメタ データ処理性能など、実際のアプリ ケーションに近いI/O性能 を総合的 に測定する。 https://io500.org/
  72. © SAKURA internet Inc. ベンチマークの種類まとめ 110 ベンチマーク ⽬的 評価対象 特徴

    TOP500 HPC全体の計算性能 倍精度演算 ⻑年使われている定番ランキング HPCG 実アプリに近い負荷 疎⾏列×共役勾配法 通信やメモリアクセスも評価 HPL-AI AI/HPCハイブリッド 低精度+反復改良 AI向けチップの性能も反映 MLPerf AI性能評価 実アプリのAIワークロード LLM・⽣成AI・GNNなども含む、 実⽤性重視 IO500 ストレージ性能(I/O 性能)評価・⽐較す る ファイルの読み書き速度 (帯域幅)- メタデータ処 理性能(ファイル作成・削 除など) 実際のHPCアプリを模したリアル なI/O負荷- 総合スコア(幾何平 均)で性能を集約
  73. © SAKURA internet Inc. HPL(High Performance LINPACK)で⾼性能を引き出すには? 111 HPLは複雑な数式(「連⽴⼀次⽅程式」)を⾼速に解くことで、コンピュータが1秒間 にどれだけの計算を⾏えるか(FLOPS

    ‒ FLoating-point Operations Per Second) を評価する。このソフトは、⾮常に⼤きな⾏列(たとえば100万⾏×100万列のよう な)を使って計算を⾏う。そして、それを複数のコンピュータ(またはCPU/GPUの コア)で分担して処理する。 したがって、HPLで⾼性能を引き出すには... • できるだけ⼤きな⾏列サイズ(N)を使う • ⾼速な数値計算ライブラリ(BLASなど)を使う • プロセス格⼦(PとQ)を適切に選び、通信の無駄を減らす
  74. © SAKURA internet Inc. プロセス格⼦とその配置 112 HPLでは、参加するプロセス(≒並列で動く作業ユニット)をP⾏×Q列のグリッド状(格⼦ 状)に並べて管理する。これを「プロセス格⼦」と呼ぶ。 例えば、8個のプロセスを使う場合には、次のような配置が考えられる。 •

    P=2, Q=4 (2⾏4列) • P=4, Q=2 (4⾏2列) • P=1, Q=8 (1 ⾏8列) このプロセス格⼦を単位にして、NxNの巨⼤な⾏列を複数のプロセスに分割して処理をする のがHPLの実装になっている。 この配置は、計算性能や通信効率に影響する重要な設計ポイント
  75. © SAKURA internet Inc. PとQの設計⽅針 113 HPLでは、⾏列をこのP×Qの格⼦に沿って分割して配置し、それぞれのプロセスが⾃分の担当 分を計算する。計算の中には、 • ⾏⽅向に情報を送る(Qに依存)

    • 列⽅向に情報を送る(Pに依存) といった通信(データのやり取り)が発⽣する。 つまり、P,Qのバランスによって、 • 通信が効率的にできるか • 計算の負荷が均等に分散されるか が決まってくる。⼀般には、PとQの⽐率が偏りすぎない(例えば、P≒Qのように近い値)⽅ が良いとされる。 加えて、HPLでは、プロセス間の通信に「バイナリ交換(binary exchange)」アルゴリズム が使⽤されている。このアルゴリズムは、プロセス数が2の累乗である場合に最も効率的に動 作する。具体的には、プロセス数が2の累乗であると、通信ステップ数が最⼩限に抑えられ、 全体の通信時間が短縮される。
  76. © SAKURA internet Inc. PとQの設計の実際(さくらONEの場合) 114 (ノード、GPU数(ノード数x8)、P、Q)の組み合わせで、 88、704、32、22 92、736、16、46 92、736、

    8、 92 96、768、32、24 96、768、16、48 96、768、 8、96 98、784、16、49 と試して、最終的には (98、784、16、49)が最良。