Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

「エッジ×分散生成AI」の技術と変わる産業、そしてITの未来

Avatar for piacerex piacerex
December 23, 2025

 「エッジ×分散生成AI」の技術と変わる産業、そしてITの未来

Avatar for piacerex

piacerex

December 23, 2025
Tweet

More Decks by piacerex

Other Decks in Technology

Transcript

  1. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい エッジ × 分散生成AIの技術 と変わる産業、そしてITの未来 Aug. 13, 2025

    ver 0.1 created. Oct. 19, 2025 ver 0.5 updated Oct. 26, 2025 ver 0.7 updated Nov. 01, 2025 ver 0.8 updated Nov. 02, 2025 ver 0.9 updated Nov. 03, 2025 ver 1.0 updated Dec. 13, 2025 ver 1.5 updated Dec. 17, 2025 ver 2.0 updated 株式会社DigiDockConsulting 常務取締役CETOほか5社CxO Elixirコミュニティ「fukuoka.ex」「ElixirImp」「LiveView JP」オーガナイザ 国際カンファレンス「ElixirConf JP」ファウンダー 北九州市立大学 「プログラミング論」教授級非常勤講師 北九州高等専門学校 特命教授 / コンピュータ研究部 指導員 AIスクール「AIジョブカレ」福岡校開校講師 piacere / 森 正和 2025.12.19 Fri. 【スマートものづくり研究会】AIセミナー
  2. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい はじめに • 本講義は、非力なエッジデバイス上に大規模言語モデル (LLM) 、いわゆる生成AIを搭載させたら何ができるのか を共有し、さらに遠隔地に分散配置すると、産業がどの ように変わってゆくのかを学ぶセッションです

    • 最新の生成AI進化とエッジでローカルAIを動かす方法に 触れた後、今後のAI進化を妨げる社会問題からローカル AIが必要となる背景についても触れます ◦ 感想などあれば右下のQRから「お問い合わせ」でお送りください • エッジx生成AIの活きた例として、GPU無の 非力なノートPC上のローカルAIエージェント 「piaちゃん」とのお喋り (2パターンほど)
  3. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい 目次 02 03 04 01 05 06

    自己紹介 & 自社紹介 生成AI認知後の高知セミナーとその後 エッジ×分散生成AIの技術と変わる産業 質疑応答タイム① AIはバラ色 … だけで無く忍び寄る問題 … ということで解決することにしました 07 AIに依存する「人の愚かさ」への対策 08 質疑応答タイム②
  4. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい my favotite technologies & implements => real

    / realization digitalization digital twin (VR/AR) => X/ Resonite @piacere_ex Qiita / Github / YouTube / Discord @piacerex 44年前からプログラマ (職業歴は31年) PL/PM歴 29年 PdM歴 21年 PO歴 17年 アジャイル歴 25年 (eXtreme Programmingメイン) 書けるプログラミング言語 159言語 IT経営歴 15年 VR/AR歴 5年 コスプレ歴 2年 小3でゲームプログラミングを始め、現在もプロダクト とOSSを開発するエンジニア+6社経営+技術顧問2社 大手企業をメイン顧客とし、新規事業+プロダクトの 同時立上げ支援とUX・D2C、データマーケティング、 並行・分散/VR・AR・AI融合、独自HW技術を提供 fukuoka.exほか技術コミュニティを複数主催し、毎月 イベント開催とLT、ライブコーディングを国内外展開 AIとプログラミングの講義も、大学/自治体/企業に piacere / 森 正和 “piacere” is an Italian word, means “Joy”
  5. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい fukuoka.ex#53 Elixir Lightning Talks!! fukuoka.ex#54 Elixirで宇宙衛星/エッジ コンピューティング/Web

    @マネーフォワード 【東京←→福岡2拠点開催】 QUNOG 10周年祝 fukuoka.exとkokura.ex って何ソレ、美味しい? … つまみ食い コロナ明けからは メイドアバターのコスプレで登壇/司会
  6. ver 1.0:2023/3/9 fukuoka.ex#53 Elixir Lightning Talks!! ver 1.8:2023/6/2 ミニスカ実装 (暑くて…)

    ver 1.9:2023/6/15 ver 2.0:2023/6/22 fukuoka.ex#54 Elixirで宇宙衛星/エッジ コンピューティング/Web ver 2.6:2024/10/11 50歳でコスプレ/女装 友達が100人増えたw ver 2.5:2024/10/9 ver 2.9:2024/10/18 QUNOG 10周年祝 fukuoka.exとkokura.ex って何ソレ、美味しい? … つまみ食い 20代後半に戻る50歳 体重:-9.5kg 体脂肪:-8.9kg (-9.3%) ウエスト:-16cm 血管年齢:-28歳 シックスパック30年ぶり ver 3.0:2024/10~11 青髪メイド以外のブランチ もテスト → ピボット ver 3.5:2024/11/17 門司港コスプレピクニック キャラものコスプレイヤーとしてIT登壇以外に進撃 ※コスプレ/女装はあくまでアバターの実体化(`・ω・´)ゞ ガチ感高めだが、そっちの趣味に目覚めたとか、恋愛的好みが変わった等では無いw ver 0.0:2020/5/24
  7. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい nana: 外出先からオートロック解除で置き配+不在票要らず 北九州マンション3棟に導入済 → 200戸 x 10棟マンション級の準備中

    自動ドア開閉はAzure IoT Hub経由、 インターフォン代わりのスマホアプリ とエントランスに置く部屋呼出用iPad ElixirDesktop製 Instagram … https://www.instagram.com/kyouei.taro/reel/DIAs5t5T87a full purduct
  8. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい nonfi: VR/CADデータを現実世界に現界 (まるで固有結界) 土木現場や高校の授業、BIMに採用 → AI+AR観光案内に転用開始 AR

    グ ラ ス に よ る 一 人 者 視 点 + 実 物 の 第 三 者 視 点 カ メ ラ .mp4 RTK測位で誤差2cm位置合わせ実現、VR/CADデータをリアルタイム反映
  9. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい Bright: スマホでポチポチすればスキルup & 成長可視化 医療向けバージョンもローンチ → IT版を遥かに超えるパイに拡大予定

    • 400いいね超えの開発ストーリー、Qiitaコラムあります ◦ 「Elixir Bright 今」でググってください full purduct https://bright-fun.org from エンジニアとデザイナー、 マーケター、PdM/PjM/ PMM等、プロダクト開発に 携わるメンバーや管理者の スキルを見える化できる 現在スキルだけで無 く過去の成長履歴も 確認できるので成長 スピードを比較可能 チーム全員のスキル バランスも一覧化
  10. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい CodeLingo: AIで生産性3倍の自走エンジニアを高速育成 研修+eラーニング教材制作ノウハウSaaS化 → IT以外の研修にも展開 https://app.codelingo.tech/users/register from

    full purduct プロンプトを入力する だけで教材と、教材に 沿ったテストをAI生成 (専門知識が無くても AIがフォローします) 既存のLMS/XLPに 後付けで補足教材や テストを追加も可能 先日開催された NexTech Week にブースを出展 教材 テスト AI
  11. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい オマケ:昨年開催の感想コラム、嬉しいです • KintoneやLivebook等の ノーコードと生成AI/ IoTを組み合わせた活用 と落とし穴などの最新 技術を得られたそうです

    • ElixirやElixirChip、FPGA などは技術好きにとって たまらないとの感想も 2,000名が聴いたElixirChipネタが後半で出てきます!! • 「廣瀬製紙 AIセミナー」で検索すると読めます
  12. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい 高知セミナーで触れていない直近2年のAI進化 • ①AIエージェント ◦ ハイパーパーソナライゼーション … 誰の要求に答えるか?

    ◦ MCP (Model Context Protocol) … どう文脈をAI間連携するか? ◦ マルチエージェント協調 … どうAIを役割分担させ合意させるか? ◦ ガードレール … どこまでAIに任せ、どこでAIを止めるか? • ②モデル進化とローカルLLM 青字: ローカルLLM 紫字: プログラミング特化 ◦ 【OpenAI】GPT-5、Codex、Sora 2 (動画生成) ▪ ローカルLLM … gpt-oss ◦ 【Google】Gemini 3、Gemini Code、Imagen 4 (画像生成) ▪ ローカルLLM … Gemma3 ◦ 【Anthropic】Claude 4.5 ◦ オープンソース … DeepSeek-V3/DeepSeek-Coder-V2、 LLaMA 4【Meta】、Qwen 3/Qwen-Coder 3【Alibaba】 ◦ ローカルLLM実行環境 … Ollama、LM Studio、llama.cppなど
  13. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい 高知セミナーで触れていない直近2年のAI進化 • ③RAG ※オープン型AIに出しにくい社内文書がローカルAIで出しやすくなった ◦ 企業データ/内部秘匿文書の活用 ◦

    非力なPC/エッジ/IoT/スマホでの生成AI駆動 • ④分散学習 ※ローカルLLMを学習させやすい環境になり、リリースが相次いだ ◦ フェデレーテッドラーニング (FL) … 複数分散データから学習 ◦ Cached-DFL (Cached Decentralized FL) … FLを物理空間に展開 ◦ DePIN (Decentralized Physical Infra NWs) … オープンNW分散 ◦ Centralized Distributed … 中央管理下で分散計算を最大効率化 ▪ NVIDIA Blackwell … GPU間のNW直接接続 (NVLink※利用) ▪ DDS … データ供給とI/Oを分散/最適化し、GPUを待ち削減 ▪ DPDPU … DPU※に通信/前処理/集約処理を代替 ▪ SmartNIC※統合 … AI勾配共有/同期処理をデバイス側で代替 ※NVLink:GPU同士を直接接続し、CPU/OSをバイパスする接続規格 ※SmartNIC:暗号化やRDMAなどの通信処理をCPU/OSの代わりに実行するPCIe NIC ※DPU (Data Processing Unit):演算機を搭載したPCIe NICで、通信と通信以外を代替
  14. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい 高知セミナーで触れていない直近2年のAI進化 • ⑤産業特化型AI ◦ 製造業 ▪ Siemens

    MindSphere:IoTデータから予知保全や稼働率向上 ▪ Siemens Industrial Copilot:製造業用デジタルアシスタント ▪ Boschスマートファクトリー:工場内センサーから自律思考 ▪ Honeywell Forge Manufacturing:産業向けAIエージェント ▪ Rockwell Automation FactoryTalk:OTデータ統合/分析 ◦ エネルギー ▪ Siemens Smart Grid:電力網エネルギー需供のAI監視/調整 ▪ GE Grid Solutions:AIで送電網の安定化と障害予測 ▪ Schneider Electric:AI電力/冷却/排熱管理データセンター ◦ モビリティ/自動運転 ▪ Waymo:AIによる人間よりも安全な完全自動運転タクシー ▪ Tesla FSD:車載AIによる高度運転支援・自動運転 ▪ Mobileye SuperVision:量産車向け運転知覚/運転支援AI
  15. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい 高知セミナーで触れていない直近2年のAI進化 • ⑤産業特化型AI (続き) ◦ 物流/サプライチェーン ▪

    C3 AI Supply Chain:需要予測・在庫・物流最適化AI ▪ Maersk Remote Container:コンテナの遠隔監視と品質管理 ▪ Amazon Robotics:倉庫内ロボットの自律制御と最適化 ◦ 医療/ヘルスケア ▪ GE HealthCare Edison:医療機器データ統合と診断支援AI ▪ Siemens Healthineers AI:放射線画像診断向けAI ▪ Philips HealthSuite:医療IoTデータの統合・分析基盤 ◦ 農業 ▪ John Deere See & Spray:AI画像認識で農薬最適散布実施 ▪ Bayer Climate FieldView:作物/土壌データ解析で最適化 ▪ クボタスマート農機:農機の自動化/遠隔監視
  16. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい 高知セミナーで触れていない直近2年のAI進化 • ⑤産業特化型AI (続き) ◦ 小売/店舗 ▪

    Amazon Go:画像認識とAIによる無人店舗 ▪ Zebra Smart Retail:店舗IoTとリアルタイム分析 ◦ 人事評価/人材育成 ▪ toggle Slack × AI人事評価 ▪ Bright、CodeLingo ※自己紹介で紹介した自社SaaS
  17. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい 非力なエッジデバイスでも動かせるローカルAI • 3年前のローカルLLMは、高性能PC/GPUが必須だった が、精度を実用的な範囲に保ったまま小型化した経緯で これまで通りの生成AIの進化と異なる変化が訪れている • このpiaちゃんも、GPU無しの非力なノートPC上で大規模

    モデルを動かして実現したが、速度/精度は充分実用 • より非力なスマホやIoT/エッジデバイスで動かす手法も あり、以下のようなものが有効である ◦ 蒸留:大規模モデルの特徴を小型軽量モデルで再現 ◦ 量子化:扱う数値を浮動小数点よりサイズの小さい整数に落とす ◦ LoRA (Low-Rank Factorization):低ランク行列の積に分解 ◦ Fine Tuning:モデルの精度を特定業務に特化させて再学習 ◦ プルーニング:寄与率の低い各種パーツを除去
  18. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい ローカルAIをオフィスや工場で使うメリット • 情報・ノウハウ流出/セキュリティリスク回避 ◦ ローカルAI利用が企業内や工場内に閉じることで、情報やノウハウ の流出リスクと、セキュリティリスクが各段に減る •

    クラウド課金削減 ◦ ローカルAIを動かすには、非力なエッジデバイスで充分なので、デ ータセンターやクラウドが不要となり、課金を削減できる • 自社向けに特化したカスタマイズ ◦ ローカルAIを自社向けに自由にカスタマイズしやすい • ※上記とは全く異なる観点で、とある2つの今後、私たち が遭遇する問題解決も、ローカルAIを使うことで叶えら れる … コレは最後に解説
  19. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい ①最初にローカルAIを試すならLM Studio • AIチャットだけで良いのであれば、LM Studioで気軽に ローカルAIを使い始められます ◦

    Gemma3を始め、前章で紹介した様々なローカルAIを検索できる ので、様子を見るのも簡単です ◦ 良かったら、皆さんも一緒にやってみましょう デモ
  20. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい ②ノーコードDifyで簡単にローカルAIを使える • 昨年ご紹介したノーコード「Dify」でも会話エンジンや 独自アプリをノンプログラマでも作れます ◦ RICOHが企業向けに提供しているサービスと同じものが作れます ▪

    「RCOH Dify 展開」で検索 • 良かったら、皆さんも一緒にやってみましょう ◦ まず、クラウドDify+クラウドAI+RAGで作ってみます ▪ ※RAGした文章はDify側で見られてしまうので要注意 ◦ 続けて、ローカルDify+ローカルAI+RAGでも作ってみます ▪ RAGした文章はお手元のPCの外には漏れないのでコレで安心 デモ
  21. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい ③piaちゃん:VR AIエージェントも作れます • 音声会話できるVR AIエージェントも割と簡単に作れます ◦ ローカルAI:OllamaでLiveViewからgemma3をロード/実行

    ◦ 音声入力:JS Web SpeechをLiveViewに送り、テキストLLM推論 ◦ 音声出力:ローカルVOICEVOXサーバーを呼び、推論テキスト発声 ◦ VR口パク:VOICEVOX発声をJSで音量計測して、音量で口を変形 • VR化すれば社内ヘルプデスクや展示会も ◦ 展示会で「1人の接客要員」として動かした ◦ 作り方は「Qiita LiveView VRM」で検索 デモ NexTech Week でVR AIエージェ ントが接客した
  22. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい 更にローカルAIが各現場に分散すると叶うこと • a)「考える場所」を各現場のデータの近くに戻せる ◦ センサーやドローン等が配置された現場がローカルAIで判断の主体 となり、通信遅延や回線断、クラウド停止で意思決定を遅らせない •

    b)複数現場の秘匿情報も外に出さずにAIクラスタ化 ◦ 工場や医療、社内限の情報やノウハウをクラウドやオープン型AIに 渡さず、複数拠点のローカルAI群で秘匿しつつ、積み上がる • c)オープン型AIの中央集権で不可能なスケールが可 ◦ 1台あたりは非力なエッジ上のローカルAIでも、数や地理的近接の 配置、役割分担によって、全体として高度な知性を持たせられる • d)人を入れ替えず「人の判断を支援するAI」が組める ◦ 現場の専門職/管理者判断を即時にローカルAIが補助し、最終責任 だけは人が受け持つ業務設計/改善が組みやすくなり、生産性向上
  23. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい エッジ×分散生成AIで産業はこう変わってゆく • ①現場に「考える責任」を戻し、現場同士が助け合う ◦ a)これまで本社やMES (製造実行システム) /SCADA

    (監視制 御・データ収集システム) に集約していた判断が、ラインや設備、 その工程単位に各現場に配置されたローカルAIによって管理される ◦ c)その結果、 異常時の一次判断や暫定対応、エスカレーション が現場で完結する業務となる一方で、全ての現場の知見共有により AIを経由した現場同士の助け合いやイチ現場では難しい対処も叶う • ②ノウハウの属人化を脱し、現場の誰もが準ベテランに ◦ b)ベテラン作業者の判断パターンが、ローカルAIとして拠点内に 蓄積されていき、人の異動や退職、世代交代がリスクでは無くなる ◦ d)現場担当者はローカルAIの支援も受けられるし、専門職/管理 者判断も即時にローカルAIが補助するので、人を中心とした業務の 改善が進みやすくなり、現場の誰もがベテランや専門職のノウハウ を持ち、管理者も納得できる仕事の在り方が実現する a)「考える場所」 を各現場のデータ の近くに戻せる c)オープン型AIの 中央集権で不可能 なスケールが可 b)複数現場の秘匿 情報も外に出さず にAIクラスタ化 d)人を入れ替えず 「人の判断を支援 するAI」が組める
  24. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい エッジ×分散生成AIで産業はこう変わってゆく • ③全社最適よりも「現場の違い」が前提の最適化へ移る ◦ a)同じ製品/同じ設備であっても、ローカルAIが現場ごとの癖や 環境、熟練度の違いを吸収してくれる ◦

    d)これにより、「全社統一のルール」を押し付ける運用やルール 策定の負荷が減り、より現場に適したルールや運用が作られてゆく こととなり、各現場がそれぞれ最適化される • ④AI導入の評価軸がROIから「事業機会耐性」に変わる ◦ a)ローカルAIにより通信遅延や回線断、クラウド停止などに左右 されない意思決定や運用が可能となるため、「現場を止めずに動か し続けられる」ことが価値となり得る ◦ a)これはAIに対する投資や導入コストを、「ROI」のような雑な 評価指標では無く、いかに事業のダウンタイムを減らし、収益機会 や商談ロスを無くせるかと言う「事業機会耐性」への投資やコスト 効果として評価できるようになる a)「考える場所」 を各現場のデータ の近くに戻せる d)人を入れ替えず 「人の判断を支援 するAI」が組める a)「考える場所」 を各現場のデータ の近くに戻せる a)「考える場所」 を各現場のデータ の近くに戻せる
  25. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい エッジ×分散生成AIの具体的な産業への適用例 • ⅰ)医療/介護現場の「ローカルAIケア」と人への連携 ◦ 医療/介護の現場は、患者の状態変化をイチ早く察知できることが 重要だが、個人情報の制約からオープン型AIは使えないので、病棟 や施設単位にローカルAIを配置し、バイタル/行動データを施設毎

    で解析/判断させ、各患者の症例の傾向に合わせた異常兆候検知と 注意喚起の初動判断はローカルAIが行い、最終判断は医師/看護師 /介護士へと連携する ◦ さらに、各病棟/施設に配置されたローカルAI同士が、患者の個人 情報やカルテそのものを外部に出すこと無く、症例の傾向や状態の 変化パターンのみを共有することで、単一施設では気付くのが困難 な兆候や進行パターンをより早い段階で検知できるようになる ◦ これにより、「重篤化してから対応する医療/介護」で無く、状態 変化の兆しで動ける「予測で先手を打つ医療/介護」が実現する
  26. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい エッジ×分散生成AIの具体的な産業への適用例 • ⅱ)自治体は地域防災を「常時判断系」へと再定義 ◦ 防災対策はハザードマップや避難計画ありきだが、災害時は雨量/ 河川水位/土砂などが刻一刻と変わるため、河川や道路などに配置 されたセンサー群と監視カメラ群をローカルAIで常時判断させる

    ◦ 通信断やクラウド停止が起きても、各地区単位で判断を続けられ、 近隣自治体のローカルAI間で被害パターンや避難誘導の成否を共有 することで、イチ自治体では難しい災害知見が積み上がってゆく ◦ こうした工夫により、防災判断は事前の計画を踏まえるだけの行為 では無く、現場の状態を読み取り続ける継続的な意思決定プロセス へと変わる ◦ 自治体職員は、全てを現場で判断し続ける役割から、ローカルAIが 提示する選択肢を確認し、最終判断と住民への説明責任を担う役割 へと移行する
  27. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい エッジ×分散生成AIの具体的な産業への適用例 • ⅲ)抹茶農家を始めとする「後継者問題」の解決とDX化 ◦ 現在、人気があるが、後継者問題を抱えている地方産業 (たとえば 抹茶農家など)

    に対し、IT開発のリモートワークと、農場や加工場 をローカルAIと接続されたドローン群/衛星データでDXする仕事 の2つの仕事を行う「半農エンジニア」を育て、移住等も支援する ◦ 各農場/加工場のAI同士を連携させることで、DX化された農場と 働き手が両立し、経済的安定を叶えつつ、後継者問題も解決する ◦ 栽培条件や加工ノウハウを判断の結果や傾向として共有することで、 イチ農場では得られない知見が分散的に積み上がってゆく ◦ 「個人の経験に依存する地方産業」から「地域全体で知性を高める 産業」へと変貌し、「継ぐ」は「改善し続ける」へと置き換わる ◦ 「地元で起業」だけで無い打ち手でもあり、10年間の思索の上で 導き出せた、私なりの地方創生の回答例でもある
  28. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい 2030年のIT電力消費量は3倍、2050年91倍 • CiscoのデータセンターIPトラフィック実測値を土台に、 IT全体の電力消費量が毎年CAGR20%で拡大するIPトラ フィック量に比例し、年効率改善は1.5%とする前提※で 電力消費量を算定 ※下記JST低炭素社会戦略センターの「情報化社会の進展がエネルギー消費に与える影響

    (Vol.1) で用いら れている算定方法を採用 … なお本レポートの想定は上記算定より悲観的である https://www.jst.go.jp/lcs/pdf/fy2018-pp-15.pdf • 2030年の電力消費量は現在の2~3倍、2050年には現在 の69~91倍まで増加 (現総発電量の3倍を超えている!) Cisco Global Cloud Index 2015-2020 https://www.cisco.com/c/dam/m/en_us/ser vice- provider/ciscoknowledgenetwork/files/622_1 1_15-16-Cisco_GCI_CKN_2015- 2020_AMER_EMEAR_NOV2016.pdf Nokia Global Network Traffic Report 2023-2033 https://www.nokia.com/asset/213660/
  29. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい 何もしなければ2030年には使えなくなる … •現在のIT消費は1,037~1,380TWh/年で、総発電量は 30,856TWh/年のため、IT全体の電力消費量は総発電量 の3.3~4.5%を占める • 2030年

    … 総発電量かIT利用割合を3倍に増やすか、コン ピュータの消費電力を67%削減しなければならない ◦ 総発電量増加で実現 … 全世界6万基の発電所を18万6千基に増加 ◦ IT利用割合増加で実現 … IT以外の電力消費の7~10%削減が必要 ◦ どちらもあと5年で社会を根底から大変革するレベルでほぼ不可能 • 2050年 … 総発電量を91倍に増やすか、消費電力 98.9% 削減 (現在の僅か1%!!) が必要 ◦ 総発電量増加で実現 … 発電所数を6万基から546万基に増加 ▪ 地表面には収まる一方、建造資源が賄えない ICT energy evolution: Telecom, data centers, and AI https://www.ericsson.com/en/reports-and-papers/white- papers/ict-energy-evolution-telecom-data-centers-and-ai Global Electricity Review 2025: Global Electricity Trends https://ember-energy.org/latest-insights/global- electricity-review-2025/global-electricity-trends
  30. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい 生成AIの盛り上がりによる電力不足のせい? • 生成AIが広く認知された 2023年後半、AIの電力 消費に注目が集まる ◦ 2023年末にQiita

    コラム でこの件まとめています ◦ 「Qiita AI Elixir」で検索 • データセンター電力不安 等で住民反対運動も増加 ◦ 国内だと印西市や日野市 ◦ 海外だとテキサス州やペン シルバニア州、ウィスコン シン州、ニューメキシコ州 が有名
  31. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい いいえ … AI以前にWeb+NWの方が2倍深刻 • 2024年時点でWeb+NWの電力消費量はAIの2倍もあり AIの方が高いCAGRであっても追いつくには時間がかかる ◦

    全世界データセンター合計 … 約415TWh/年 ◦ うちAI関連 … 約140 TWh/年 ◦ うちWeb+NW関連 … 約275 TWh/年 (AIの1.96倍) Data centre electricity consumption by region, Base Case, 2020- 2030 https://www.iea.org/reports/energy-and-ai/energy-demand-from-ai Data center energy and AI in 2025 https://www.devsustainability.com/p/data-center-energy-and-ai-in-2025
  32. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい 根本原因は「コンピュータのアーキテクチャ」 • これらの問題は、現代コンピュータを支えるノイマン型 アーキテクチャの「フォン・ノイマン・ボトルネック (以降VNBと略)」に主要因がある ◦ 1命令毎のメモリアクセスがあり、CPU/GPUよりも激重なメモリ

    を待つムダもあり、ムダな電力消費 と 性能劣化、排熱 が起こる • ローカルAIを動かすのには非力なエッジで充分な一方、 そのローカルAIを作るには、GPUを搭載した大規模なデ ータセンターが必要 (クラウドもDCが必要) • AIとコンピュータには、電力消費量をムダ に増大させる、VNBを含む7つの課題が ある
  33. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • 生成AIの中核「Multi-head Attention」※はGPU向き で無い処理が60%もあり、HW性能を引き出せていない ※GPT-4以降は改良版の「Grouped Query Attention」だが、下記課題は共通している

    ◦ a)O (n²) メモリ輻輳x5 (スコア行列、加重和ほか) ◦ b)並列化を阻害する依存構造 ▪ 全トークン同士の依存 ▪ 未来トークン参照禁止依存 ▪ 分岐待機 (動的マスク等) ◦ c)分割演算が苦手 ◦ d)ランダムアクセスが苦手 ▪ QからK参照、スコアからVの加重和、動的マスク、MoEバッチ 課題①: 生成AIの60%はGPU向きでは無い
  34. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • e)学習時固有の問題点 FFN/MoE/Router/LayerNorm/Softmax含む ◦ 小型処理GPU占有 … LayerNorm/Router等で失速

    ◦ 小バッチが苦手 … Fine TuningやLoRAでは性能出ない ◦ HBM帯域不足 … 数T b/s程度ではGPUコアを持て余す ◦ NW速度制約※ … 大規模AI学習はNW遅延でGPUが遊ぶ ※1 課題④「VNBが原因でNW帯域をフル活用できない」で詳述 • f)推論時固有の問題点 ◦ 小バッチ/少トークン… 推論時には性能が出ない ◦ 過剰パーツ消費電力 … 推論だと稼働しないGPUコア/HBM ◦ 量子化が苦手 … INT4等や混合ブロック精度に未対応 ◦ リアルタイムが苦手 … GPU自体そもそも向いてない ◦ 学習以上に推論のムダな電力消費/性能劣化が甚大!! 課題①: 生成AIの60%はGPU向きでは無い
  35. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • 現行CPU/GPUの性能向上は、プロ セスルールが幅を利かせているが、 既に各種限界に制約され、頭打ちに • 1nm縮めても消費電力/性能劣化は 約15%向上だが、下記VNB損失量

    はその2~3世代分とかなり大きい ◦ CPU性能と比べ、メモリアクセスは遅く、CPUが空回りしている ◦ 命令とデータが共通バスで同時アクセスされ、競合するため詰まる ◦ 生成AIでは大型テンソル転送と分岐待機多発でVNB損失より顕著 • にも関わらず、VNBはプロセスルールほどはCPU/GPU の性能向上として注目されていない 課題②: VNBはプロセスルールより影が薄い 4nmまで通用したFinFETは 3nm以下では歩留まり、 GAAFETでの解決は、物理/ 加工精度/配線/経済の各限 界が同時発生、頭打ち
  36. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • 2014年まで改善し続けたDCのPUE (≒電力効率) は冷却 /電源設備の負荷増大で横ばいで、コレ以上CPU/GPU の高性能化はDC運用としてペイしない限界を迎えている •

    冷却/電源設備の負荷増大の原因 は、CPU/GPUの排熱の増加で 2014年以降、冷却設備の消費電力 の方が上回ってしまった • 建設地域の電力をDCが占有したり 排熱ヒートアイランド懸念で住民 反対運動の火種になっている 課題③: 電力増加による高性能化はもう限界 平均PUEは1.58 都市型は1.5~2.0で この平均より低い
  37. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • NWパケット処理はVNB4点 x 上下8点で演算より深刻 • SmartNIC/DPU/GPUDirect/XGMI/CXL/RDMA/ NVLink等により、NWからOS手前の前半部は改善するが

    OS以降からアプリまでの後半部分は改善できない ◦ フォトニクス (NVLink OpticalやIOWN等) でも同様 • NW機器にもVNBがあり、回線使用率10~40%に留まる 課題④: NW帯域もVNBでフル活用できない NW回線 NIC VNB発生① PCIe内振り分け メモリにDMA転送 VNB発生② 割り込み OSでTCP/IP処理 VNB発生③ アプリ VNB発生④
  38. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • コンピューティングが大量ユーザー (2010年以降)/大量 データ (2015年以降) へと変わり、CPU/GPUもマルチ コア主流

    (2003年以降) となっているが、2010年以前に 誕生した言語が慣例的に使われ、マルチコア対応が困難 ◦ マルチコアはアイドル状態でも40%近い電力を消費し、シングル コア向けプログラミングをすると、ムダな電力消費が放置される • メモリ破壊的更新は、キャッシュ コヒーレンシとロック管理で性能 劣化/消費電力増大/実装複雑化 • その回避や性能担保のために プログラマが苦労を強いられる 課題⑤: シングルコア前提の言語が主流 年毎の最新CPUクロック周波数の変化 Hennessy, J. L. and Patterson, D. A.: Computer Architecture: A Quantitative Approach, Morgan Kaufmann, 6th edition (2017).
  39. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • ここまで述べたノイマン型アーキテクチャの課題を解決 すべく非ノイマン型が研究されているが、実用になって いるもの※は特殊目的向けの僅かのみ ※Google TPU、Perfered Network

    MN-Core、Graphcoreなど • もしプログラミングの機会があっても、普通のWeb/ IoT/AIプログラマが使う言語※や開発知識が使えない ※言語そのものは利用できても、実際は特化DSLやHWレベルの知識が必要で困難 • 非ノイマン的プログラミング※も技術的には可能だが普通 のプログラマの範疇を超えており、全てのプログラマが 実施可能では無い ※GPUローカルメモリ高効率利用、CPUキャッシュアウト抑制などTPU的なアイデア 課題⑥: プログラマ、非ノイマン型は開発困難
  40. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • ノイマン型でもSWをHW化すればシンプルに省電力化/ 高速化できるので、ASIC/SoC/FPGA化は有望 ◦ 身近な例で言えば、レイヤー1~3 NW機器の多くはASIC/SoC化 されている

    • しかし非ノイマン型同様、ASIC/SoC開発も普通の Web/IoT/AIプログラマではプログラミングできない ◦ RTL…Verilog、SystemVerilog、VHDL ◦ HLS…C++、Scala、MATLAB、Python、OpenCL※ ※言語そのものは利用できても、実際は論理回路DSLやHWレベル知識が必要 • レイヤー4以上のNW機器がASIC/SoC化されないのも、 上記言語のASIC/SoC開発が困難でペイしない点がある 課題⑦: プログラマ、ASIC/SoCも開発困難
  41. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • 課題①: 生成AIの60%はGPU向きでは無い ◦ GPU向きで無い処理が60%も存在、推論ではGPUを持て余す • 課題②/③:

    VNBはPRより影薄い、高性能化はもう限界 ◦ 物性での改善は歩留まりでVNB見逃し、高性能化は排熱で頭打ち • 課題④: VNBが原因でNW帯域をフル活用できない ◦ パケット処理もVNBで大幅遅延、SmartNIC等でも解消できない • 課題⑤: シングルコア前提の言語が主流 ◦ 旧言語でHW性能が引き出せない、プログラマは苦労を強いられる • 課題⑥/⑦: 非ノイマン/ASIC/SoC開発不可 ◦ 普通のWeb/IoT/AIプログラマは非ノイマンやASIC/SoC開発難 HW性能が台無しな今のAI/NW/OS/言語
  42. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • DC現役のXeon Silver 4309Y/Gold 6326比較で性能 2.1倍、電力96.5%削減、価格1/3、PPW60倍 •

    Gold 6442Y比較で性能0.6倍、98.6%削減、価格1/15 • 10台あればEPYCやThreadRipperの最新機性能に匹敵 電力90.4%削減、価格1/3 … スパコンとバトれる? 詰まないためのチップ「ElixirChip」を作った
  43. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • 前述のFPGA版ElixirChipは廉価FPGA「KR260」の成績 ◦ 10年前のプロセスルール16nmだがXeon Silver/Gold同等性能 • 「Versal

    HBM」で3~7倍上乗せ … GPUとバトらせる ◦ NICも光トランシーバ搭載なので、課題④解決でNW性能10倍up 10年前のプロセスルールで現役に匹敵できる
  44. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい ①解決: FPGA版ElixirChipは生成AIにマッチ • GPUは生成AI実行時に60%のムダがあったが、FPGA版 ElixirChipはそれらムダを下記によって大幅に緩和 ◦ a)O

    (n²) メモリ輻輳x5 ※トークン数はモデルに依存 … 3~10倍 ▪ ~400トークン: メモリ転送削減 (BRAM/UltraRAM上搭載) ▪ ~8,000トークン: HBMプリフェッチ (HBMからBRAM/ UltraRAMにストリームプリフェッチでオンチップ処理化) ▪ それ以上: DDRプリフェッチ (DDRからHBMもプリフェッチ) ◦ b)並列化を阻害する依存構造 …5~10倍 ▪ マルチヘッド/トークン依存/MoEはHWパイプラインで演算 を独立化し、結果を集約すれば、分岐待機を緩和できる ◦ c)ヘッド分割でコア性能劣化 …2~6倍 ▪ 各ヘッド用HWパイプラインでヘッド間移動不要、CC除去
  45. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい ◦ d)ランダムアクセスが苦手 … 3~10倍 ▪ Q/K/VをHBMからBRAM/UltraRAMにストリームプリフェ ッチ/オンチップ化し、ランダムアクセスを高速化

    • e)学習時固有の問題点 FFN/MoE/Router/LayerNorm/Softmax含む ◦ HBM帯域不足 … 2~5倍 ▪ BRAM/UltraRAMにオンチップ化し、HBM帯域依存を緩和 ◦ 小型処理GPU占有 … 2~4倍 ▪ 小型処理を各独立でロジック化できるので占有無 ◦ 小バッチが苦手 … 2~4倍 ▪ 小バッチに最適化されたHWパイプラインで効率低下は無 ◦ NW速度制約 … 2~8倍 ▪ RDMA/NVLink転送相当をFPGA上でストリーム化 ①解決: FPGA版ElixirChipは生成AIにマッチ
  46. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • f)推論時固有の問題点 ◦ 小バッチ/少トークン … 4~12倍 ▪

    バッチ単位/トークン単位に最適化されたHWパイプライン ▪ ヘッド/トークンをBRAM/UltraRAMストリームプリフェッチ ◦ 過剰パーツ消費電力 … 4~10倍 ▪ 未使用ブロックを個別に停止 or 省電力化 ◦ 量子化が不得手 … 2~6倍 ▪ INT4等や混合ブロック精度を混在可能 ◦ リアルタイム不得手 … 4~12倍 ▪ 入力直後からの即時処理はFPGAの得意分野 ▪ GPU特有のカーネル切替/分岐・小規模演算待機などが無い ▪ Attention/FFN/Embeddingを並列パイプライン化し高速化 • 推論性能20倍/省電力70% (学習8倍/省電力60%) ①解決: FPGA版ElixirChipは生成AIにマッチ
  47. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • 特許に触れるため概略のみだが、非ノイマン化でVNBを 極力無くし、省電力と性能向上を根本解決 ◦ ノイマン型CPU/GPUのような1命令1メモリアクセスとしない ◦ DDR/HBMを極力使わず、LUTやBRAMの活用でメモリ転送除去

    ◦ データフローで実装できる言語仕様からデータアクセス最適化 ◦ 分岐待機/メモリ転送待機をパイプラインで独立化 ②解決: 非ノイマン化でVNB大幅緩和 従来CPU/GPU ElixirChip メモリ メモリ ① ② ③ ④ ⑤ ① ② ③ ④ ⑤ list = [1, 2, 3, 4, 5] list |> Enum.map(& &1 * 3) |> Enum.filter(& &1 >= 8) |> Enum.sum() ① ② ③ ④ ⑤
  48. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • CPUは1Uに1~2枚搭載に対し、KR260 ElixirChipは1U に4~8台可で敷地あたり性能Xeon Goldの2.4~4.8倍 • 冷却/電源設備不要でDC運用費用38倍オトク!

    … 4億円 ◦ サーバー2,000台を4年償却、XeonGold 6326だと145~152億円 ◦ 価格あたり性能は15倍有利 ◦ 設備投資が減り、PUEは1.05に改善 ※Xeon Gold時のPUEは1.3想定 ◦ 上記に加え、敷地も1/4~1/8削減可 (その分、不動産コスト低下) ③解決: 電力/排熱増加無で高性能化を実現
  49. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • NWパケット後半のVNB除去には、パケットをNICから FPGAロジックにダイレクトに渡せる構造を構築 ◦ a)OSレイヤーを無くす ▪ NICからDMAを介さずFPGAに直接ストリーミング

    ▪ 必要に応じてFPGA内でシフトレジスタ化してバッファリング ◦ b)TCP/IPスタックをアプリと共にHW化する ▪ TCP/IPスタックとアプリをセットでFPGA化 ▪ 既存OS的なメモリ上り/下りは行わせず即時処理 • SmartNICなど併用で全VNB除去すれば、性能10倍up • 光トランシーバで「真のフォトニクス」し、40倍までup ◦ ハイエンドFPGA「Versal HBM」は標準搭載、課題①-eも解決 ④解決: NW処理後半のVNB除去で全解決
  50. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • Elixir を採用することで、下記の大量ユーザー/データ 向けの優位性と言語仕様がHW化に上乗せされる ◦ マルチコア特化 …シングルコアを一言書き換えるだけ

    ◦ データ処理特化 …並行・並列化/遅延化/QoSも容易 ◦ アクターモデル …副作用の並行利用時にロック不要 ◦ プロセスレベルのスケーラビリティ/分散 ▪ 数百万、数千万単位でプロセス起動・制御できる ▪ クラウド無でもスケールアウト/イン/仮想化可能 ◦ イミュータブル …メモリクリーン、CC解消、GC軽量 ◦ 低レイテンシ …大量パケット/ユーザー処理に有利 ◦ 耐障害性 …プロセス起動制御による障害切り離し ◦ チーム開発向き …高開発効率、高速育成/確実性 ⑤解決: マルチコア前提の言語Elixirを採用
  51. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • Elixir コードからFPGA & ASIC/SoC向けコード生成 ◦ HW知識が無い普通のプログラマでもHW開発が可能

    ◦ SystemVerilogで吐くのでHWレベルチューニング可 ◦ レイヤー4以上NW機器のHW化もペイし、更に高速化 • HW版ErlangVMもありErlang/Elixir資産も動かせる ⑥⑦解決: ASIC/SoCとFPGAをElixirで開発 ※ElixirFPGA: FPGA版ElixirChipの別名称
  52. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • 課題①: 生成AIの60%はGPU向きでは無い ◦ 解決: GPU向きで無い処理でもFPGAとElixirChipで緩和OK •

    課題②/③: VNBはPRより影薄い、高性能化はもう限界 ◦ 解決: 非ノイマン化でVNB極力無くす、冷却/電源無で高性能化 • 課題④: VNBが原因でNW帯域をフル活用できない ◦ 解決: NW処理後半のVNB除去+SmartNIC等で全解決 • 課題⑤: シングルコア前提の言語が主流 ◦ 解決: マルチコア前提の Elixir を採用すれば自ずと解消 • 課題⑥/⑦: 非ノイマン/ASIC/SoC開発不可 ◦ 解決: ASIC/SoCとFPGAを Elixir で開発できるようにする 7つの課題を全て解決するFPGA版ElixirChip
  53. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • 効果測定しやすく、ユーティリティも高い一方で、FPGA 化されるケースが少ないKR260 Webサーバー版で開始 ◦ 2025年12月リリース、某データセンターにテスト配備予定 ◦

    想定効果 … 性能向上28~36%up+消費電力67~85%削減 • 続けて下記により、性能向上61%+電力消費55%削減 ◦ アプリケーションサーバー群 ▪ APIゲートウェイ/IoTゲートウェイ ▪ 認証サーバー ▪ 動画配信サーバー ◦ レイヤー4以上NW機器群 ▪ ロードバランサー、FW、CDNなど • 並行して、Versal HBM 生成AI対応版のPoCを実施 FPGA版ElixirChipの今後のリリース予定
  54. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • 2050年の問題を現時点から解決可能なASIC/SoC版 ElixirChipを土台にすれば、現在コンピューティングで は不可能な「魔法級の実装」を叶えられる ◦ a)消費電力: 95~99%削減

    ◦ b)性能: 50~800倍向上 ◦ c)生産性: 10~40倍向上 • 消費電力面の活用① … 下記の 「異次元デバイス」が実現可能 ◦ 4.2年間、充電が不要なスマホ ◦ 104日間、飛行可能なドローン ◦ 上記2つの効果は、18万台の自動車をEV化 するか、発電所を5基削減する効果に相当 ASIC/SoC版ElixirChipで叶う魔法級の実装
  55. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい ASIC/SoC版ElixirChipで叶う魔法級の実装 • 消費電力面の活用② … PUE1.005~1.01で、敷地面積 が1/8で済み、排熱と冷却や消費電力増大に依存せずに ハイパースケールDC以上にどこまでもスケーラビリティ

    拡大できる「リミットレスDC」が作れる ◦ DC電力依存が減り、資源国/電力コスト高騰国のハンディが消失 ◦ 脱炭素/カーボンニュートラルを超えた、「ゼロヒート」産業出現 • 消費電力面の活用③ … エッジ超知能化、つまりスマホや エッジデバイス/IoTに生成AI常駐させても電力が保つ ◦ クラウド接続不要で即時応答する生成AIが利用可能になる ◦ 都市/農村/陸海空を選ばず、全ての環境で「超知能」を携帯可能 • 消費電力面の活用④ … 太陽光発電が断絶しても416日間 アクティブモードで保つ人工衛星 (従来は10日程度)
  56. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい ASIC/SoC版ElixirChipで叶う魔法級の実装 • 性能向上面の活用① … 今はメタル回線では困難に思える ユースケースでも、NW回線を使い切れば実現可能になる ◦

    ⅰ)「分散データセンター」でDC問題解決 ▪ 冷却設備/電源設備/広大な敷地の全てが不要なので、オフィ スや雑居ビルにElixirChipを配置し、NW接続でDC級パワーを 発揮できる「分散データセンター」が可能となる ▪ 住民問題勃発のデータセンター問題もコレで一気に解消できる ◦ ⅱ)エッジリアルタイムAIで通信途絶下でも困らない ▪ VNB除去でエッジサーバーでのリアルタイム大規模AIも動く ▪ クラウドまでの通信路がオフラインになってもエッジ端末とエ ッジサーバーの間で大規模AIが稼働できるようになるので、通 信途絶環境下でも大規模AIの恩恵を受けられる
  57. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • 性能向上面の活用② … 2025年時点の最高速スパコン、 実効性能1.7exaFLOPSの「El Capitan」を追い抜く ◦

    ASIC/SoC版ElixirChipは、El Capitan搭載のEPYC 9004より敷地 あたり性能2.6倍が出せ、冷却/電源設備 (大規模液冷直結、三相 高電圧入力+PDU) のコストも削れ、4.8exaFLOPSの可能性 • 下記スパコンタスクが短縮可能に ASIC/SoC版ElixirChipで叶う魔法級の実装
  58. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい • 性能向上面の活用③ … 「真のフォトニクス」と「非ノイ マン型コンピューティング」で、「真のリアルタイム」 が実現されると、本格的に現実改変が可能となる ◦

    現実空間をセンシングし、瞬時3Dプリントで即時現実空間の拡張 ◦ VRとAR、現実空間をシームレス接続する「真のデジタルツイン」 ◦ メガネ型デバイスやコンタクト型デバイスでの固有結界的世界実現 ◦ 歩行者に即時パーソナライズされたホログラム広告 ◦ 脳波/視線/ジェスチャーへの同期UI ◦ その場にいるようなリモート手術 ◦ その場で操作するような遠隔ロボット ◦ クラウド制御可能な自動運転 ◦ 群制御ドローン同時操作 ◦ 対面音声翻訳 ◦ グループMTG音声同時翻訳 ASIC/SoC版ElixirChipで叶う魔法級の実装
  59. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい AIスロップ:AI不要な処理をAI処理する愚行 • 「1+1」のような単純計算や、要約するまでの無い文章 の要約のような、AIを使うまでも無い低消費電力の処理 にAIが使われ、データセンターの処理量が圧迫される ◦ 個人はラクをしたい/企業は金儲けをしたいが故に、こうしたムダ

    なAI利用を控えない可能性が高い ◦ しかし、データセンターが圧迫されれば、AI提供企業は利用制限や 課金が必要となるため、今ほど気軽にAIが使えなくなる ◦ 気付いたら、AI以外の電力利用が圧迫されていて、気付いたら電力 不足による停電で冷暖房が使えなくなっていた … が起こる怖さ • データセンター無しでも動くローカルAIが対策になる ◦ ASIC/SoC版ElixirChip であってもAIスロップは耐え れないかもだが、ローカルAIならDCやNWが止まっても使える ◦ 今からでもローカルAIを利用すれば、データセンター圧迫を防げる
  60. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい ワークスロップ:AIが社会の生産性を下げる • AIが出した結果のチェックを手抜きした人が、不正確な データや成果物を蔓延させ、そのチェックや修正を行う 人の生産性が下がり、手抜きした人へのイライラや不信 が募り、組織全体/社会全体の生産性が下がってしまう ◦

    AIを使うことで生産性が上がるどころか、むしろ下がってしまい、 しかもAI利用による電力消費が増大しているため、大きな社会問題 となり始めている ◦ 中でも、若者は「AIが正しい」と言う思い込みが激しく、AIのメカ ニズムも把握せずに妄信する傾向が高いので、悪化が加速しやすい • 自社特化したローカルAIを磨くことで回避が可能になる ◦ ASIC/SoC版ElixirChip で性能向上しても対策になら ないが、チェックも含めてこなせるローカルAIを作れば対策になる ◦ ローカルAIの自社特化は、RAG/RoLA/Fine Tuning等で行う
  61. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい いま、人の進化が、生成AI以上に重要となった • この2つのスロップは「AIをどこで使い、どこで使わな いようにするかを決めなければならない」ということを 意味している • 生成AIが賢くなるのを待っているだけでは解決にならず

    生成AIを使う人間側が賢くなる必要がある時代の到来 • ローカルAIで自社特化AIを育てることは、業務と組織を 磨くことに繋がり、社会問題を抱えるDCやクラウド、オ ープン型AIに依存しない強さを作ることに他ならない • みなさんの現場で、今日の様々なローカルAIネタから、 業務や組織、働き方を見直すきっかけになれば幸いです
  62. Confidential GENBAサーバーとは クラウド往復をなくし、 通信断でも止まらない“現場処理エンジン” 🞐 手のひらサイズの設計も可能 🞐 低発熱/静音/100Vで動作 🞐 個人情報を外に出さず“現場で完結”

    🞐 クラウドと役割分担できる(大規模処理はクラウド、即時処理は現場) 御社の強みであるクラウド設計を 「現場インフラまで拡張できる新しい武器」 になります GENBAサーバー イメージ 44mm 430mm 480mm 工場の制御盤内に設置できる GENBAサーバースモール イメージ 35mm 120mm 120mm
  63. Confidential GENBAサーバーで解決したいこと GENBAサーバーは、クラウドだけだと少し困る場面(通信、速度、外に出したくないデータ、設置制約 など)をその場でカバーするための“小さなサーバー”です ✔ 自治体:窓口が混み合う時間帯でも、住民照会や受付画面が止まらず使えるようにする ✔ 工場:ライン監視や設備チェックが重なる時間でも、必要な画面や表示が止まらず使えるように する ✔

    病院:患者対応が混む時間帯でも、基本的な画面操作や照会が止まらず使えるようにする ✔ 防災:災害時や通信が不安定な状況でも、必要な情報表示が止まらず使えるようにする • ネットが遅い/混む場面を軽くする • 画面や操作が重くなるところを補う • 外に出したくないデータは手元で扱う • 置き場所・電源に厳しい施設でも使える 【特徴】 【施設ごと利用例】
  64. 下記の上部「お問い合わせ」 で今回講演の感想やコラボ 案などいただけたら嬉しい Build the future with Elixir and YOU

    下記中の「お問い合わせ」 で今回講演の感想やコラボ 提案等いただけたら嬉しい