Slide 1

Slide 1 text

Built-in AI und WebNN wie das Web zur GenAI-Plattform wird Christian Liebel @christianliebel Consultant

Slide 2

Slide 2 text

Hello, it’s me. Built-in AI und WebNN Christian Liebel W3C WebML WG & CG TAG Associate christian.liebel @thinktecture.com Angular, PWA & Generative AI Microsoft MVP & Google GDE (Angular, Web) wie das Web zur GenAI-Plattform wird

Slide 3

Slide 3 text

Rule-based algorithms are limited in their capabilities. Built-in AI und WebNN Why should you care? wie das Web zur GenAI-Plattform wird

Slide 4

Slide 4 text

Use AI to implement use cases that are difficult or impossible to implement using rule-based algorithms. Built-in AI und WebNN Why should you care? wie das Web zur GenAI-Plattform wird

Slide 5

Slide 5 text

Examples Built-in AI und WebNN Generative AI Cloud Providers wie das Web zur GenAI-Plattform wird

Slide 6

Slide 6 text

Drawbacks Built-in AI und WebNN Generative AI Cloud Providers Require a (stable) internet connection Subject to network latency and server availability Data is transferred to the cloud service Require a subscription wie das Web zur GenAI-Plattform wird

Slide 7

Slide 7 text

Can we run GenAI models locally? Built-in AI und WebNN wie das Web zur GenAI-Plattform wird

Slide 8

Slide 8 text

Bring Your Own AI (BYOAI) – Libraries – WebLLM – Transfomers.js – Frameworks – ONNX Runtime – TensorFlow.js – APIs – WebNN – Cross-Origin Storage Built-in AI (BIAI) – Writing Assistance APIs – Summarizer API – Writer API – Rewriter API – Translator & Language Detector APIs – Prompt API Built-in AI und WebNN Local AI Inference wie das Web zur GenAI-Plattform wird

Slide 9

Slide 9 text

https://webllm.mlc.ai/ Built-in AI und WebNN WebLLM DEMO wie das Web zur GenAI-Plattform wird

Slide 10

Slide 10 text

On NPM Built-in AI und WebNN WebLLM wie das Web zur GenAI-Plattform wird

Slide 11

Slide 11 text

Storing model files locally Built-in AI und WebNN WebLLM Internet Website HTML/JS Cache with model files Hugging Face Note: Due to the Same-Origin Policy, models cannot be shared across origins. wie das Web zur GenAI-Plattform wird

Slide 12

Slide 12 text

Model Size Comparison Model:Parameters Size phi3:3.8b 2.2 GB mistral:7b 4.1 GB deepseek-r1:8b 5.2 GB gemma3n:e4b 7.5 GB gemma3:12b 8.1 GB llama4:16x17b 67 GB Built-in AI und WebNN WebLLM wie das Web zur GenAI-Plattform wird

Slide 13

Slide 13 text

https://huggingface.co/docs/transformers.js/index Built-in AI und WebNN Transformers.js DEMO wie das Web zur GenAI-Plattform wird

Slide 14

Slide 14 text

– Grants web apps access to the device’s CPU, GPU and Neural Processing Unit (NPU) – In specification by the WebML Working Group at W3C – Implementation in progress in Chromium (behind a flag) – Better performance for specific workloads Built-in AI und WebNN WebNN Source: https://webmachinelearning.github.io/webnn-intro/ DEMO wie das Web zur GenAI-Plattform wird

Slide 15

Slide 15 text

Built-in AI und WebNN Why should you care? DEMO wie das Web zur GenAI-Plattform wird

Slide 16

Slide 16 text

about://flags Enables WebNN API à Enabled Enables experimental WebNN API features à Enabled Built-in AI und WebNN WebNN wie das Web zur GenAI-Plattform wird

Slide 17

Slide 17 text

Drawbacks Built-in AI und WebNN WebNN Models can’t be shared across origins Inference is fast, but doesn’t reach full native speed wie das Web zur GenAI-Plattform wird

Slide 18

Slide 18 text

https://github.com/explainers-by-googlers/cross-origin-storage Built-in AI und WebNN Cross-Origin Storage wie das Web zur GenAI-Plattform wird

Slide 19

Slide 19 text

– Initiative by Google Chrome – Exploratory APIs for local experiments and use case determination – Downloads AI models into Google Chrome – Models are shared across origins – Uses native APIs directly (full performance) Built-in AI und WebNN Built-in AI https://developer.chrome.com/docs/ai/built-in wie das Web zur GenAI-Plattform wird

Slide 20

Slide 20 text

Incubated by the WebML CG Built-in AI und WebNN Built-in AI APIs https://webmachinelearning.github.io/incubations/ DEMO wie das Web zur GenAI-Plattform wird

Slide 21

Slide 21 text

Built-in AI und WebNN Multimodal Models wie das Web zur GenAI-Plattform wird

Slide 22

Slide 22 text

Built-in AI und WebNN Built-in AI APIs Operating System Website HTML/JS Browser Internet Apple Intelligence Gemini Nano wie das Web zur GenAI-Plattform wird

Slide 23

Slide 23 text

about://on-device-internals https://www.google.com/chrome/canary/ about://flags Enables optimization guide on device à EnabledBypassPerfRequirement (API) for Gemini Nano à Enabled Built-in AI und WebNN Built-in AI APIs wie das Web zur GenAI-Plattform wird

Slide 24

Slide 24 text

TypeScript Definitions Built-in AI und WebNN Built-in AI APIs wie das Web zur GenAI-Plattform wird

Slide 25

Slide 25 text

Built-in AI und WebNN Chatbots DEMO wie das Web zur GenAI-Plattform wird

Slide 26

Slide 26 text

Built-in AI und WebNN Categorization DEMO wie das Web zur GenAI-Plattform wird

Slide 27

Slide 27 text

(Cloud only!) Built-in AI und WebNN Multimodal Realtime Models DEMO wie das Web zur GenAI-Plattform wird

Slide 28

Slide 28 text

Built-in AI und WebNN Realtime Models DEMO wie das Web zur GenAI-Plattform wird

Slide 29

Slide 29 text

Pros & Cons + Data does not leave the browser (privacy) + High availability (offline support) + Low latency + Stability (no external API changes) + Low cost – Lower response quality – Less capable – High system (RAM, GPU) and bandwidth requirements – Large model size, models cannot always be shared – Model initialization and inference are relatively slow – APIs are experimental Built-in AI und WebNN On-device AI Models wie das Web zur GenAI-Plattform wird

Slide 30

Slide 30 text

Thank you for your kind attention! Christian Liebel @christianliebel [email protected]