Slide 1

Slide 1 text

Christian Liebel @christianliebel Consultant Angular-Apps smarter machen mit Generative AI lokal und offlinefähig

Slide 2

Slide 2 text

Hello, it’s me. Angular-Apps smarter machen mit Generative AI Christian Liebel W3C WebML WG & CG TAG Associate christian.liebel @thinktecture.com Angular, PWA & Generative AI Microsoft MVP & Google GDE (Angular, Web) lokal und offlinefähig

Slide 3

Slide 3 text

Examples Angular-Apps smarter machen mit Generative AI Generative AI Cloud Providers lokal und offlinefähig

Slide 4

Slide 4 text

Drawbacks Angular-Apps smarter machen mit Generative AI Generative AI Cloud Providers Require a (stable) internet connection Subject to network latency and server availability Data is transferred to the cloud service Require a subscription lokal und offlinefähig

Slide 5

Slide 5 text

Can we run GenAI models locally? Angular-Apps smarter machen mit Generative AI lokal und offlinefähig

Slide 6

Slide 6 text

Bring Your Own AI (BYOAI) – Libraries – WebLLM – Transfomers.js – Frameworks – ONNX Runtime – TensorFlow.js – APIs – WebNN – Cross-Origin Storage Built-in AI (BIAI) – Writing Assistance APIs – Summarizer API – Writer API – Rewriter API – Translator & Language Detector APIs – Prompt API Angular-Apps smarter machen mit Generative AI Local AI Inference lokal und offlinefähig

Slide 7

Slide 7 text

https://webllm.mlc.ai/ Angular-Apps smarter machen mit Generative AI WebLLM DEMO lokal und offlinefähig

Slide 8

Slide 8 text

On NPM Angular-Apps smarter machen mit Generative AI WebLLM lokal und offlinefähig

Slide 9

Slide 9 text

Storing model files locally Angular-Apps smarter machen mit Generative AI WebLLM Internet Website HTML/JS Cache with model files Hugging Face Note: Due to the Same-Origin Policy, models cannot be shared across origins. lokal und offlinefähig

Slide 10

Slide 10 text

Model Size Comparison Model:Parameters Size phi3:3.8b 2.2 GB mistral:7b 4.1 GB deepseek-r1:8b 5.2 GB gemma3n:e4b 7.5 GB gemma3:12b 8.1 GB llama4:16x17b 67 GB Angular-Apps smarter machen mit Generative AI WebLLM lokal und offlinefähig

Slide 11

Slide 11 text

https://huggingface.co/docs/transformers.js/index Angular-Apps smarter machen mit Generative AI Transformers.js DEMO lokal und offlinefähig

Slide 12

Slide 12 text

– Grants web apps access to the device’s CPU, GPU and Neural Processing Unit (NPU) – In specification by the WebML Working Group at W3C – Implementation in progress in Chromium (behind a flag) – Better performance for specific workloads Angular-Apps smarter machen mit Generative AI WebNN Source: https://webmachinelearning.github.io/webnn-intro/ DEMO lokal und offlinefähig

Slide 13

Slide 13 text

Angular-Apps smarter machen mit Generative AI Why should you care? DEMO lokal und offlinefähig

Slide 14

Slide 14 text

about://flags Enables WebNN API à Enabled Enables experimental WebNN API features à Enabled Angular-Apps smarter machen mit Generative AI WebNN lokal und offlinefähig

Slide 15

Slide 15 text

Drawbacks Angular-Apps smarter machen mit Generative AI WebNN Models can’t be shared across origins Inference is fast, but doesn’t reach full native speed lokal und offlinefähig

Slide 16

Slide 16 text

https://github.com/explainers-by-googlers/cross-origin-storage Angular-Apps smarter machen mit Generative AI Cross-Origin Storage lokal und offlinefähig

Slide 17

Slide 17 text

– Initiative by Google Chrome – Exploratory APIs for local experiments and use case determination – Downloads AI models into Google Chrome – Models are shared across origins – Uses native APIs directly (full performance) Angular-Apps smarter machen mit Generative AI Built-in AI https://developer.chrome.com/docs/ai/built-in lokal und offlinefähig

Slide 18

Slide 18 text

Incubated by the WebML CG Angular-Apps smarter machen mit Generative AI Built-in AI APIs https://webmachinelearning.github.io/incubations/ DEMO lokal und offlinefähig

Slide 19

Slide 19 text

Angular-Apps smarter machen mit Generative AI Multimodal Models lokal und offlinefähig

Slide 20

Slide 20 text

Angular-Apps smarter machen mit Generative AI Built-in AI APIs Operating System Website HTML/JS Browser Internet Apple Intelligence Gemini Nano lokal und offlinefähig

Slide 21

Slide 21 text

about://on-device-internals https://www.google.com/chrome/canary/ about://flags Enables optimization guide on device à EnabledBypassPerfRequirement (API) for Gemini Nano à Enabled Angular-Apps smarter machen mit Generative AI Built-in AI APIs lokal und offlinefähig

Slide 22

Slide 22 text

TypeScript Definitions Angular-Apps smarter machen mit Generative AI Built-in AI APIs lokal und offlinefähig

Slide 23

Slide 23 text

Angular-Apps smarter machen mit Generative AI Chatbots DEMO lokal und offlinefähig

Slide 24

Slide 24 text

Angular-Apps smarter machen mit Generative AI Categorization DEMO lokal und offlinefähig

Slide 25

Slide 25 text

Pros & Cons + Data does not leave the browser (privacy) + High availability (offline support) + Low latency + Stability (no external API changes) + Low cost – Lower response quality – Less capable – High system (RAM, GPU) and bandwidth requirements – Large model size, models cannot always be shared – Model initialization and inference are relatively slow – APIs are experimental Angular-Apps smarter machen mit Generative AI On-device AI Models lokal und offlinefähig

Slide 26

Slide 26 text

Thank you for your kind attention! Christian Liebel @christianliebel [email protected]