Building AI Applications with Java, LLMs, and Spring AI

Thomas Vitale JUG November 2025 Building AI Applications With Java,
LLMs, and @thomasvitale.com

Software Engineer Thomas Vitale @thomasvitale.com

Machine Learning Subset of Arti fi cial Intelligence Platform/Infrastructure Platform
Engineers HTTP API Application Developer Model Training Model Inference ML Engineers Data Preparation Data Scientists @thomasvitale.com

Java for AI-Infused Applications Integrations with Model Inference Platform/Infrastructure Platform
Engineers Model Training Model Inference ML Engineers Data Preparation Data Scientists Application Developers Application @thomasvitale.com

spring.io/projects/spring-ai @thomasvitale.com

ollama.com @thomasvitale.com

Application Inference Service Consum es LLM s Architecture Database Reads/writes
data Observability Platform Exports telem etry Spring Boot Application Vaadin Spring AI Arconia @thomasvitale.com

Arconia Dev Services and OpenTelemetry arconia dev gradle bootRun mvn
spring-boot:run @thomasvitale.com arconia.io

Chat Inference Service Request Response Single Interactions Answer Application @thomasvitale.com
Question

Multimodality Inference Service Request Response Modalities and Structured Output Question
Answer Application Format Instructions Output Converter @thomasvitale.com

Chat Memory Inference Service Request Response Question Answer Application Multiple
Interactions @thomasvitale.com Augment with Memory Memory Read Update Memory Write

Prompt Stuffing Inference Service Request Response Augmenting Prompts with Context
Answer Application @thomasvitale.com Question Context

Retrieval Augmented Generation Inference Service Request Response Question Answer Application
Augment with Context Web Search Engines Search Engine HTTP API @thomasvitale.com Context

Augment with Context Vector Stores Vector Store Semantic Search @thomasvitale.com

Ingestion Pipeline @thomasvitale.com Data Preparation Document Reader Reads from Writes
To Document Transformer Document Writer

Augment with Context Prompt Augmentation with Retrieved Context Source Query @thomasvitale.com

Tools Inference Service Request Tool Calling Question Response Answer Application
API Tool Call Tool Execution Tool Call Request Tool Call Response @thomasvitale.com

Agents @thomasvitale.com Orchestration Query Response LLM uses uses Tool 1
uses Tool2 Agent

API MCP Server MCP Inference Service Request Tools Question Response
Answer Application Tool Call MCP Client Tool Call Request Tool Call Response @thomasvitale.com

Building AI Applications https://github.com/ThomasVitale/modular-rag https://github.com/ThomasVitale/llm-apps-java-spring-ai Thomas Vitale @thomasvitale.com thomasvitale.com With
Java, LLMs, and

Building AI Applications with Java, LLMs, and S...

Building AI Applications with Java, LLMs, and Spring AI

Thomas Vitale

More Decks by Thomas Vitale

Other Decks in Technology

Featured

Transcript

Thomas Vitale JUG November 2025 Building AI Applications With Java,

Software Engineer Thomas Vitale @thomasvitale.com

Machine Learning Subset of Arti fi cial Intelligence Platform/Infrastructure Platform

Java for AI-Infused Applications Integrations with Model Inference Platform/Infrastructure Platform

spring.io/projects/spring-ai @thomasvitale.com

spring.io/projects/spring-ai @thomasvitale.com

ollama.com @thomasvitale.com

ollama.com @thomasvitale.com

Application Inference Service Consum es LLM s Architecture Database Reads/writes

Arconia Dev Services and OpenTelemetry arconia dev gradle bootRun mvn

Chat Inference Service Request Response Single Interactions Answer Application @thomasvitale.com

Multimodality Inference Service Request Response Modalities and Structured Output Question

Chat Memory Inference Service Request Response Question Answer Application Multiple

Prompt Stuffing Inference Service Request Response Augmenting Prompts with Context

Retrieval Augmented Generation Inference Service Request Response Question Answer Application

Retrieval Augmented Generation Inference Service Request Response Question Answer Application

Ingestion Pipeline @thomasvitale.com Data Preparation Document Reader Reads from Writes

Retrieval Augmented Generation Inference Service Request Response Question Answer Application

Tools Inference Service Request Tool Calling Question Response Answer Application

Agents @thomasvitale.com Orchestration Query Response LLM uses uses Tool 1

API MCP Server MCP Inference Service Request Tools Question Response

Building AI Applications https://github.com/ThomasVitale/modular-rag https://github.com/ThomasVitale/llm-apps-java-spring-ai Thomas Vitale @thomasvitale.com thomasvitale.com With