datasets están abiertos a inspección y auditoría. • Flexibilidad de uso: se pueden adaptar, modificar y entrenar según las necesidades específicas de cada proyecto. • Rápida innovación: la apertura impulsa mejoras continuas y la aparición de variantes especializadas. • Comunidad activa: miles de desarrolladores colaboran para mejorar, documentar y detectar fallos. Modelo de IA Open Source Open Source
Language Models con más de 100 millones de parámetros (100M) Alta capacidad de generalización Requieren mayores recursos Ejemplos: Mistral, Llama 2, DeepSeek SML Small Language Models con menos de 10 mil millones de parámetros (10B) Eficientes en recursos Especializados en tareas concretas Ejemplos: Phi-3.5, Gemma 2
hosting, entrenamiento, despliegue y comunidad Runtime para ejecutar modelos LLM en tu máquina Modelos disponibles +500k modelos (LLM, visión, audio, multimodal, embeddings, etc.) Enfocado en LLMs populares (Llama, Mistral, Gemma, Phi, etc.) Facilidad de uso APIs, SDKs en Python, integración con PyTorch, TensorFlow y Transformers Instalar cliente y usar comandos ollama run <modelo> Y su propia API local
crear audio conversacional expresivo y de larga duración • Soporta hasta 4 voces distintas de manera consistente (más que los 1–2 típicos de otros TTS). • Ofrece diálogos con emociones, música de fondo, cantos y conversaciones multi-idioma. VIbeVoice: Texto a Audio Texto a Imagen
finos. • Compiten bastante seriamente con modelos comerciales/populares como DALL-E 3 o Midjourney. • Hay distintas versiones, algunas de uso libre y otras requieren licencias. FLUX: Texto a Imagen Texto a Imagen
desarrollada por Alibaba. • Hay varias versiones con modelos de hasta 14B parámetros. • Ideales para prototipos rápidos y contenido visual creativo donde no se necesite producción cinematográfica completa. WAN: Texto a Video Texto a Video
Futuro Priorizar SLMs para un despliegue rentable Diseñar sistemas de agentes modulares Aprovechar SLMs para una especialización rápida Phi 4: Extraer información y matemáticas Qwen/Gemma: Para traducciones Llama: Chats de redes sociales
infraestructura y despliegue. Los modelos OSS ofrecen mayor privacidad y control. Habilitan experiencias personalizadas sin necesidad de compartir datos sensibles