Description
Stability AI
Overview
La Familia de Modelos
🖼️ Imagen - Stable Diffusion
| Modelo | Parámetros | Descripción |
|---|---|---|
| SD 3.5 Large | 8B | Más potente, hasta 1MP resolución |
| SD 3.5 Large Turbo | 8B | Versión rápida, menor calidad |
| SD 3.5 Medium | 2.6B | Optimizado para hardware consumer |
| SD 3.5 Flash | - | Ultra-rápido |
| SDXL 1.0 | 3.5B | Anterior flagship, muy popular |
| Stable Image Ultra | - | Mejor calidad enterprise (API) |
| Stable Image Core | - | Balance calidad/velocidad |
- Multimodal Diffusion Transformer (MMDiT)
- 3 text encoders: OpenCLIP-ViT/G, CLIP-ViT/L, T5-xxl
- QK-Normalization para estabilidad
- Mejor tipografía y prompts complejos
- Resoluciones hasta 2MP
🎬 Video
| Modelo | Descripción |
|---|---|
| Stable Video Diffusion (SVD) | Foundation model video, image-to-video |
| Stable Video 3D (SV3D) | Image-to-3D video, múltiples ángulos |
| Stable Video 4D (SV4D) | Videos dinámicos multi-ángulo |
| Stable Virtual Camera | Novel view synthesis |
🔊 Audio
| Modelo | Descripción |
|---|---|
| Stable Audio 2.5 | Enterprise text-to-audio, música, SFX |
| Stable Audio Open | Open-source, samples cortos |
🗣️ Lenguaje
| Modelo | Descripción |
|---|---|
| StableLM 2 | LLM open-source (1.6B, 3B, 7B params) |
| Japanese Stable LM | Especializado en japonés |
🎲 3D
| Modelo | Descripción |
|---|---|
| Stable Fast 3D (SF3D) | Image-to-3D en segundos |
| TripoSR | 3D reconstruction (partnership) |
| Stable Zero123 | Single image to 3D |
Productos y Plataformas
DreamStudio
- Generación y edición de imágenes
- Control granular de parámetros
- Brand-safe outputs
- $10 = 1,000 créditos (nuevos usuarios: 25 créditos gratis)
Stable Assistant
Developer Platform API
- Acceso a todos los modelos
- Pay-as-you-go con créditos
- 25 créditos gratis al registrarse
- Enterprise pricing disponible
Clipdrop
- Remove background
- Cleanup
- Relight
- Upscale
- Uncrop
Precios (2025)
Modelo de Créditos
- $1 = 100 créditos
- $10 = 1,000 créditos
- Imagen estándar: ~0.2 créditos
API Pricing (por imagen/operación)
| Modelo | Créditos |
|---|---|
| Stable Image Ultra | Mayor costo |
| SD 3.5 Large | Medio-alto |
| SD 3.5 Large Turbo | Medio |
| SD 3.5 Medium | Bajo |
| SDXL 1.0 | Bajo |
Licencias
| Uso | Requisito |
|---|---|
| Personal/Research | Gratis (Community License) |
| Comercial <$1M revenue | Gratis (Community License) |
| Comercial >$1M revenue | Enterprise License requerida |
Enterprise
- Pricing custom basado en volumen
- Indemnification
- Dedicated support
- SLAs
- On-premises deployment
Integraciones y Partners
Cloud Providers
- Amazon Bedrock - SD disponible
- Google Cloud - Vertex AI
- Microsoft Azure - Integration
Enterprise Partners
- WPP - Strategic partnership + Investment (Mar 2025)
- HubSpot - Visuals on-brand
- Mercado Libre - 25% higher CTR
- Arm - Mobile optimization
Open Source
- Hugging Face - Modelos disponibles
- ComfyUI - Recommended local
- Diffusers - Python library
Casos de Uso por Industria
Advertising & Marketing
- Generación de visuales de campaña
- Variaciones de producto
- Personalization at scale
Entertainment & Gaming
- Concept art
- Asset generation
- Storyboarding
E-commerce
- Product photography
- Background removal
- Lifestyle imagery
Media & Publishing
- Ilustraciones editoriales
- Cover art
- Visual content
PROS ✅
- Pioneer Open-Source - Inició la revolución con SD
- 80% Market Share - Mayoría de imágenes AI generadas
- Multimodal - Imagen, video, audio, 3D, lenguaje
- Free for Most - Community License generosa
- 270M+ Downloads - Comunidad masiva
- Local Deployment - Corre en GPUs consumer
- Customizable - Fine-tuning, LoRA, ControlNet
- Enterprise Ready - Indemnification, support, SLAs
- James Cameron Board - Credibilidad Hollywood
- WPP Partnership - Validación enterprise
- Constant Innovation - Nuevos modelos frecuentes
- ComfyUI Ecosystem - Workflows avanzados
CONTRAS ❌
- Getty Images Lawsuit - Controversia copyright (ganado UK Nov 2025)
- Leadership Turmoil - CEO changes, layoffs
- Financial Challenges - Debt issues en 2024
- API Pricing Changes - Aumentos agosto 2025
- No Indemnification Default - Solo enterprise
- Quality vs Midjourney - Menos "artístico" out-of-box
- Learning Curve - Requiere prompting skill
- NSFW Concerns - Modelo puede generar contenido inapropiado
- Model Size - Modelos grandes requieren hardware
¿Por Qué Elegir Stability AI?
- Quieres control total (open-source)
- Necesitas deployment local/on-premises
- Tu revenue anual es <$1M (gratis)
- Quieres customizar modelos (fine-tuning)
- Necesitas video, audio, 3D además de imagen
- Valoras comunidad y ecosistema abierto
- Trabajas en gaming, VFX, entertainment
- Quieres resultados "artísticos" out-of-box (→ Midjourney)
- No tienes conocimiento técnico
- Necesitas API simple sin complicaciones
- Tienes preocupaciones de copyright estrictas
- Budget muy limitado para enterprise
vs Competidores
| vs | Stability AI Gana | Competidor Gana |
|---|---|---|
| Midjourney | Open-source, local, gratis, customizable | Mejor estética, más fácil |
| DALL-E 3 | Gratis, control, multimodal completo | Integración ChatGPT, safety |
| Adobe Firefly | Gratis, más potente | Integración Creative Cloud, training ético |
| Flux | Más establecido, ecosystem | Calidad comparable, open |
| Leonardo AI | Más modelos, customization | Mejor UX, community |
Información de la Empresa
- Fundación: 2019
- Sede: Londres, UK (operations en LA)
- Fundador: Emad Mostaque (salió marzo 2024)
- CEO Actual: Prem Akkaraju (ex-Weta Digital)
- Chairman: Sean Parker (ex-Facebook President)
- Board: James Cameron
- Empleados: ~45 (2024, después de layoffs)
- Valuación: $1B (Unicorn)
- Funding Total: $181M
Rondas de Inversión
| Fecha | Ronda | Monto | Inversores |
|---|---|---|---|
| Sep 2022 | Seed | $101M | Coatue, Lightspeed |
| Jun 2023 | Seed | ~$10M | Sound Ventures |
| Jun 2024 | Seed | $80M | Coatue, Lightspeed, Greycroft, Sean Parker, Eric Schmidt |
| Mar 2025 | Strategic | - | WPP |
Inversores Notables
Métricas
- 270M+ descargas de modelos
- 80% del mercado de imágenes AI
- 150M+ descargas Stable Diffusion específico
- #1 most-liked text-to-image en Hugging Face
- 1,000+ imágenes/minuto en Amazon Bedrock
Reconocimientos
- Stable Audio - TIME Best Inventions 2023
- Stable Diffusion - Inició la revolución generative AI (Aug 2022)
- UK Court Victory - Getty Images lawsuit (Nov 2025)
Notas Importantes
Licencia Community
- Gratis para research, non-commercial
- Gratis para comercial si revenue <$1M anual
- Enterprise license requerida si >$1M
Acceptable Use Policy
- CSAM
- Deepfakes de personas sin consentimiento
- Desinformación
- Contenido ilegal
Key Features
Stable Diffusion 3.5 Large 8B parámetros
SD 3.5 Turbo generación rápida
SD 3.5 Medium hardware consumer
SDXL 1.0 modelo flagship anterior
Stable Image Ultra mejor calidad API
Stable Video Diffusion image-to-video
Stable Video 3D múltiples ángulos
Stable Video 4D dinámico multi-view
Stable Audio 2.5 música y SFX
Stable Audio Open source
StableLM 2 language models
Stable Fast 3D image-to-3D segundos
DreamStudio web app oficial
Clipdrop herramientas edición
API Developer Platform
ControlNets Blur Canny Depth
Community License gratis <$1M
Local deployment GPUs consumer
Fine-tuning LoRA customization
ComfyUI workflows avanzados
Use Cases
Generación imágenes text-to-image
Image-to-image edición variaciones
Inpainting outpainting extensión
Concept art videojuegos películas
Product photography e-commerce
Marketing advertising campaigns
Storyboarding preproducción
Asset generation gaming
Background removal product shots
Upscaling mejora resolución
Video generation clips cortos
3D asset creation from images
Audio music generation
Sound effects SFX creation
Brand visual generation
Editorial illustrations
Social media content
NFT digital art creation
Architectural visualization
Fashion design prototyping
Information
Company
Stability AI Ltd.
Website
stability.aiReviews de Usuarios
IAs Relacionadas
ChatGPT
OpenAI
ChatGPT de OpenAI es un asistente de IA versátil que destaca en conversaciones naturales, creación de contenido y resolución de problemas complejos. Con sus capacidades multimodales avanzadas, procesa texto, voz e imágenes para optimizar tu productividad y creatividad.
DALL-E
OpenAI
Sistema de generación de imágenes con IA de OpenAI que incluye DALL-E 3 y el nuevo GPT-Image-1, con capacidades de texto a imagen, edición, inpainting y resolución hasta 4K, integrado en ChatGPT y disponible vía API.

Jasper AI
Jasper AI Inc.
Plataforma de IA para creación de contenido de marketing con Brand Voice personalizado, 50+ templates, integración SEO y colaboración en equipo. Usado por 20% del Fortune 500.