Modelos de imagen y video con IA
Todos los modelos de frontera en un solo lienzo. Genera, edita, anima y compara sin alternar entre suscripciones.
10 modelos
Modelos de imagen
Fotorrealismo, tipografía, fotos de producto e imágenes editoriales. Empieza con los modelos más adecuados para el brief.
Grok Imagine Image Quality
Grok Imagine Image Quality is xAI's recommended higher-quality image model replacing the retiring Pro tier. On Vofy, it supports prompt-based creation, image edits, broad style transfer, and multi-turn refinement at up to 2K with up to 10 outputs per run.

GPT Image 2
GPT Image 2 is OpenAI's state-of-the-art image generation model for fast, high-quality image generation and editing. OpenAI positions it as a major step forward in instruction following, dense text rendering, multilingual layouts, stylistic fidelity, flexible sizing, and stronger world knowledge.
Nano Banana 2
Nano Banana 2 combines Pro-level image quality with Gemini Flash speed — advanced world knowledge, subject consistency across 5 characters, precise text rendering and translation, and 4K output from 512px, all powered by real-time web search.
Seedream 5.0 Lite
Seedream 5.0 Lite is ByteDance's latest AI image creation model — the first to integrate real-time web search during generation. It fuses live web information to improve timeliness, with upgraded intelligence for parsing complex instructions and visual content, broader world knowledge, stronger cross-image consistency, and enhanced enterprise-grade scene generation quality.
Grok Imagine Image Pro
Grok Imagine Image Pro is the legacy Pro image model in xAI's Grok Imagine family. xAI is retiring this model on May 15, 2026, and Vofy now directs new high-quality Grok Imagine image workflows to Grok Imagine Image Quality.
GPT Image 1.5
GPT Image 1.5 is OpenAI's flagship image generation model — a creative studio in your pocket. Precise edits that keep lighting, composition, and likeness intact; creative transformations from photo to movie poster or painting; stronger instruction following; denser text rendering; and 4x faster generation.
13 modelos
Modelos de video
Desde cortes rápidos para redes hasta escenas de varias tomas, usa modelos de video líderes sin salir de tu proyecto.
Kling 2.6
Kling 2.6 is a balanced Kling video model on Vofy for short clips, motion-controlled video, interpolation, and optional audio workflows. The current Vofy setup supports text-to-video, image-to-video, interpolation, and motion control at 720p or 1080p.
Sora 2 Pro
Sora 2 Pro is OpenAI's higher-quality Sora 2 tier on Vofy for longer, more polished AI video. The current Vofy setup supports text-to-video and image-to-video in 16:9 or 9:16, with 720p, 1024p, and 1080p outputs from 4 to 20 seconds.
Veo 3.1 Lite
Veo 3.1 Lite is Google's lower-cost Veo video model on Vofy for high-volume short-form generation. In the current Vofy setup it supports text-to-video, image-to-video, and interpolation in 16:9 or 9:16, with 720p at 4, 6, or 8 seconds and 1080p at 8 seconds.
Kling 3.0
Kling 3.0 is Kuaishou's video generation family combining Video 3.0, Video 3.0 Omni, and Motion Control 3.0. Generate up to 15-second clips at 1080p with multi-shot storytelling, frame interpolation, lip-sync, and audio-aware workflows.
Seedance 2.0
Seedance 2.0 is ByteDance's multimodal AI video model on Vofy for reference-driven creation and video editing workflows. In the current Vofy setup it supports text-to-video, image-to-video, interpolation, reference-image, multimodal-reference, video-to-video, and video-extension generation at 480p or 720p for 4 to 15 seconds, with optional audio and web-search controls.
Seedance 2.0 Fast
Seedance 2.0 Fast is ByteDance's faster, lower-cost Seedance 2.0 tier on Vofy. It keeps the same broad workflow family as Seedance 2.0, including text-to-video, image-to-video, interpolation, reference images, multimodal references, video-to-video, and video extension at 480p or 720p for 4 to 15 seconds.
Creado para creadores y equipos creativos
Desde publicaciones diarias hasta visuales de campaña, usa efectos y flujos que llevan una idea a un recurso compartible rápidamente.
Equipos de marketing
Lanza creatividades y fotografía de producto en minutos.
Cineastas independientes
Storyboards y B-roll con control de movimiento.
E-commerce
Pruebas en modelo y fotos lifestyle a escala de catálogo.
Creadores sociales
Video corto y publicaciones diarias en todos los formatos.
Diseñadores
Concept art, moodboards y retoques precisos con inpaint.
Agencias
Presentaciones para clientes con imágenes listas para movimiento y seguras para marca.
Cómo funciona
Empieza con un efecto, añade tu idea o medios y genera algo listo para compartir.
Elige un efecto
Empieza con un preset nuevo para video, imagen, edición o contenido social.
Añade tus medios o prompt
Sube una referencia, escribe una idea breve o ajusta la configuración del modelo.
Genera y comparte
Crea variaciones, refina el resultado y guarda algo listo para amigos, seguidores o tu próxima publicación.
FAQ
¿Qué modelo de imagen con IA es mejor para fotos de producto?+
GPT Image y Nano Banana Pro son buenas opciones por defecto para fotorrealismo, composición limpia y diseños con mucho texto. Seedream resulta útil cuando necesitas variaciones rápidas de lifestyle o producto.
¿Qué modelo de video con IA debería usar para cortometrajes?+
Sora Pro es una opción sólida para escenas narrativas con audio. Kling es útil para secuencias de varias tomas, mientras que Veo y Seedance son prácticos para convertir imágenes en video con movimiento pulido.
¿Puedo cambiar de modelo en mitad de un proyecto?+
Sí. Vofy mantiene juntos tus prompts, referencias y contexto del proyecto para que puedas comparar modelos sin reconstruir el brief.
¿Todos los modelos admiten imágenes de referencia?+
La compatibilidad varía según el modelo. Los modelos de imagen suelen admitir ediciones basadas en referencias, y varios modelos de video admiten flujos de imagen a video. Cada página de detalle del modelo indica las entradas relevantes.
¿Cómo se cobran los créditos entre modelos?+
Los créditos dependen del nivel del modelo, la resolución, la duración y el modo de generación. La página de precios explica el coste en créditos para flujos comunes de imagen y video.
¿Con qué rapidez llegan nuevos modelos a Vofy?+
Vofy está diseñado para añadir rápidamente nuevos lanzamientos de modelos de frontera, para que los equipos puedan probar nuevos modelos de OpenAI, Google, xAI, ByteDance y Kuaishou desde el mismo espacio de trabajo.
Una suscripción, todos los modelos de frontera
Cambia entre modelos de imagen y video desde un solo espacio de trabajo y sigue creando en Studio.