Modelos de imagen y video con IA

Todos los modelos de frontera en un solo lienzo. Genera, edita, anima y compara sin alternar entre suscripciones.

Modelos de imagen10 Modelos de video13 Rankings

10 modelos

Modelos de imagen

Fotorrealismo, tipografía, fotos de producto e imágenes editoriales. Empieza con los modelos más adecuados para el brief.

7 may 2026

Grok Imagine Image Quality

Grok Imagine Image Quality is xAI's recommended higher-quality image model replacing the retiring Pro tier. On Vofy, it supports prompt-based creation, image edits, broad style transfer, and multi-turn refinement at up to 2K with up to 10 outputs per run.

21 abr 2026

GPT Image 2

GPT Image 2 is OpenAI's state-of-the-art image generation model for fast, high-quality image generation and editing. OpenAI positions it as a major step forward in instruction following, dense text rendering, multilingual layouts, stylistic fidelity, flexible sizing, and stronger world knowledge.

26 feb 2026

Nano Banana 2

Nano Banana 2 combines Pro-level image quality with Gemini Flash speed — advanced world knowledge, subject consistency across 5 characters, precise text rendering and translation, and 4K output from 512px, all powered by real-time web search.

25 feb 2026

Seedream 5.0 Lite

Seedream 5.0 Lite is ByteDance's latest AI image creation model — the first to integrate real-time web search during generation. It fuses live web information to improve timeliness, with upgraded intelligence for parsing complex instructions and visual content, broader world knowledge, stronger cross-image consistency, and enhanced enterprise-grade scene generation quality.

28 ene 2026

Grok Imagine Image Pro

Grok Imagine Image Pro is the legacy Pro image model in xAI's Grok Imagine family. xAI is retiring this model on May 15, 2026, and Vofy now directs new high-quality Grok Imagine image workflows to Grok Imagine Image Quality.

16 dic 2025

GPT Image 1.5

GPT Image 1.5 is OpenAI's flagship image generation model — a creative studio in your pocket. Precise edits that keep lighting, composition, and likeness intact; creative transformations from photo to movie poster or painting; stronger instruction following; denser text rendering; and 4x faster generation.

13 modelos

Modelos de video

Desde cortes rápidos para redes hasta escenas de varias tomas, usa modelos de video líderes sin salir de tu proyecto.

27 may 2026

Kling 2.6

Kling 2.6 is a balanced Kling video model on Vofy for short clips, motion-controlled video, interpolation, and optional audio workflows. The current Vofy setup supports text-to-video, image-to-video, interpolation, and motion control at 720p or 1080p.

27 may 2026

Sora 2 Pro

Sora 2 Pro is OpenAI's higher-quality Sora 2 tier on Vofy for longer, more polished AI video. The current Vofy setup supports text-to-video and image-to-video in 16:9 or 9:16, with 720p, 1024p, and 1080p outputs from 4 to 20 seconds.

31 mar 2026

Veo 3.1 Lite

Veo 3.1 Lite is Google's lower-cost Veo video model on Vofy for high-volume short-form generation. In the current Vofy setup it supports text-to-video, image-to-video, and interpolation in 16:9 or 9:16, with 720p at 4, 6, or 8 seconds and 1080p at 8 seconds.

11 mar 2026

Kling 3.0

Kling 3.0 is Kuaishou's video generation family combining Video 3.0, Video 3.0 Omni, and Motion Control 3.0. Generate up to 15-second clips at 1080p with multi-shot storytelling, frame interpolation, lip-sync, and audio-aware workflows.

14 feb 2026

Seedance 2.0

Seedance 2.0 is ByteDance's multimodal AI video model on Vofy for reference-driven creation and video editing workflows. In the current Vofy setup it supports text-to-video, image-to-video, interpolation, reference-image, multimodal-reference, video-to-video, and video-extension generation at 480p or 720p for 4 to 15 seconds, with optional audio and web-search controls.

14 feb 2026

Seedance 2.0 Fast

Seedance 2.0 Fast is ByteDance's faster, lower-cost Seedance 2.0 tier on Vofy. It keeps the same broad workflow family as Seedance 2.0, including text-to-video, image-to-video, interpolation, reference images, multimodal references, video-to-video, and video extension at 480p or 720p for 4 to 15 seconds.

Creado para creadores y equipos creativos

Desde publicaciones diarias hasta visuales de campaña, usa efectos y flujos que llevan una idea a un recurso compartible rápidamente.

Equipos de marketing

Lanza creatividades y fotografía de producto en minutos.

Cineastas independientes

Storyboards y B-roll con control de movimiento.

E-commerce

Pruebas en modelo y fotos lifestyle a escala de catálogo.

Creadores sociales

Video corto y publicaciones diarias en todos los formatos.

Diseñadores

Concept art, moodboards y retoques precisos con inpaint.

Agencias

Presentaciones para clientes con imágenes listas para movimiento y seguras para marca.

Cómo funciona

Empieza con un efecto, añade tu idea o medios y genera algo listo para compartir.

Paso01

Elige un efecto

Empieza con un preset nuevo para video, imagen, edición o contenido social.

Paso02

Añade tus medios o prompt

Sube una referencia, escribe una idea breve o ajusta la configuración del modelo.

Paso03

Genera y comparte

Crea variaciones, refina el resultado y guarda algo listo para amigos, seguidores o tu próxima publicación.

FAQ

¿Qué modelo de imagen con IA es mejor para fotos de producto?+

GPT Image y Nano Banana Pro son buenas opciones por defecto para fotorrealismo, composición limpia y diseños con mucho texto. Seedream resulta útil cuando necesitas variaciones rápidas de lifestyle o producto.

¿Qué modelo de video con IA debería usar para cortometrajes?+

Sora Pro es una opción sólida para escenas narrativas con audio. Kling es útil para secuencias de varias tomas, mientras que Veo y Seedance son prácticos para convertir imágenes en video con movimiento pulido.

¿Puedo cambiar de modelo en mitad de un proyecto?+

Sí. Vofy mantiene juntos tus prompts, referencias y contexto del proyecto para que puedas comparar modelos sin reconstruir el brief.

¿Todos los modelos admiten imágenes de referencia?+

La compatibilidad varía según el modelo. Los modelos de imagen suelen admitir ediciones basadas en referencias, y varios modelos de video admiten flujos de imagen a video. Cada página de detalle del modelo indica las entradas relevantes.

¿Cómo se cobran los créditos entre modelos?+

Los créditos dependen del nivel del modelo, la resolución, la duración y el modo de generación. La página de precios explica el coste en créditos para flujos comunes de imagen y video.

¿Con qué rapidez llegan nuevos modelos a Vofy?+

Vofy está diseñado para añadir rápidamente nuevos lanzamientos de modelos de frontera, para que los equipos puedan probar nuevos modelos de OpenAI, Google, xAI, ByteDance y Kuaishou desde el mismo espacio de trabajo.

Una suscripción, todos los modelos de frontera

Cambia entre modelos de imagen y video desde un solo espacio de trabajo y sigue creando en Studio.

Ver precios Abrir Color Splash