Google integró el modelo Veo 3 de DeepMind en Gemini, permitiendo a los usuarios convertir fotografías en videos animados de hasta ocho segundos con audio sincronizado. La función, activa en versión web e inminente en app móvil, requiere subir una imagen y describir la escena y sonidos deseados mediante texto.
Todos los videos generados llevarán doble marca, una visible indicando su origen en IA y otra digital invisible con tecnología SynthID. Google implementó evaluaciones rigurosas como pruebas "red teaming" para prevenir contenido inapropiado y mitigar riesgos de desinformación.
Disponibilidad y proceso de creación
Operativa en más de 150 países, la herramienta ha producido 40 millones de videos desde mayo. Para usarla, usuarios con planes Gemini Advanced (Ultra/Pro) deben primero seleccionar la opción "Video"
Luego subir imagen y describir escena/audio, luego esperar algunos minutos para la generación de la solicitud. Finalmente, cada clip bloquea el chat durante su creación y tiene límites, según suscripción.
Restricciones técnicas
Los videos descargables desde el cuadro de previsualización tienen duración fija de 8 segundos. Google alerta mediante notificaciones cuando los usuarios se aproximan al límite mensual de generaciones permitidas por su plan.