De texto a video, las nuevas herramientas de inteligencia artificial

Ya se pueden crear videos con solo redactar lo que queremos utilizando inteligencia artificial. Meta tiene una herramienta llamada Make-A-Video y Google presentó un software llamado Imagen Video. Por ahora los resultados no son perfectos pero es un gran avance que permitirá desarrollar una amplia variedad de imágenes en movimiento con distintos estilos artísticos.

Imagen Video es un sistema de generación de imágenes basado en Google Image. Esta aplicación puede crear videos realistas con calidad comparable a la obtenida con DALL-E 2 y Stable Diffusion. Como ya sabemos, estos modelos de difusión descomponen información y recuperan millones de muestras de datos para obtener un resultado diferente.

Este sistema toma una redacción y genera un video de 16 cuadros, 3 cuadros por segundo con una resolución de 24 por 48 píxeles. Luego, el sistema mejora la imagen y "predice" fotogramas adicionales, produciendo un video final de 128 fotogramas y 24 fotogramas por segundo a 720 píxeles.

Durante el desarrollo descubrieron que Image Video podía crear videos cortos al estilo de Van Gogh. Pero lo que más impresiona es que esta inteligencia artificial tiene una comprensión clara de la profundidad y la tridimensionalidad.

Aún no se ha podido perfeccionar la transformación de texto a video, y es poco probable que se alcance en el corto plazo la calidad de los resultados DALL-E 2 o Midjourney.

Otro de los graves problemas que tienen los desarrolladores es que el contenido resultante puede ser problemático. Es decir, que al usar Imagen Video se podrían obtener resultados gráficamente violentos o sexualmente explícitos.

Google afirma que no lanzará el modelo de Imagen Video o el código fuente hasta que se solucionen todos estos problemas y, a diferencia de Meta, no solicitará un registro obligatorio para acceder a esta herramienta.

Aún así, con la tecnología de texto a video desarrollándose a un ritmo rápido, es posible que no pase mucho tiempo antes de que surja un modelo de código abierto que masifique su uso. Cuando esto suceda, permitirá que la creatividad explote y llene todos los medios conocidos con resultados impresionantes.

Por supuesto que esto derivará en graves problemas éticos y legales sobre todo con respecto a los derechos de autor, información falsa y deepfakes.

De texto a video, las nuevas herramientas de inteligencia artificial

Formulario de contacto