INTELIGENCIA ARTIFICIAL

OpenAI lanza Sora, su herramienta de generación de videos con AI

El modelo de generación de videos con AI funciona de manera similar a su herramienta de generación de imágenes, DALL-E.

Publicado el 10 dic 2024

Screenshot — Aditya Ramesh, Bill Peebles y Sam Altman, de OpenAI, presentaron Sora en una transmisión en vivo. Crédito: YouTube OpenAI

OpenAI, anunció el lunes el lanzamiento de Sora, su herramienta de generación de videos con inteligencia artificial (AI, por sus siglas en inglés).

El modelo de generación de videos con AI funciona de manera similar a su herramienta de generación de imágenes, DALL-E: un usuario escribe una escena deseada y Sora devolverá un videoclip de alta definición. También puede generar videoclips inspirados en imágenes fijas y extender videos existentes o completar fotogramas faltantes.

En una transmisión en tiempo real, el CEO de OpenAI, Sam Altman señaló que “esto se lanzará hoy en la mayor parte del mundo, excepto en buena parte de Europa y el Reino Unido, [donde] tardará un tiempo. Hay otros países en los que no podemos operar”.

Altman indicó que con una suscripción Plus se obtienen 50 generaciones al mes, mientras que con una Pro son ilimitadas en el modo de cola lenta y 500 generaciones normales más rápidas.

Los empleados que participaron en la transmisión en vivo y CEO de OpenAI demostraron funciones como “Blend” (es decir, unir dos escenas siguiendo las instrucciones del usuario), así como la opción de hacer que un video generado por AI se repita sin fin.

“Estamos muy emocionados por ver lo que todos ustedes crearán, todas las nuevas formas en que se utilizará este nuevo tipo de entretenimiento y herramienta”, señaló para luego felicitar a sus colaboradores. “Hicieron un trabajo increíble. Estoy muy orgulloso del equipo. Me encanta el producto”.

Índice de temas

El video, la próxima frontera de la GenAI

El video podría ser la próxima frontera para la inteligencia artificial generativa (GenAI, por su acróonimo en inghlés) ahora que los chatbots y los generadores de imágenes se han abierto camino en el mundo de los consumidores y los negocios.

Con Sora, el fabricante de ChatGPT busca competir con las herramientas de AI para la generación de videos de empresas como Meta y Google, que anunció Lumiere en enero pasado.

Otras empresas emergentes ofrecen herramientas de AI similares, como Stable Video Diffusion de Stability AI.

Amazon también lanzó Create with Alexa, un modelo que se especializa en generar contenido infantil animado de formato corto basado en indicaciones.

Un lanzamiento que ya se esperaba

La startup respaldada por Microsoft, que irrumpió en el mercado el año pasado gracias a la popularidad viral de ChatGPT, presentó Sora en febrero pasado.

“Desarrollamos una nueva versión de Sora, Sora Turbo, que es significativamente más rápida que el modelo que presentamos en febrero. La lanzamos hoy como un producto independiente en Sora.com para los usuarios de ChatGPT Plus y Pro”, explicó OpenAI en una publicación de blog.

Hasta ahora, Sora ha estado disponible principalmente para un pequeño grupo de evaluadores de seguridad, o “red-teamers”, que prueban el modelo en busca de vulnerabilidades en áreas como la desinformación y el sesgo.

Los usuarios de Reddit preguntaron a los ejecutivos de OpenAI en octubre pasado sobre la fecha de lanzamiento de Sora, cuestionando si se estaba retrasando “debido a la cantidad de computación/tiempo requerido para la inferencia o debido a la seguridad”.

En respuesta, el jefe de producto de OpenAI, Kevin Weil, escribió: “Necesitamos perfeccionar el modelo, necesitamos hacer que la seguridad/suplantación/otras cosas estén bien, ¡y necesitamos escalar la computación!”

“Obviamente, tenemos un gran objetivo en la espalda como OpenAI”, dijo el líder de producto de Sora de OpenAI, Rohan Sahai, y agregó que la empresa necesita prevenir el uso ilegal de la tecnología. “Pero también queremos equilibrar eso con la expresión creativa”.

Algunos riesgos

Si bien las oportunidades creativas entusiasmarán a algunos entusiastas de la AI, las nuevas tecnologías presentan serias preocupaciones de desinformación a medida que se realizan elecciones políticas importantes en todo el mundo. La cantidad de deepfakes generados por IA creados ha aumentado un 900% año tras año, según datos de Clarity, una empresa de aprendizaje automático.

OpenAI ha hecho de la multimodalidad (la combinación de generación de texto, imagen y video) un objetivo destacado en su esfuerzo por ofrecer un conjunto más amplio de modelos de AI.

La noticia del lanzamiento de Sora llega tras la decisión de los manifestantes de filtrar lo que parecía ser una copia de Sora debido a las preocupaciones sobre el trato que el creador de ChatGPT da a los artistas.

Algunos miembros del programa de acceso anticipado de OpenAI para Sora, que según se dice incluía a unos 300 artistas, publicaron una carta abierta a fines de noviembre criticando a OpenAI por no ser lo suficientemente abierto o apoyar las artes más allá del marketing.

“Estimados señores supremos de la IA corporativa”, decía la carta abierta de los manifestantes, “recibimos acceso a Sora con la promesa de ser probadores tempranos, miembros del equipo rojo y socios creativos. Sin embargo, creemos que en cambio nos están atrayendo hacia el ‘lavado de arte’ para decirle al mundo que Sora es una herramienta útil para los artistas”.

La carta agregó que cientos de artistas proporcionaron trabajo no remunerado para OpenAI a través de pruebas de errores y comentarios sobre Sora, y que “si bien cientos contribuyen de forma gratuita, unos pocos seleccionados serán elegidos a través de una competencia para que se proyecten sus películas creadas por Sora, ofreciendo una compensación mínima que palidece en comparación con el valor sustancial de relaciones públicas y marketing.

Prohibida su reproducción total o parcial.