Esta nueva plataforma está todavía en fase de prueba, pero puede hace videos extremadamente realistas con solo describir los prompts.
OpenAI, creador de ChatGPT y del generador de imágenes DALL-E, presentó una nueva herramienta llamada «Sora», capaz de crear, a partir de una simple instrucción en texto, videos realistas de hasta un minuto de duración, una innovación mayor en el campo de la inteligencia artificial.
Creado con base a las búsquedas anteriores en DALL-E y ChatGPT, esta nueva plataforma está todavía en fase de prueba, precisó la start-up californiana aliada a Microsoft, que presentó algunos videos. El programa puede generar videos de un minuto de duración «con calidad visual y respetando la demanda del usuario», indicó OpenAI en su sitio web.
Sora puede «generar escenas complejas con varios personajes, movimientos específicos y detalles precisos», indicó la empresa. También permite crear un video a partir de una imagen fija, asegura el gigante de la inteligencia artificial (IA). Asimismo, puede alargar videos ya existentes.
OpenAI, creador de ChatGPT y del generador de imágenes DALL-E, presentó una nueva herramienta llamada «Sora», capaz de crear, a partir de una simple instrucción en texto, videos realistas de hasta un minuto de duración, una innovación mayor en el campo de la inteligencia artificial.
Creado con base a las búsquedas anteriores en DALL-E y ChatGPT, esta nueva plataforma está todavía en fase de prueba, precisó la start-up californiana aliada a Microsoft, que presentó algunos videos. El programa puede generar videos de un minuto de duración «con calidad visual y respetando la demanda del usuario», indicó OpenAI en su sitio web.
Sora puede «generar escenas complejas con varios personajes, movimientos específicos y detalles precisos», indicó la empresa. También permite crear un video a partir de una imagen fija, asegura el gigante de la inteligencia artificial (IA). Asimismo, puede alargar videos ya existentes.
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024
OpenAI advierte que el «actual modelo» de la plataforma presenta «defectos», como una confusión entre izquierda y derecha o la imposibilidad de mantener una continuidad visual durante toda la extensión del video.
«Por ejemplo, una persona puede comer una galleta, pero luego, la galleta puede no exhibir una mordedura», ejemplificó.
La compañía afirmó que la seguridad es un asunto clave en este desarrollo y afirmó que organizará simulaciones con usuarios a los que se les pedirá tratar de provocar errores o crear contenido inapropiado, para poder definir mejor los límites de la plataforma.
«Involucraremos a tomadores de decisiones políticas, educadores y artistas en el mundo para comprender sus preocupaciones e identificar los casos positivos de uso de esta nueva tecnología», aseguró OpenAI.
Meta, Google y Runway AI, que trabajan en aplicaciones similares, conocidas como «text-to-video», es decir, que permiten pasar una idea escrita a video, también presentaron muestras de sus avances.