NUWA-Infinity es una herramienta similar a DALL-E y Brain, pero se diferencia porque puede ampliar entornos de pinturas existentes, así como crear videos.
Expansión
Las Inteligencias Artificiales “artistas” son cada vez más comunes y populares. OpenAI y Google tienen dos de los ejemplos más relevantes en la actualidad, pero ahora se les está uniendo Microsoft, empresa que acaba de crear su propio sistema para generar imágenes a partir de un texto, ampliar el diseño de una obra existente o convertirla en video.
NUWA-Infinity es el nombre de la tecnología. Microsoft la describe como “un modelo generativo multimodal diseñado para generar imágenes y videos de alta calidad a partir de una entrada de texto, imagen o video”. Por lo tanto, no dista demasiado de DALL-E, de OpenAI, o Brain, de Google.
La gran diferencia de NUWA-Infinity respecto a estos sistema es que puede generar videos de larga duración a través de una descripción, además de imágenes en alta resolución con tamaños arbitrarios.
Respecto a las imágenes, su principal característica es que puede “extender” cualquier imagen. En su página, Microsoft usa de ejemplo La noche estrellada, de Van Gogh, para mostrar cómo puede agregar más elementos al cuadro sin olvidar el diseño original y dándole una continuidad muy exacta.
Dentro de la página de muestra también hay otros ejemplos, como la icónica foto de un paisaje de Windows, en la cual se imagina qué otros elementos hay alrededor, o videos generados a partir de fotografías.
Sin duda, el campo de las imágenes generadas por IA se ha convertido en uno de los usos más populares de la actualidad, por lo que las empresas están poniendo más atención a su desarrollo.
Acerca de Brain, Google ha compartido que se trata de asuntos importantes, pues más allá de crear nuevas imágenes, la idea de estas herramientas es fortalecer a los sistemas de inteligencias artificiales a partir de datos que los hagan aún más sofisticados e intentar reducir los prejuicios que estas tecnologías pueden reproducir.
“Las auditorías de conjuntos de datos han revelado que estos tienden a reflejar estereotipos sociales, puntos de vista opresivos y asociaciones despectivas, o dañinas, con grupos de identidad marginados” señala la investigación de Google .
Por otra parte, DALL-E anunció hace unos días que su herramienta abrirá una versión beta para un millón de usuarios; sin embargo, tan pronto como se dio a conocer la noticia, la lista de espera se llenó, demostrando el interés de los usuarios por que sus sueños se materialicen en una obra.
Cabe mencionar que OpenAI ya está monetizando su herramienta, pues a aquellos usuarios que consigan un acceso se les entregará 50 créditos gratis durante su primer mes. Posteriormente, los usuarios tendrán 15 créditos cada mes y si no les es suficiente tendrán que pagar 15 dólares por 115 créditos.
La empresa ha dicho que quiere frenar el mal uso de su herramienta antes de un lanzamiento más amplio. Por ello están tomando medidas para bloquear contenido con caras realistas y así evitar la creación de contenido “violento, para adultos o político”.
No obstante, algo relevante de DALL-E es que los usuarios también obtendrán los derechos de uso de las imágenes, incluso para usos comerciales, por lo que podrán ser monetizadas de cualquier forma en que ellos decidan.