IA Pero No Al 100%

Una tarde de café con un amigo me enteré de la existencia de Dall-E. Al principio era desconcertante y hasta dentro de lo que cabe, aterrador. Las posibilidades eran muchas y la tecnología se presentaba como una seria amenaza a la carrera de cualquiera en el gremio de la creatividad. Las preguntas legales y éticas que destaba eran y siguen siendo considerables y la opinión en ambos sentidos se hicieron rápidamente patentes. Había quien lo rechazaba y había quien ya estaba dedicando capacidad gráfica de sus servidores para generar los primeros experimentos publicados en redes sociales y que fueron motivo de alarma.
Fue esta segunda postura la que me atrajo, la curiosidad era mayor que el miedo. Por otro lado, no es la primera vez que nos encontramos en un punto que aparenta ser de no retorno para la creatividad. Pienso en el momento en el que se hizo posible echar para atrás en el mundo digital con el Control+Z y poder deshacer un paso en falso. Aunque no es del todo comparable, me atraía la capacidad, además gratuita, de poder hacer algunos pequeños experimentos y sobre todo intentar entender como poder usar esta herramienta. Había mucho potencial pero no control.
Sustitutición de fotogramas sobre el fragmento de un vídeo.
Comparativa con imagen real. A la derecha la imagen de base. A la izquierda generación individual de fotogramas para sustituir la secuencia.
No fue hasta ya pasado un tiempo que, obcecado en usar inteligencia artificial aplicada a mi propio trabajo, caí con la generación de video por texto. Las primeras pruebas me enseñaban que todavía era muy fuerte ese sabor fácilmente distinguible (cada vez menos) de imagen plástica o de render de IA. Sin embargo, un mensaje de whatsapp de una tarde cualquiera me dejaba caer un pequeño proyecto que terminó siendo un pequeño laboratorio de uso real de IA en terreno laboral.
En uno de los fotogramas del vídeo debían aparecer 5 logos de Sitges haciendo alusión a 5 candidatos que serían parte del jurado de la edición del año 2024. Fue aquí cuando vi la posibilidad de animar el logo usando IA. El hecho de que el logotipo fuera una imagen vectorial a una tinta de entrada simplifacaba todo.
Hice la prueba con un solo logo para ver que podía obtener, y después de algo menos de una hora tenía al alcance varias pruebas bastante sólidas. Algunas de ellas muy buenas. Otras, alucinaciones sin sentido de la IA malinterpretando el prompt (o yo escribiéndolo horriblemente mal).
Elegí las generaciones más limpias, las descargué y las vectoricé en After Effects. Esto me daba la seguridad de poder tener el control en caso de que hubiera que cambiar algo drástico en la animación. Después hice un bucle, repetí el proceso 4 veces, le cambié el color y lo presenté en la segunda jornada de trabajo como avance.
Aquí el vídeo final de la pieza donde es invisible el trabajo de la IA.
No creo que los resultados de IA deban ser los definitivos. Creo que lo interesante de la IA es que sea una herramienta y no un fin. Entiendo que muchas partes están interesadas en crear IAs cuyo objetivo final sea gestionar la generación total de un producto, pero justamente es este enfoque el que acaba arrebatando lo que queda de creatividad y de técnica a los productos finales, desproveyéndolos del toque humano.