Riccardo Castellani - Fotos: gentileza

Las inteligencias artificiales que generan imagen a partir de texto alcanzaron su pico de popularidad este año con el lanzamiento de Dall-E 2, Stable Diffusion y Midjourney, desarrollados para ese fin. Con estos programas, usuarios de todo el mundo pueden generar millones de imágenes al día a partir de texto u otras imágenes.

Apoyarse en artefactos para realizar cálculos matemáticos es una práctica que se remonta por lo menos al paleolítico superior, como sabemos por objetos como el hueso de Ishango.

Invitación al canal de WhatsApp de La Nación PY

La computadora analógica más antigua que conservamos es el mecanismo de Anticitera, datado entre el 150 y el 100 a.C., utilizada aparentemente para calcular ciclos astrales.

En el siglo XII, el inventor Al Jazari crea y publica diagramas para diversos aparatos mecánicos, incluyendo una barca de músicos robots que, activados por la corriente del agua, podían interpretar distintas melodías gracias a una pieza intercambiable que las contenía, iniciando el mundo de las máquinas programables.

En el siglo XVII, Leibniz redescubre el binario y formula su aritmética. Fabrica también una calculadora poco después de la primera, inventada por Pascal. Atestiguar cómo una máquina es capaz de realizar una tarea hasta entonces considerada puramente intelectual le llevó a soñar con una máquina de filosofar.

Todavía era temprano para la técnica, pero por esas visiones y otros aportes Norbert Wiener llama al pensador “el abuelo de la cibernética” en el libro en el que dio a conocer este término al mundo: “Cibernética o control y comunicación en el animal y la máquina”.

INTELIGENCIA ARTIFICIAL

Si bien podemos remontar la crítica a las máquinas automáticas incluso hasta la leyenda del Golem, el primer argumento específicamente en contra de la inteligencia artificial fue formulado un par de siglos después de Leibniz por la primera programadora, Ada Lovelace.

En sus notas sobre el “Analytical Engine”, el primer intento de computadora multipropósito, asegura que las máquinas hacen lo que uno le ordena y no son capaces de creatividad.

Menos de un siglo más tarde, Alan Turing retrucará que la opinión de Lovelace estaba condicionada por el hardware con el que se relacionaba. Turing trabajó con las primeras computadoras funcionales y en 1950 publicó su artículo “Las maquinarias de computación y la inteligencia”, donde asegura que él no puede sino sorprenderse ante los caminos creativos que toman sus computadoras ante distintos problemas.

Predijo además con bastante acierto que para comienzos del siglo XXI será sumamente difícil distinguir el producto de una máquina del producto de un humano.

AUTOCATÁLISIS MAQUINAL

El primer concepto que parece útil a la hora de pensar la creatividad de las máquinas es el de autocatálisis maquinal, acuñado por Kodwo Eshun en su libro “Más brillante que el sol”.

En el capítulo “El futuro es un accidente”, analiza el papel del Roland TB-303 Bass Line y del Emulator E1 en la música moderna. En el primer caso, asegura que todo el sonido del acid ya está contenido en el TB-303 y la banda pionera de este estilo, Phuture, no sería sino un médium que el aparato usa para replicarse.

Sobre el E1, cuenta que Marley Marl descubrió por accidente como samplear el break en este emulador. Intentando grabar una voz, se le coló un redoblante. El sonido no era el que buscaba, era algo mejor y abría las puertas a numerosos nuevos estilos que aún se siguen generando en la música electrónica.

Eshun hace notar que en ambos casos no es la agencia humana, sino el modo de funcionamiento de las máquinas el que hace posible la innovación. El verdadero creador es el circuito y el humano sería responsable de llevarlo al contexto adecuado.

NO SOLO EN LA MÚSICA

Una situación de autocatálisis maquinal puede encontrarse en el artículo que inicia la era de arte con inteligencia artificial que estamos viviendo, “Incepcionismo: profundizando en las redes neuronales”, publicado en el 2015 por los ingenieros de Google Alexander Mordvintsev, Christopher Olah y Mike Tyka.

En el artículo, cuentan que no estaban buscando una aplicación para crear arte psicodélico. Simplemente querían mejorar el reconocimiento de imágenes a través de redes neuronales.

Durante los experimentos descubrieron que la máquina, además de reconocer, era capaz de generar las imágenes que había aprendido en su entrenamiento. Esto les ayudaba a corregir errores. Por ejemplo, al pedirle que genere mancuernas, la red incluía siempre un pedazo de brazo, dando pistas para mejorar el set de imágenes o el algoritmo.

Pero el verdadero momento de autocatálisis maquinal ocurre cuando le piden a la red que mire la foto de una nube y optimice lo que sea que vea. La computadora terminó creando una serie de personajes dignos de “El jardín de las delicias” como el pájaro-camello, el perro-pez o el cerdo-caracol.

El estilo de Deep Dream es fácilmente reconocible y se volvió una suerte de meme. Usado sin modificaciones, los resultados multiplican fragmentos de perro, pájaro, pagodas y coches en ensambles increíbles.

ARTE ERGÓDICO

En su libro de 1997 “Cibertexto: perspectivas sobre la literatura ergódica”, Espen Aarseth presenta nuevos conceptos para estudiar los videojuegos. Él también trafica su palabra de las ciencias. Pero a diferencia de Eshun, que encuentra en la autocatálisis química la imagen de aceleraciones contenidas en la estructura misma del sistema, a Aarseth, la ergódica de la física solo le interesa por su etimología: “ergon” de trabajo y “hodos” de camino.

Aarseth dice que un texto es ergódico cuando exige un esfuerzo no trivial del lector, algo más que mover los ojos y pasar las hojas. Entre sus ejemplos figuran la escritura jeroglífica en las tumbas egipcias, donde el orden y el sentido depende de la dirección, el tamaño de la imagen y la posición que tienen en la oración.

Otros ejemplos que podemos mencionar son los hylie, retratos escritos de Alá del arte musulmán, los caligramas de Apollinaire, los poemas visuales de Simias de Rodas o la novela “Rayuela” de Cortázar.

Llegando finalmente a las computadoras, Aarseth cita “Diary of a camper”, la primera machinima (cortometraje creado usando como base un videojuego, Quake en este caso).

También menciona Tale-spin, un programa interactivo que escribe historias, presentado en 1975 por James R. Meehan en la V conferencia sobre inteligencia artificial. El programa tenía incorporados datos sobre resolución de problemas, espacios físicos, relaciones interpersonales y el idioma inglés, entre otros. El usuario comenzaba una historia y el programa era capaz de continuarla.

Aarseth desarrolló su teoría para estudiar los videojuegos y su relación con la literatura, pero con el paso del tiempo dejó atrás sus ideas ante la imposibilidad de aplicarlas a todo el conjunto de su área de estudio y el éxito de otros acercamientos.

A pesar de esto, podemos prestar el concepto ergódico como él lo pensó para aplicarlo a las obras gráficas de inteligencia artificial.

En gran medida, las redes neuronales que producen imágenes Dall-E 2, Midjourney y Stable Diffusion tienen interfaces similares a Tale-spin, son capaces de poner el trabajo para desarrollar el camino que le ofrece el usuario, por lo que son programas de arte ergódico.

Caligrama de Vicente Huidobro.

MÁQUINA ABIERTA Y CONJUNTO TÉCNICO

El “Modo de existencia de los objetos técnicos” es un análisis de la relación de los humanos con las máquinas publicado por Gilbert Simondon en 1958.

En él, su autor declara que nuestra alienación parte del modo en que tratamos a las máquinas y no seremos libres mientras ellas no lo sean también.

Con la automatización como camino privilegiado en el desarrollo tecnológico, se desprenden las dos actitudes contrapuestas: la máquina es lo más útil, pero también lo más peligroso. Hace un gran trabajo, pero tememos que se rebele.

Simondon hace notar que estas son actitudes propias de esclavistas y que la automatización ni siquiera implica un desarrollo técnico avanzado. En su lugar, muestra que los verdaderos avances tecnológicos aparecen con las máquinas abiertas.

La apertura de las máquinas se refiere al grado de indeterminación que tienen para percibir el mundo y acoplarse a otras máquinas o al medio.

Impulsando el desarrollo de máquinas abiertas en lugar de máquinas automáticas es posible abandonar la posición de vigilantes de una tropa de esclavos para convertirnos en organizadores de una sociedad de objetos técnicos en una relación más similar a la del director de orquesta con los músicos.

En el conjunto técnico que se logra con máquinas abiertas, crece la cantidad de información y disminuye la degradación de la energía: la máquina es aquello por medio de lo cual el hombre se opone a la muerte del universo, hace más lenta, como la vida, la degradación de energía y se convierte en estabilizadora de la vida.

“Descripción del profeta”, de Abdülkadir Sükrü Efendi.

CONCLUSIONES

Las inteligencias artificiales para realizar obras gráficas cuentan con todos los elementos citados. En primer lugar, se trata de resultados inesperados, contenidos ya en el sistema de la máquina, como en la autocatálisis maquinal que formula Eshun.

En segundo lugar, es la máquina la que realiza el trabajo siguiendo el camino del usuario. El paso que realiza el humano, llamado “promt” en inglés, hoy en día se está desarrollando como una disciplina: el prompt engineering. Se puede decir que estamos de lleno en el campo del arte ergódico.

En tercer lugar, se trata de sistemas que pueden ensamblarse a otros programas, personas o datos para generar obras nuevas. La importancia de la apertura se hace notar incluso más al ver que la velocidad de producción, tanto de nuevas obras como herramientas, aumenta cuando el código está liberado.

Esta nueva forma de producción nos abre las puertas a una relación de igual a igual con los objetos técnicos que crean con nosotros un rico espacio de posibilidades que puede darnos mucho más que memes divertidos y en el que todavía queda mucho por descubrir.

Por otra parte, hay que notar que estos conceptos son insuficientes, ya que las inteligencias artificiales que generan imagen a partir de texto mencionadas son apenas una de las manifestaciones del arte con inteligencias artificiales.

Asimismo, también el arte es apenas uno de los numerosos ámbitos en los que se aplican estas tecnologías. El futuro nos depara con seguridad más de lo que esperamos y nos toca prestar atención a lo nuevo que toca la puerta.

Caligrama de Guillaume Apollinaire.
La nube del proyecto Deep Dream de Google.
Caligramas del poeta y gramático griego Simmias de Rodas.

Déjanos tus comentarios en Voiz