"Un insulto a la vida misma.” Así calificaba Hayao Miyazaki, en 2016, una animación creada por inteligencia artificial (IA) que representaba a una criatura similar a un zombi. Las palabras del mítico creador de Studio Ghibli han resurgido con fuerza en medio de la reciente fiebre por generar imágenes en su característico estilo. Si bien Miyazaki no ha vuelto a pronunciarse sobre el tema (sí lo ha hecho su hijo), un fenómeno ha capturado la imaginación de millones. Desde recreaciones de fotos familiares hasta memes y escenas históricas, una herramienta de ChatGPT se ha extendido rápidamente. Pero más allá de la fascinación, expertos advierten sobre los impactos éticos y medioambientales que no debemos pasar por alto.

La “magia”
Los programas de IA generativa pueden crear contenidos a partir de instrucciones escritas por los usuarios, conocidas como prompts. Antes, la mayoría de estos programas usaban modelos de difusión, un tipo de algoritmo que comienza con una imagen caótica y la transforma progresivamente en algo coherente. Ahora, la última versión de ChatGPT, GPT-4, emplea un enfoque diferente: un algoritmo autorregresivo. En lugar de generar la imagen completa de una vez, lo hace paso a paso, prediciendo cada píxel en función de los anteriores. Es un proceso similar al que usa para el texto: así como predice la siguiente palabra en una oración, aquí predice los elementos visuales que encajan en la imagen.
Para entenderlo mejor, pensemos en el ejemplo de moda: antes, para generar una imagen, había que describir cada detalle. Ahora, basta con escribir algo como “imagen con la estética de Studio Ghibli”, y la IA capta la referencia sin necesidad de más detalles. No almacena imágenes exactas de las películas del estudio, pero ha aprendido los patrones que las caracterizan: colores vibrantes, fondos detallados y personajes expresivos. Lo mismo sucede si le pedimos un gato. La IA no memoriza fotos de felinos específicos, pero sí reconoce los rasgos que los hacen inconfundibles: cuerpo peludo, cuatro patas, cola y bigotes.
En esta página se puede ver la diferencia en la calidad de las imágenes generadas. Hay un ejemplo de 2022 donde una IA intentó crear “un faraón egipcio sentado en un trono bajo un estandarte al estilo Totoro de Studio Ghibli”. El resultado recuerda más a los dibujos animados que veíamos en la década de 1990. En cambio, las imágenes actuales parecen sacadas directamente de la mente de Miyazaki.

“La velocidad de desarrollo es bestial”, analizó Andrés Ferragut, catedrático de Redes y Sistemas de Comunicación de la Facultad de Ingeniería de la Universidad ORT. Y agregó: “Esto es posible no solo por la evolución de los algoritmos, sino también por la enorme cantidad de datos digitales disponibles. Los algoritmos no son mágicos: dependen tanto de esa información como de la infraestructura computacional de las empresas que los desarrollan”. Y lo cierto es que hoy conviven las dos cosas: millones de usuarios comparten todos datos constantemente; mientras que las empresas compiten entre sí para ver quién logra entrenar mejor a sus algoritmos.

Costo oculto
La magnitud del fenómeno sorprendió hasta al propio cofundador de OpenAI, Sam Altman, quien admitió que nunca había visto una demanda similar. El 31 de marzo escribió en X: “El lanzamiento de ChatGPT hace 26 meses fue uno de los momentos virales más locos que he visto, sumando un millón de usuarios en cinco días (hoy lo usan unos 700 millones). Ahora agregamos un millón de usuarios en la última hora”.
El entusiasmo provocó una sobrecarga en las unidades de procesamiento gráfico de la empresa, que primero implementó límites de velocidad y luego suspendió temporalmente la función para los usuarios gratuitos. Actualmente, sin pagar, solo se pueden generar tres imágenes por día.
“La moraleja que saco de que esto se haya vuelto viral es que generar imágenes no es gratis para el planeta. Si todos nos ponemos a hacer esto, el consumo energético es enorme, al punto de haber saturado la capacidad de los servidores de OpenAI”, apuntó Ferragut, señalando un aspecto menos visible de esta tecnología, que considera incluso más relevante que el técnico: su costo medioambiental.
En promedio, cada imagen consume 0,14 kilovatios-hora (kWh). “Es como calentar agua para el mate”, ilustró el experto. Además, es suficiente para alimentar 14 lamparitas LED durante una hora. Si bien miles de uruguayos rellenan termos por día, Ferragut advirtió que el problema surge cuando, además del “chiveo”, se le exige a la IA acciones en áreas más complejas que requieren más capacidad de cómputo. En esos casos, “hay que tener en cuenta el costo energético”.
Los servidores en los centros de datos generan un gran volumen de calor al procesar cálculos. Para evitar el sobrecalentamiento, requieren enfriamiento constante, generalmente a través de sistemas que transfieren el calor al agua y lo disipan en torres de refrigeración. En zonas sin acceso a agua, se utilizan sistemas eléctricos de aire acondicionado, lo que aumenta el consumo energético. En este contexto, generar un texto de 100 palabras en ChatGPT consume, en promedio, 519 mililitros de agua. Así lo señaló Ferragut: generar una imagen, pedir un chiste o interactuar con la IA “no es gratis; esto hay que internalizarlo o ponerlo como parte de la ecuación”.
Por otra parte, estos sistemas no crean algo completamente nuevo, sino que extrapolan lo que ya conocen. Esto plantea una discusión sobre los derechos de autor y la propiedad intelectual, ya que la IA no actúa con creatividad genuina. Según el experto, si se le pidiera a una IA crear una película estilo Ghibli sin usar ejemplos previos, no podría hacerlo, pues le faltarían suficientes referencias para lograrlo... pero lo que podría suceder en el futuro es otra cosa.
-
Una organización que integra Uruguay advierte por el consumo eléctrico de la IA en América Latina
Advierten que la inteligencia artificial consumirá 5% de la electricidad de América Latina y Caribe para 2035
La IA irrumpe en nuestras vidas y genera miedo y ansiedad: ¿se está agravando el tecnoestrés?