'Pokémon Azul' mete en aprietos al modelo de IA más avanzado de Google Google prueba la inteligencia de su modelo Gemini 2.5 con "Pokémon Azul" y encuentra señales de deterioro en su razonamiento.

Getty Images

Un experimento reveló que Gemini 2.5 Pro, el modelo de lenguaje más avanzado desarrollado por Google DeepMind, enfrenta dificultades cognitivas cuando se somete a situaciones complejas dentro del videojuego Pokémon Azul, lanzado hace más de dos décadas para la consola GameBoy.

Según un informe realizado por DeepMind, durante una serie de pruebas transmitidas en vivo a través de Twitch, el sistema demostró una pérdida notable en su capacidad de toma de decisiones bajo presión.

El documento indica que la inteligencia artificial (IA) reaccionó con patrones erráticos al enfrentarse a escenarios donde sus criaturas virtuales se quedaban sin energía. En múltiples ocasiones, el modelo insistió de manera repetitiva en aplicar estrategias poco eficientes, como intentar curar a sus Pokémon o abandonar la zona actual, sin valorar otras rutas viables.

Relacionado: Demis Hassabis advierte que, sin abrazar la inteligencia artificial, los jóvenes quedarán atrás

Una IA poderosa, pero vulnerable a la presión

El experimento, conducido con el apoyo del desarrollador independiente Joel Zhang, se estructuró en dos fases. En la primera, los investigadores ofrecieron apoyo puntual al sistema para corregir errores y guiar sus acciones. En la segunda, Gemini operó sin ningún tipo de información adicional, como si se tratara de un jugador sin experiencia previa en el juego. Los resultados mostraron una mejora considerable: el tiempo necesario para terminar el juego se redujo de 813 horas a 406.

A pesar de sus limitaciones, el modelo también mostró fortalezas. De acuerdo con el informe, Gemini 2.5 Pro logró resolver tareas específicas del juego gracias a un conjunto de herramientas internas conocidas como "herramientas agénticas", que le permitieron superar desafíos como rompecabezas o rutas laberínticas.

Lo destacable es que estas herramientas fueron diseñadas, en su mayoría, por el propio modelo, lo cual sugiere una capacidad incipiente de autoprogramación.

El desempeño de Gemini en un entorno lúdico como Pokémon Azul muestra las capacidades, y las limitaciones, de los sistemas de IA cuando se enfrentan a tareas abiertas, caóticas o emocionalmente cargadas.

Aunque el sistema logró avanzar en varias etapas del juego, su comportamiento errático fue tan notorio que los espectadores de la transmisión detectaron los momentos en que el modelo parecía "entrar en pánico".

Relacionado: ¿Deberían los niños tener acceso a la IA? Google cree que sí
Entrepreneur en Español

Entrepreneur Staff

Iniciar un negocio

63 ideas de pequeños negocios para iniciar en 2025

Hemos elaborado una lista con las mejores y más rentables ideas de pequeños negocios para que los emprendedores las consideren en 2025.

Noticias

¿La IA reduce la capacidad de pensar? Estudio alerta sobre efectos de ChatGPT

La investigación introdujo el concepto de "deuda cognitiva" y muestra que el uso de herramientas de IA como ChatGPT debilita la memoria.

Noticias

Elon Musk vuelve a criticar a Donald Trump y propone crear un nuevo partido

El presidente respondió y aseguró que, si le corta los subsidios al magnate, tendría que regresar a Sudáfrica.

Noticias

¿Usas ChatGPT? La IA podría dañar tus habilidades de pensamiento crítico, según un estudio de Microsoft

Confiar en la IA puede implicar el uso de menos habilidades cognitivas, lo que, con el tiempo, puede provocar un deterioro.

Emprendedores

10 grandes frases sobre el poder de las metas

Establecer metas es el primer paso para lograr algo significativo.