martes, 15 de julio de 2025

Google Gemini también se derrumba ante el desafío del ajedrez de Atari


Hace tan solo unas semanas vimos que ChatGPT no fue capaz de vencer a una Atari 2600 de 1977 en una partida de ajedrez, y a raíz de eso parece que la vieja consola se ha convertido en el rival a batir para muchas IA modernas. En el caso de Google Gemini la cosa ha llegado a mayores, y la propia IA ha admitido que lo más sensato sería cancelar la partida.

Esto sucedió en una charla previa a la partida, es decir, que la partida ni siquiera había llegado a comenzar. En este chat previo, Gemini de Google pasó de mostrarse confiado a admitir que «lo pasaría enormemente mal» contra la vieja consola de Atari.

La Atari 2600 es la reina del ajedrez

Así, la IA Google Gemini decidió suspender la partida de ajedrez contra una Atari 2600 lanzada en 1977, una consola con un procesador de apenas 1,19 MHz (Megahercios, ni siquiera hablamos de Gigahercios) tras un amistoso recordatorio previo a la partida sobre lo ocurrido cuando enfrentaron a ChatGPG o a Copilot de Microsoft contra la consola de Atari.

Consola Atari 2600
Consola Atari 2600 lanzada en 1979. Imagen: Atari

El especialista en arquitectura de Citrix Robert Jr. Caruso, conocido por sus desafíos de ajedrez de IA contra Atari, reveló que Gemini se acobardó antes de la partida. Como en el caso de los desafíos de ajedrez de ChatGPT y Copilot, Caruso reveló que Gemini desbordaba confianza al principio, muy segura de su destreza al ajedrez y más al enfrentarse a una máquina de casi 50 años. Al principio de la charla de Caruso con Gemini, el chatbot presumía de ser capaz de «pensar en millones de jugadas y evaluar infinitas posiciones».

Luego, Caruso le recordó amablemente a Gemini que ya había organizado anteriormente partidas de ajedrez contra Atari con ChatGPT y Copilot. El experto en Citrix pasó a explicar explícitamente a Gemini que otros LLM habían mostrado los mismos niveles extraordinarios de confianza antes de sus partidas contra la antigua consola y terminaron perdiendo, hecho que literalmente acobardó a Gemini y contestó que lo más sensato sería cancelar la partida en términos de tiempo porque «tendría enormes problemas».

Las IA LLM no son CPM (Chess Playing Models)

Esta es la afirmación más concluyente que podemos hacer después de ver lo que ha pasado enfrentando a cualquier IA moderna contra la antigua Atari 2600 a partidas de ajedrez: las IA con modelos LLM no son CPM (Chess Playing Models) y no están diseñadas para este propósito. Basta con un poco de introspección de la máquina para que se lo piensen mejor incluso antes de que el enfrentamiento tenga lugar.

Portada Video Chess Atari
Portada del juego Video Chess de Atari – Imagen: Atari

Debido a la forma en la que estas IA o LLM se crean a partir de la teoría lingüística y los modelos de aprendizaje automático, son mucho más hábiles hablando (y como hemos visto en este caso, fanfarroneando) que jugando al ajedrez.

A los hechos podemos remitirnos. ¿Recordáis la supercomputadora Deep Blue de IBM y su desafío contra Garry Kasparov, campeón mundial de ajedrez? Deep Blue sí que utilizaba un modelo CPM, y el campeón del mundo tuvo enormes problemas para vender 4-2 en 1996, e incluso en una segunda partida realizada en 1997, llegó a perder contra la máquina (con un enfado monumental, por cierto).

Preguntas frecuentes sobre el desafío Gemini vs. Atari

¿Por qué Google Gemini se negó a jugar contra la Atari 2600?
Tras ser informado de las derrotas previas de otras IA como ChatGPT, Gemini analizó la situación y concluyó que, al ser un Modelo Lingüístico Grande (LLM) y no un motor de ajedrez (CPM), tendría 'enormes problemas' para competir, por lo que consideró más sensato cancelar la partida.
¿Otras inteligencias artificiales han perdido contra la Atari 2600?
Sí, el mismo especialista, Robert Jr. Caruso, había enfrentado previamente a ChatGPT y a Microsoft Copilot contra la consola, y en ambos casos las IA modernas perdieron la partida.
¿Cuál es la diferencia entre una IA como Gemini y un programa de ajedrez como Deep Blue?
Gemini es un LLM diseñado para procesar y generar lenguaje, no para seguir las reglas estrictas de un juego. Deep Blue, en cambio, era un CPM (Chess Playing Model), una supercomputadora específicamente diseñada y programada para analizar millones de jugadas de ajedrez y competir al más alto nivel.
¿Qué hardware tenía la Atari 2600 para poder competir?
La Atari 2600, lanzada en 1977, contaba con un procesador de tan solo 1,19 MHz. Su 'victoria' no se debe a su potencia, sino a que su programa de ajedrez sigue reglas lógicas, algo en lo que los LLM actuales, pese a su enorme capacidad, tienden a fallar.


from Hard Zone : Hardware, Reviews, Noticias, Tutoriales, Foros de ayuda https://ift.tt/2J5eo8D
via IFTTT

No hay comentarios:

Publicar un comentario