Bots de póker: de clics automáticos cifrados al juego preciso "a ciegas", como en el ajedrez

Bots de póker: de clics automáticos cifrados al juego preciso "a ciegas", como en el ajedrez

¿Recuerdas los tiempos analógicos en los que el peor rival en la mesa era el "maníaco" que no sabía tirar la mano? Hoy en la misma mesa se esconden jugadores que no muestran ninguna señal de nerviosismo: no tienen pulso ni sudor en las palmas. Todo porque, en lugar de una persona, las decisiones las toma un algoritmo de IA, y lo hace más rápido de lo que alcanzas a poner la taza en el posavasos.


Por qué los bots ya no son ciencia ficción

Las salas online dejaron de ser un espacio exclusivamente humano hace tiempo. Basta con mirar el escándalo de hace dos semanas: el streamer Alan Finn, conocido como AlanFPoker, fue expulsado de WPT Global cuando los espectadores detectaron en su pantalla tablas con charts GTO listas —el clásico "asistente en tiempo real" (RTA). El operador devolvió los fondos a los jugadores y cerró la cuenta de forma permanente: la primera vez que se actúa tan públicamente y con tanta dureza en una gran plataforma.

Detalles del incidente con AlanFPoker:

El jugador irlandés de póker Alan Finn, conocido como "AlanFPoker" en Twitch (2.700 seguidores), fue expulsado inmediatamente de WPT Global después de que durante la transmisión de una partida dominical en límites bajos se observaran dos tablas de Excel —una llamada "WPT Range" y otra "Moms Shopping List"— ambas con análisis de rangos de manos. Patrick Leonard compartió una captura del incidente, pero luego borró el tuit escribiendo: "No es necesario destruirlo públicamente. WPT Global lo baneó en 30 minutos, bien hecho. Espero que aprenda la lección."

WPT Global anunció el baneo en Twitter con estas palabras: "No toleramos RTA. AlanFPoker ha sido baneado con efecto inmediato. Mantengamos el juego vivo." La norma 9.2 de WPT Global establece: "Se prohíbe a los jugadores usar dispositivos tipo robots o cualquier otro programa de ayuda externa (EPA) que distorsione el juego normal y otorgue una ventaja injusta al jugador."

Y eso es solo la punta del iceberg: en abril de 2025 PartyPoker informó sobre bloqueos récord de cuentas bot y la mayor devolución de fondos a jugadores afectados en cuatro años.

Estadísticas de PartyPoker sobre la lucha contra los bots:

En 2024 PartyPoker cerró 291 cuentas fraudulentas y devolvió a los jugadores $71,771 —la mayor suma devuelta desde 2020. Es un salto significativo respecto a 2023, cuando se cerraron solo 214 cuentas y se devolvieron $32,433.

Año Cuentas cerradas Fondos confiscados Promedio por cuenta
2020 608 $462,541 $761
2021 322 $47,344 $147
2022 276 $26,173 $95
2023 214 $32,433 $152
2024 291 $71,771 $247

Desde 2018 PartyPoker ha eliminado más de 2.500 cuentas fraudulentas, devolviendo a los jugadores más de $2 millones. Según Juha Pasanen, jefe del departamento de integridad del juego de PartyPoker: "No me importaría explicar a otros operadores cómo realizar exactamente un análisis estadístico para detectar redes de bots. Estamos todos juntos en esto."


De Libratus a Pluribus: cómo la IA aprendió a farolear

Las primeras victorias importantes de las máquinas en el póker fueron obra de laboratorios académicos. En 2017 Libratus jugó 120.000 manos contra profesionales de primer nivel en heads-up NLHE y ganó. Dos años después Pluribus de Meta/CMU elevó el nivel: venció a seis profesionales simultáneamente, demostrando por primera vez que el no-limit multinjugador también puede ser dominado por algoritmos.

Libratus: la primera revolución (2017)

Libratus, creado por el profesor de ciencias de la computación Tuomas Sandholm y el doctorando Noam Brown en Carnegie Mellon University, empleó más de 15 millones de horas-núcleo de cálculo en el superordenador "Bridges" para desarrollar su estrategia.

En el torneo "Brains vs. Artificial Intelligence: Upping the Ante" del 11 al 31 de enero de 2017, Libratus se enfrentó a cuatro profesionales de élite: Jason Les, Dong Kim, Daniel McAulay y Jimmy Chou. Tras 120.000 manos, Libratus ganó $1,766,250 en fichas —un winrate de 14.7 grandes ciegas por cada 100 manos, cifra considerada excepcionalmente alta.

"La capacidad del mejor IA para el pensamiento estratégico con información incompleta ahora supera la de los mejores humanos", dijo Sandholm.

El secreto de Libratus estaba en la adaptación nocturna: cada noche un meta-algoritmo analizaba las brechas en la estrategia que los profesionales encontraban y explotaban, y luego corregía automáticamente tres debilidades principales usando el superordenador.

Pluribus: el avance multijugador (2019)

Pluribus, desarrollado por los mismos autores en colaboración con Facebook AI, fue el primer IA en derrotar a profesionales en partidas 6-max no-limit hold'em, la forma de póker más popular del mundo.

En los experimentos Pluribus jugó tanto contra cinco copias de sí mismo y un humano, como en solitario contra cinco profesionales. Entre los profesionales vencidos estuvieron Darren Elias (récord de títulos WPT), Chris "Jesus" Ferguson (ganador de seis brazaletes WSOP) y otros jugadores millonarios del póker.

"Es increíblemente difícil saber qué mano puede tener. También hace muy bien las apuestas de valor sutiles en el river y extrae mucho valor de las manos buenas." — Chris Ferguson
"Es un monstruo absoluto del farol. Diría que farolea mucho más eficazmente que la mayoría de las personas. Y eso hace que jugar contra él sea tan difícil: siempre estás bajo una enorme presión que ejerce la IA." — Jason Les

Sorprende que Pluribus usara muchos menos recursos: solo 28 núcleos durante las partidas frente a 1.400 de Libratus, y costó solamente $150 en 8 días frente a los millones del predecesor.

En la base de ambos sistemas está la familia de algoritmos Counterfactual Regret Minimization (CFR). El algoritmo evalúa millones de escenarios hipotéticos y minimiza el "arrepentimiento" por cada elección errónea. Variantes modernas como CFR+, Monte Carlo CFR y redes profundas de valor permiten al bot calcular la situación en fracciones de segundo.


Cómo viven los bots en salas reales

Un bot "puro" es un programa independiente con su propio cliente que elude mecanismos anti-brute-force mediante:

  • captura de píxeles de la pantalla y reconocimiento OCR de las cartas;
  • conexión a bases de soluciones de solvers (PioSolver, GTO Wizard) para sugerencias instantáneas;
  • emulación de retardos humanos en los clics para no destacarse por los tiempos.

La forma más popular hoy es el software RTA: el jugador humano hace clic, pero al mismo tiempo recibe la estrategia perfecta en un segundo monitor. Psicología pura: parece que tomas las decisiones tú, pero en realidad dirige el algoritmo.


Real-Time Assistance: el cardenal gris del online moderno

El RTA se convirtió en un desafío claro tras el auge del póker durante la pandemia. GGPoker ya en 2020 expulsó 40 cuentas y confiscó $1,2 millones, y más tarde endureció las reglas: ahora, si se intenta abrir una ventana de solver externa, el cliente se cierra automáticamente.

En 2024 ACR Poker anunció un "Bot Challenge" —es decir, demuestren que pueden vencer a nuestro detector. Tras 38 horas el "challenge" se retiró: resultó que las condiciones eran inalcanzables y parte de los "probadores" usaban bots.

Incluso los profesionales en vivo reconocen la magnitud del problema. En agosto de 2024 los jugadores Patrick Leonard y Matt Berkey debatieron en el podcast Solve For Why si conviene imponer un "jaque mate" —una prohibición total de tablas externas y HUD. De momento coinciden en que sin detectores automáticos esto es una guerra de desgaste.


Herramientas del salón contra herramientas del jugador

Hoy la lucha se parece a una carrera armamentística. Lo que hacen los operadores:

  • huellas del hardware — rastrean el ID del equipo para cortar las granjas de juego múltiples;
  • análisis de los tiempos de clic: el humano comete errores, el bot hace clic en un ritmo perfecto y sospechosamente constante;
  • modelos conductuales con aprendizaje automático — entrenan el detector con millones de manos, etiquetando las líneas "no humanas";
  • CAPTCHA en un momento inesperado: aparece un pop-up con una combinación compleja de imágenes y el bot se queda atascado.

Pero los desarrolladores de bots también tienen contramedidas: retardos pseudoaleatorios, escritorios remotos con ratón por proxy y la emulación de líneas "tilt" para dar mayor verosimilitud.


Por qué atrapar a un bot sigue siendo extremadamente difícil

  • Campo legal gris. En la mayoría de jurisdicciones el uso de software bot no está penado por la ley; como máximo, se bloquea la cuenta y se confisca el bankroll.
  • Delgada línea entre un "tracker" de póker y un asistente RTA. El HUD estadístico es legal, la sugerencia de un solver no lo es, pero al detector le resulta difícil distinguirlos.
  • Evolución de los algoritmos. ReBeL de Facebook/Meta ya aprende un "estado recursivo de creencias" y ofrece un juego aún más caótico y "humano" — intenta averiguar a un rival así.
  • Economía de la sala. Los controles demasiado estrictos asustan a los jugadores recreativos, y son precisamente ellos quienes aportan la mayor parte de los ingresos.
ReBeL: nueva generación de IA para póker

Facebook presentó Recursive Belief-based Learning (ReBeL) —un algoritmo universal para juegos con información incompleta que superó incluso a Libratus. ReBeL venció al especialista heads-up Dong Kim con un winrate de 0.165 grandes ciegas por mano frente a 0.147 de Libratus en 2017.

La innovación clave de ReBeL es el trabajo con "estados públicos de creencia" (Public Belief States, PBS). El algoritmo tiene en cuenta no solo el estado visible del juego (cartas conocidas, tamaños de apuestas, rangos del oponente), sino también la "creencia" de cada jugador sobre en qué situación creen estar —similar a cómo una persona puede pensar que va por delante o por detrás en la mano.

"Muchos investigadores de IA no pensaron que esto fuera posible usando nuestros métodos." — Noam Brown, Facebook AI Research

ReBeL convierte los juegos con información incompleta en juegos con información completa al trabajar con distribuciones de probabilidad en lugar de estados concretos. Esto permite aplicar técnicas semejantes a las usadas por AlphaZero en ajedrez y go.

Los investigadores decidieron deliberadamente no publicar el código para póker: "El riesgo más inmediato de este trabajo es su potencial para el fraude en juegos recreativos como el póker. En parte por esa razón optamos por no publicar el código para póker."


Mirada al futuro: qué nos espera con el próximo repartidor

Los investigadores siguen publicando trabajos sobre DeepStack, Libratus y nuevas redes neuronales híbridas: enfoques cada vez más generales para los "juegos con información incompleta" pueden trasladarse al trading, la negociación, la ciberseguridad o los sistemas de conducción autónoma. Las investigaciones fundamentales, incluidas las publicaciones en arXiv, muestran el creciente interés en este campo.

Paralelamente, las grandes plataformas invierten millones en equipos de "Integridad del Juego". PartyPoker incluso publica informes trimestrales sobre el número de bots bloqueados —el único gran operador que publica esa estadística de forma consistente, mientras que PokerStars, GGPoker y 888poker lo hacen solo esporádicamente.


Qué puede hacer el jugador común hoy

  1. Confía en salas grandes y con licencia: al menos tienen presupuesto para departamentos anti-bot.
  2. Observa el timing del oponente. Si las respuestas llegan exactamente cada 1,2 segundos en cada calle, hay motivos para sospechar.
  3. Compara las líneas con la estrategia básica. Un humano rara vez elige siempre el tamaño perfecto de apuesta; un bot puede hacerlo. Como señaló uno de los profesionales sobre Pluribus: "Es muy difícil descifrarlo en cualquier mano. También hace muy bien las apuestas de valor sutiles en el river."
  4. Informa sobre sospechas. Sí, el soporte no responde al instante, pero los reportes masivos siguen siendo el principal detonante de una investigación interna.
  5. Desarrolla habilidades offline. El póker en vivo recupera lentamente la tradición de leer al rival y la habilidad de interpretar a la otra persona; a los bots se les cierra la entrada allí —por ahora.

La apuesta final

Los bots no "rompen" el póker: lo trasladan a una nueva fase tecnológica. Como ocurrió cuando el ajedrez vivió la era de Deep Blue, el póker tendrá que adaptarse: más matemáticas, más ciberseguridad y menos ilusiones.

Paradójicamente, el desarrollo de la IA para póker puede incluso mejorar el juego. Como dijo Tuomas Sandholm, creador de Libratus y Pluribus: "Me enamoré de este juego porque estas IAs realmente mostraron que en el juego hay una profundidad adicional que los humanos no comprendían, ni siquiera los brillantes profesionales que han jugado millones de manos."

Si quieres jugar, aprende no solo a contar outs, sino también a leer los registros. Puede que pronto la habilidad más valiosa en la mesa no sea la capacidad de farolear, sino la de demostrar que eres una persona real.

Alt text