Introducción a la Teoría de Juegos

La Teoría de Juegos puede ayudarnos a encontrar la ...
- mejor decisión en una situación competitiva, o
- la decisión más justa en una situación cooperativa
... donde el resultado para cada jugador depende de su decisión y las decisiones de otros jugadores.
Es útil en negocios, deportes, finanzas, la milicia, vida personal, juegos y más.
Veamos un ejemplo para ver cómo la Teoría de Juegos puede ayudarnos a encontrar la mejor decisión.
Dilema del Prisionero
Christian y Daniel son arrestados después de un robo. Están en cuartos separados y no pueden cooperar.
A Christian le han dicho:
- si ambos permanecen en silencio, ambos recibirán 1 mes de prisión por allanamiento
- si acusas a Daniel: tú saldrás libre, Daniel recibe 10 meses
- si Daniel te acusa: tú recibes 10 meses, Daniel sale libre
- si ambos se echan la culpa mutuamente, ambos reciben 6 meses
¿Qué le aconsejas a Christian que haga?
... piénsalo un momento ...
Entonces, tal vez tanto Christian como Daniel deberían permanecer en silencio, ¿verdad? Así solo obtienen 1 mes cada uno.

Pero ese resultado se llama inestable.
Porque cualquiera de las partes puede obtener un mejor resultado tomando la decisión "Yo salgo libre, tú recibes 10 meses".
¿Entonces, qué se debe hacer?
Bueno, lamentablemente, Christian está mejor echándole la culpa a Daniel.
Podemos verlo en una tabla como esta:
| Daniel | |||
| Permanecer en silencio | Culpar a Christian | ||
| Christian | Permanecer en silencio | -1, -1 | -10, 0 |
| Culpar a Daniel | 0, -10 | -6, -6 | |
¡Christian corre el riesgo de recibir 10 meses al permanecer en silencio!
Así que lo más probable es que ambos reciban 6 meses cada uno.
Estrategia es la acción o serie de acciones de un jugador
para completar el juego.
- Puede ser tan simple como "Echarle la culpa a Daniel"
- O algo como "Patear un penalty a la izquierda el 60% del tiempo aleatoriamente"
- O más complejo como un sistema para jugar un juego multijugador.
Equilibrio de Nash

El conjunto de estrategias de los jugadores donde Christian y Daniel se echan la culpa mutuamente (-6,-6) es un Equilibrio de Nash, nombrado así por John Nash (el protagonista de la película "Una mente brillante").
Es cuando ningún jugador está mejor al cambiar solo su propia estrategia.
En el ejemplo anterior: en (-6,-6) Christian no está mejor al cambiar a "silencio", y Daniel tampoco está mejor al cambiar a "silencio", así que esto es un Equilibrio de Nash.
(Si ambos cambiaran a "silencio" estarían mejor, pero solo estamos mirando elecciones individuales aquí.)
Otra forma de verlo: si cualquier jugador está mejor cambiando, entonces no es un Equilibrio de Nash.
Ejemplo: José y Perla viajan en tren a nuevos lugares para ganar dinero
- si José lleva una cámara y Perla una impresora pueden tomar retratos de las personas y ganar $300 por cada uno.
- o pueden llevar su propio equipo de limpieza y limpiar ventanas de edificios por un total de $200.
- pero no pueden llevar dos lotes de cosas.
Las estrategias lucen así:
| Perla | |||
| Impresora | Limpieza | ||
| José | Cámara | 300, 300 | 0, 200 |
| Limpieza | 200, 0 | 100, 100 | |
En (300,300) José no está mejor cambiando a (200,0). Y Perla no está mejor cambiando a (0,200). Así que este es un Equilibrio de Nash.
En (0,200) José está mejor cambiando a (100,100). Así que no es un Equilibrio de Nash, y no necesitamos comprobar más.
En (200,0) Perla está mejor cambiando a (100,100). Así que no es un Equilibrio de Nash.
En (100,100) José no está mejor cambiando a (0,200). Y Perla no está mejor cambiando a (200,0). Así que este es un Equilibrio de Nash.
¡Así que en este ejemplo hay dos Equilibrios de Nash!
El ejemplo anterior muestra que los jugadores pueden terminar atascados en una estrategia menos efectiva (100,100) frente a (300,300) que puede ser más por hábito que por cualquier otra cosa.
No se necesita un policía
Una forma de pensar sobre los Equilibrios de Nash es que (¡para jugadores racionales!) no se necesita un policía para mantener las reglas. Los jugadores "se autorregularán" naturalmente.
Ejemplo: Intersección (cruce vehicular)
Imagina que dos personas llegan a una intersección desde diferentes lados.
- Si ambos siguen adelante, chocan, con $9,000 de daños cada uno
- Si uno se detiene, el otro avanza con un beneficio de $1
- Pero si ambos se detienen, estarán ahí sentados mucho tiempo y les costará $10
| Conductor B | |||
| Seguir | Detenerse | ||
| Conductor A | Seguir | -9000, -9000 | 1, 0 |
| Detenerse | 0, 1 | -10, -10 | |
Así que es mejor detenerse y esperar a que el otro conductor avance en lugar de arriesgar un mal día.
Pero un punto importante:
Esto asume que los jugadores son racionales.
En el mundo real, algunas personas hacen cosas estúpidas y causan accidentes, así que necesitamos a la policía para ayudarnos a mantenernos seguros.
Estrictamente dominante
Cuando un jugador está mejor cambiando de una opción (sin importar lo que el otro jugador elija), entonces podemos eliminar esa opción.
Consulta Estrategias estrictamente dominadas para aprender más.
Pensando claramente
Para este momento ya habrás entendido la idea: configuramos una tabla que enumera las opciones para cada jugador, luego estimamos el beneficio (o costo) para cada entrada y luego usamos la lógica para determinar la mejor estrategia de nuestro jugador.
Estrategias Puras vs Mixtas
Lo que hemos visto hasta ahora son "Estrategias Puras": terminamos con una elección clara.
Pero cuando se involucra el azar, es posible que necesitemos una "Estrategia Mixta": una combinación de elecciones con probabilidades.
Lee Estrategias mixtas en la Teoría de Juegos para más información.
Gran Tema
Esto ha sido solo una introducción, hay mucho más que aprender sobre la Teoría de Juegos.
Aprende más para convertirte en un maestro estratega.