El dilema del prisionero iterado
Obtenido de la wikipedia, mejor leer este enlace si no conoces el dilema del prisionero de la teoría de juegos. Básicamente se trata de un juego que representa el modo de pensamiento habitual de dos personas que se encuentran incomunicadas y que podrían sacar beneficio perjudicando a la otra. El dilema del prisionero iterado es el mismo juego, pero efectuado más de una vez y permitiendo que los participantes recuerden las acciones de sus contrarios en anteriores encuentros, es decir, si en el pasado les fastidiaron. En este tipo de juego, que bien puede simbolizar las decisiones que muchos de nosotros tomamos a lo largo de nuestra vida, se demuestra que beneficiarse a costa de otras personas no es la mejor estrategia. Si lo pensamos, la mayoría de la gente no opta por ese tipo de actitud perniciosa, lo que indica que efectivamente, la evolución ha favorecido a las personas con espíritu colaborativo:
El dilema del prisionero iterado.
En su libro La evolución de la cooperación: el dilema del prisionero y la teoría de juegos (1984), Robert Axelrod estudió una extensión al escenario clásico del dilema del prisionero que denominó dilema del prisionero iterado (DPI). Aquí, los participantes deben escoger una y otra vez su estrategia mutua, y tienen memoria de sus encuentros previos. Axelrod invitó a compañeros académicos a lo largo del mundo a idear estrategias automatizadas para competir en un torneo de DPI. Los programas que participaron variaban ampliamente en la complejidad del algoritmo: hostilidad inicial, capacidad de perdón y similares.
Axelrod descubrió que cuando se repiten estos encuentros durante un largo periodo de tiempo con muchos jugadores, cada uno con distintas estrategias, las estrategias "egoístas" tendían a ser peores a largo plazo, mientras que las estrategias "altruistas" eran mejores, juzgándolas únicamente con respecto al interés propio. Usó esto para mostrar un posible mecanismo que explicase lo que antes había sido un difícil punto en la teoría de la evolución: ¿cómo puede evolucionar un comportamiento altruista desde mecanismos puramente egoístas en la selección natural?
Se descubrió que la mejor estrategia determinista era "Tit for Tat" ("Donde las dan, las toman"), que fue desarrollada y presentada en el torneo por Anatol Rapoport. Era el más simple de todos los programas presentados, conteniendo únicamente cuatro líneas de BASIC, y fue la que ganó el concurso. La estrategia consiste simplemente en cooperar en la primera iteración del juego, y después de eso elegir lo que tu oponente eligió la ronda anterior. Una estrategia ligeramente mejor es "Tit for Tat con capacidad de perdón". Cuando tu oponente deserta, en la siguiente ronda cooperas a veces de todos modos con él con una pequeña probabilidad (del 1% al 5%). Esto permite la recuperación ocasional de quedarse encerrado en un círculo de deserciones. La probabilidad exacta depende de la alineación de los oponentes. "Tit for Tat con capacidad de perdón" es la mejor estrategia cuando se introducen problemas de comunicación en el juego. Esto significa que a veces tu jugada se transmite incorrectamente a tu oponente: tú cooperas pero tu oponente cree que has desertado.
Tit for Tat funcionaba, mantenía Axelrod, por dos motivos. El primero es que es "amable", esto es, comienza cooperando y sólo deserta como respuesta a la deserción de otro jugador, así que nunca es el responsable de iniciar un ciclo de deserciones mutuas. El segundo es que se le puede provocar, al responder siempre a lo que hace el otro jugador. Castiga inmediatamente a otro jugador si éste deserta, pero igualmente responde adecuadamente si cooperan de nuevo. Este comportamiento claro y directo significa que el otro jugador entiende fácilmente la lógica detrás de las acciones de Tit for Tat, y puede por ello encontrar una forma de trabajar con él productivamente. No es una coincidencia que la mayoría de las estrategias que funcionaron peor en el torneo de Axelrod fueron las que no estaban diseñadas para responder a las elecciones de otros jugadores. Contra ese tipo de jugador, la mejor estrategia es desertar siempre, ya que nunca puedes asegurarte de establecer una cooperación mutua fiable.
4 comentarios
manuel ramos garrido -
Muchas Gracias
manuel ramos garrido -
Muchas Gracias
Roger Torres Salazar -
Esbrújulo -
Pero hay algo con lo que estoy totalmente en desacuerdo. El nombre que le han dado.
No existe ningún prisionero, se trata de un preso o en todo caso detenido.