Teoria de Juegos: diciembre 2011

jueves, 15 de diciembre de 2011

TEORÍA DE JUEGOS

Rama de las matemáticas que se encarga de analizar las interacciones entre individuos que toman decisiones dentro de un marco (juegos).En un juego, varios agentes buscan maximizar su utilidad eligiendo determinados cursos de acción. La utilidad final obtenida por cada individuo depende de los cursos de acción escogidos por el resto de los individuos.

Origen

La Teoría de los Juegos comienza con los trabajos de Sérmelo (1913), quién muestra que juegos como el ajedrez son resolubles. Borel (1921) y Von Neumann (1959) en los años 20 estudian los equilibrios de tipo mínimax en juegos de suma cero, es decir, juegos en los que lo que gana un jugador lo pierde su rival.

El primer avance importante ocurre en los años 40, con la publicación del libro sobre Teoría de Juegos de Neumann and Morgenstern (1944) que divulgó una formalización general de juegos en su forma extendida y normal, introdujo el concepto de estrategia en juegos extensivos y propuso aplicaciones.

Objetivo

El principal objetivo de la Teoría de los Juegos es determinar patrones de conducta racional en situaciones donde compiten dos o más jugadores, y donde los resultados dependen de la interacción de las estrategias que despliegan.

Su aplicación es apropiada para problemas donde quienes toman las decisiones no poseen un control completo de los factores que influyen en el resultado, y donde se presentan influencias y determinaciones mutuas.

Áreas de estudio de la teoría de juegos

§ La Teoría de los Juegos No Cooperativos, estudia como los individuos racionales actúan recíprocamente entre sí en un esfuerzo por lograr maximizar sus propias metas.

§ La Teoría de los Juegos Cooperativos, estudia como los individuos racionales actúan recíprocamente entre si en un esfuerzo por lograr metas interdependientes con la finalidad de maximizar los intereses particulares de cada uno a través del logro de metas compartidas.

PRINCIPALES CONCEPTOS DE LA TEORÍA DE LOS JUEGOS

1. *Juegos

Se denomina juego a la situación interactiva especificada por el conjunto de participantes, los posibles cursos de acción que puede seguir cada participante, y el conjunto de utilidades.

2. *Estrategia

un plan de acciones completo que se lleva a cabo cuando se juega el juego. Se explicita antes de que comience el juego, y prescribe cada decisión que los agentes deben tomar durante el transcurso del juego, dada la información disponible para el agente.

3 Resultados de los juegos:

Es una cierta asignación de utilidades finales

4. *Forma normal versus forma extensiva de los juegos

En juegos de forma normal, los jugadores mueven simultáneamente. Si el conjunto de estrategias es discreto y finito, el juego puede ser representado por una matriz NxM (ver siguiente).

Un juego en forma extensiva especifica el orden completo de movimientos a través de la dirección del juego, generalmente en un árbol de juego.

5.*Juegos NxM

un jugador tiene N acciones posibles y el otro tiene M acciones posibles. los pares de utilidades o pagos pueden ser representados en una matriz y el juego es fácilmente analizable.

6. Resultado de equilibrio:

se da cuando ningún jugador puede mejorar su utilidad unilateralmente

7.*Estrategia dominante

Una estrategia dominante es aquella elección que realiza el jugador independientemente de lo que haga el otro. En el juego representado en la matriz de arriba, la estrategia dominante para A es elegir “abajo”, mientras que la estrategia dominante para B es elegir “izquierda”. Estas estrategias dominantes dan como resultado el equilibrio de estrategias dominantes del juego. Si cada jugador tiene una estrategia dominante se puede predecir el resultado del juego.

8.*Equilibrio de Nash

El equilibrio de Nash fue formulado por John Nash, que es un matemático norteamericano, en 1951. Un par de estrategias es un equilibrio de Nash si la elección de A es óptima dada la de B y la de B es óptima, dada la de A.

9. Equilibrio estratégico:

es aquel que se obtiene cuando, cada jugador se mantiene en su estrategia, ninguno logra mejorar su utilidad cambiando de estrategia.

10.*Juego repetido

. La posibilidad de observar las acciones y los resultados pasados antes de que comience la siguiente jugada permite que los jugadores premien las acciones pasadas, de modo que surgen estrategias que no surgirían en los juegos simples no repetidos.

APLICACIONES A OTRAS ÁREAS DE ESTUDIO

§ Economía y negocios

Un documento de teoría de juegos en economía empieza presentando un juego que es una abstracción de una situación económica particular. Se eligen una o más soluciones, y el autor demuestra que conjunto de estrategias corresponden al equilibrio en el juego presentado. Los economistas y profesores de escuelas de negocios sugieren dos usos principales:

Ø Descriptiva

El uso principal es informar acerca del comportamiento de las poblaciones humanas actuales. Algunos investigadores creen que encontrar el equilibrio de los juegos puede predecir cómo se comportarían las poblaciones humanas si se enfrentasen a situaciones análogas al juego estudiado.

Ø Normativa

Por otra parte, algunos matemáticos no ven la teoría de juegos como una herramienta que predice la conducta de los seres humanos, sino como una sugerencia sobre cómo deberían comportarse. Dado que el equilibrio de Nash constituye la mejor respuesta a las acciones de otros jugadores, seguir una estrategia que es parte del equilibrio de Nash parece lo más apropiado

§ Informática y lógica

los investigadores de informática han usado juegos para modelar programas que interactúan entre sí. . Muchas teorías lógicas se asientan en la semántica de juegos

§ Ciencias políticas

Una explicación de la teoría de la paz democrática es que el debate público y abierto en la democracia envía información clara y fiable acerca de las intenciones de los gobiernos hacia otros estados. , es difícil conocer los intereses de los líderes no democráticos, qué privilegios otorgarán y qué promesas mantendrán

MODELO EL DILEMA DEL PRISIONERO

Dos delincuentes son detenidos y encerrados en celdas de aislamiento de forma que no pueden comunicarse entre ellos. El alguacil sospecha que han participado en el robo del banco, delito cuya pena es diez años de cárcel, pero no tiene pruebas. Sólo tiene pruebas y puede culparles de un delito menor, tenencia ilícita de armas, cuyo castigo es de dos años de cárcel. Promete a cada uno de ellos que reducirá su condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco, pero ellos han prometido no delatarse.

TIPO DE JUEGOS Y EJEMPLOS

La teoría clasifica los juegos en muchas categorías que determinan qué métodos particulares se pueden aplicar para resolverlos.

Las categorías comunes incluyen:

§ Juegos simétricos y asimétricos

Un juego simétrico es un juego en el que las recompensas por jugar una estrategia en particular dependen sólo de las estrategias que empleen los otros jugadores y no de quién las juegue.

Si las identidades de los jugadores pueden cambiarse sin que cambien las recompensas de las estrategias, entonces el juego es simétrico.

Las representaciones estándar del Juego de la gallina, el dilema del prisionero y la caza del ciervo son juegos simétricos.

Los juegos asimétricos más estudiados son los juegos donde no hay conjuntos de estrategias idénticas para ambos jugadores.

Por ejemplo, el Juego del Ultimátum y el Juego del dictador tienen diferentes estrategias para cada jugador; no obstante, puede haber juegos asimétricos con estrategias idénticas para cada jugador.

§ Juegos de suma cero y de suma no cero




Un juego de suma cero

En los juegos de suma cero el beneficio total para todos los jugadores del juego, en cada combinación de estrategias, siempre suma cero (en otras palabras, un jugador se beneficia solamente a expensas de otros). El go, el ajedrez y el póker son ejemplos de juegos de suma cero, porque se gana exactamente la cantidad que pierde el oponente.

La mayoría de los ejemplos reales en negocios y política, al igual que el dilema del prisionero, son juegos de suma no cero, porque algunos desenlaces tienen resultados netos mayores o menores que cero. Es decir, la ganancia de un jugador no necesariamente se corresponde con la pérdida de otro. Por ejemplo, un contrato de negocios involucra idealmente un desenlace de suma positiva, donde cada oponente termina en una posición mejor que la que tendría si no se hubiera dado la negociación.

Se puede analizar más fácilmente un juego de suma cero, y cualquier juego se puede transformar en un juego de suma cero añadiendo un jugador "ficticio" adicional ("el tablero"), cuyas pérdidas compensen las ganancias netas de los jugadores.

La matriz de pagos de un juego es una forma conveniente de representación. Por ejemplo, un juego de suma cero de dos jugadores con la matriz que se muestra a la derecha.

§ Juegos cooperativos

Un juego cooperativo se caracteriza por un contrato que puede hacerse cumplir. La teoría de los juegos cooperativos da justificaciones de contratos plausibles. La plausibilidad de un contrato está muy relacionada con la estabilidad.

Dos jugadores negocian qué tanto quieren invertir en un contrato. La teoría de la negociación axiomática nos muestra cuánta inversión es conveniente para nosotros. Por ejemplo, la solución de Nash para la negociación demanda que la inversión sea justa y eficiente.

§ Simultáneos y secuenciales

Los juegos simultáneos son juegos en los que los jugadores mueven simultáneamente o en los que éstos desconocen los movimientos anteriores de otros jugadores. Los juegos secuenciales (o dinámicos) son juegos en los que los jugadores posteriores tienen algún conocimiento de las acciones previas. Este conocimiento no necesariamente tiene que ser perfecto; sólo debe consistir en algo de información.

Por ejemplo, un jugador puede conocer que un jugador no realizó una acción determinada, pero no saber cuál de las otras acciones disponibles eligió.

La diferencia entre juegos simultáneos y secuenciales se recoge en las representaciones discutidas previamente. La forma normal se usa para representar juegos simultáneos, y la extensa para representar juegos secuenciales.

Juegos de información perfecta

Un juego de información imperfecta (las líneas punteadas representan la ignorancia de la parte del jugador 2)

Un subconjunto importante de los juegos secuenciales es el conjunto de los juegos de información perfecta. Un juego es de información perfecta si todos los jugadores conocen los movimientos que han efectuado previamente todos los otros jugadores; así que sólo los juegos secuenciales pueden ser juegos de información perfecta, pues en los juegos simultáneos no todos los jugadores (a menudo ninguno) conocen las acciones del resto. La mayoría de los juegos estudiados en la teoría de juegos son juegos de información imperfecta, aunque algunos juegos interesantes son de información perfecta, incluyendo el juego del ultimátum y el juego del ciempiés. También muchos juegos populares son de información perfecta, incluyendo el ajedrez y el go.

La información perfecta se confunde a menudo con la información completa, que es un concepto similar. La información completa requiere que cada jugador conozca las estrategias y recompensas del resto pero no necesariamente las acciones.

En los juegos de información completa cada jugador tiene la misma "información relevante al juego" que los demás jugadores. El ajedrez y el dilema del prisionero ejemplifican juegos de información completa. Los juegos de información completa ocurren raramente en el mundo real, y los teóricos de los juegos, usualmente los ven sólo como aproximaciones al juego realmente jugado.

John Conway desarrolló una notación para algunos juegos de información completa y definió varias operaciones en esos juegos, originalmente para estudiar los finales de go, aunque buena parte de este análisis se enfocó en Nim. Esto devino en la teoría de juegos combinatoria. Descubrió que existe una subclase de esos juegos que pueden ser usados como números, como describió en su libro On Numbers and Games, llegando a la clase muy general de los números surreales.

§ Juegos de longitud infinita

Por razones obvias, los juegos estudiados por los economistas y los juegos del mundo real se finalizan generalmente tras un número finito de movimientos. Los juegos matemáticos puros no tienen estas restricciones y la teoría de conjuntos estudia juegos de infinitos movimiento, donde el ganador no se conoce hasta que todos los movimientos se conozcan.

El interés en dicha situación no suele ser decidir cuál es la mejor manera de jugar a un juego, sino simplemente qué jugador tiene una estrategia ganadora (Se puede probar, usando el axioma de elección), que hay juegos —incluso de información perfecta, y donde las únicas recompensas son "perder" y "ganar"— para los que ningún jugador tiene una estrategia ganadora.) La existencia de tales estrategias tiene consecuencias importantes en la teoría descriptiva de conjuntos.

MODELO HALCÓN PALOMA

En el lenguaje ordinario entendemos por "halcón" a los políticos partidarios de estrategias más agresivas mientras que identificamos como "paloma" a los más pacifistas. El modelo Halcón-Paloma sirve para analizar situaciones de conflicto entre estrategias agresivas y conciliadoras. Este modelo es conocido en la literatura anglosajona como el " hawk-dove " o el " chicken " y en español es conocido también como "gallina".

Dos vehículos se dirigen uno contra otro en la misma línea recta y a gran velocidad. El que frene o se desvíe ha perdido. Pero si ninguno de los dos frena o se desvía...Este sería un modelo halcón paloma

También se ha utilizado este modelo abundantemente para representar una guerra fría entre dos superpotencias. La estrategia Halcón consiste en este caso en proceder a una escalada armamentística y bélica. Si un jugador mantiene la estrategia Halcón y el otro elige la estrategia Paloma, el Halcón gana y la Paloma pierde. Pero la situación peor para ambos es cuando los dos jugadores se aferran a la estrategia Halcón. El resultado puede modelizarse con la siguiente matriz de pagos.

MODELO EL JUEGO DEL GALLINA

Es aquel en el que cada uno de los dos jugadores conduce un vehículo en dirección al del contrario y el primero que se desvía de la trayectoria del choque pierde y es humillado por comportarse como una gallina. El juego se basa en la idea de crear presión hasta que uno de los participantes se echa atrás.

El juego consiste de la siguiente manera:

El que esquiva a su rival o frena pasa la vergüenza es el "gallina". El que acelera gana el respeto y la admiración de los amigos y los observadores que los jalean.

Si ambos aceleran, chocan y mueren.

Si ambos esquivan a su rival, se los considera gallinas (cobardes).

Ejemplo:

Suponga los siguientes puntajes:

Sin daño: 0 Con daño: -5

¿Cómo se darían las posibilidades?

Si ambos ceden, ninguno de los dos queda lesionado, ni física, ni moralmente, por lo tanto la suma es (0,0)

Si cede sólo uno de los dos, el que lo hace queda lesionado moralmente, siendo la suma (0,-5) o (-5,0)

Si ninguno cede, ambos quedan lesionados físicamente, por lo que la suma es (-5,-5)