lunes, 12 de febrero de 2018

Modelo matemático elemental sobre la estrategia de desarme nuclear.

Supongamos, como en los casos anteriores, el modelo de juego bipersonal de suma no nula no cooperativo, en el que ambos jugadores son potencias nucleares.

(A) Análisis y ordenación de las estrategias puras.



Supondremos, por simplicidad, simetría perfecta en el análisis y ordenación de las estrategias puras de cada jugador, con lo que bastará analizar y ordenar las de uno de ellos para, por analogía, analizar y ordenar las del otro.

Consideremos al jugador 1. Es razonable suponer (por razones de prioridad defensiva y poder disuasorio militar) que la estrategia de no desarme prevalece o domina sobre la de desarme y que, independientemente del desarme o no del otro jugador, es preferible siempre el no desarme propio al desarme. La ordenación de pares de estrategias de ambos jugadores quedaría, pues para el primer jugador, cuyas estrategias puras son las del conjunto binario ¬d,d (las correspondientes del jugador 2 se denotan por los elementos del conjunto binario ¬d',d'):

¬d,d'2¬d,¬d'1d,d'0d,¬d'-1


Para el jugador 2, quedarán:

¬d',d2¬d',¬d1d',d0d',¬d-1


La bimatriz de pagos será la siguiente:

d¬d0,0-1,22,-11,1d'      ¬d'


(B) Cálculo del par de estrategias mixtas de equilibrio del juego.



Puesto que las matrices de pago de cada jugador son, respectivamente

A=0-121,B=02-11


si denotamos x0=x0,1-x0, y0=y0,1-y0 los pares de estrategias mixtas de equilibro para, respectivamente, el jugador 1 y el jugador 2, se tiene el sistema de inecuaciones:

x0 1-x00-121y01-y0x 1-x0-121y01-y0, x0,1


y

x0 1-x002-11y01-y0x0 1-x002-11y1-y, y0,1


Operando matricialmente y simplificando, nos quedaría el sistema:

x0x,x0,1y0y,y0,1


Luego el par de estrategias mixtas de equilibrio será:

x0,y0=x0,1-x0,y0,1-y0=0,1,0,1


El cual corresponde al par de estrategias puras (una para cada jugador): ¬d,¬d'.

Del simple análisis de la bimatriz de pagos, esto era de esperar.

viernes, 19 de mayo de 2017

Solución general del juego matricial 2x2

Juegos matriciales 2×2 de suma cero.



Como los únicos juegos que vamos a emplear son los matriciales 2×2, procederemos a demostrar el siguiente teorema trivial:

TEOREMA.- Sea el juego matricial de suma cero

A=a11a12a21a22


Si no tiene punto de silla, entonces sus únicas estrategias óptimas y valor del juego vienen dados por:

x=JA*JA*JTy=A*JTJA*JTv=|A|JA*JT


Donde A* es la matriz adjunta¹ de A; A es el determinante de A; J=11 es una matriz 1×2, y JT=11 es la matriz traspuesta de J.

Demostración.-

Como el juego carece de punto de silla, las estrategias óptimas x=x1x2,y=y1y2 tienen componentes positivas. Si el valor del juego es v, se tiene que

a11x1y1+a12x1y2+a21x2y1+a22x2y2=v


ó

x1a11y1+a12y2+x2a21y1+a22y2=v


Los términos entre paréntesis del miembro izquierdo de la anterior igualdad son ambos menores o iguales que v, porque y es por hipótesis una estrategia óptima. Supongamos que uno de ellos es menor que v:

a11y1+a12y2<va21y1+a22y2v


Como x es una estrategia mixta óptima, se cumple que x1,x2>0;x1+x2=1; luego el miembro izquierdo de la igualdad citada debe ser estrictamente menor que v. En consecuencia, ambos términos en el paréntesis de dicha igualdad son iguales a v:

a11y1+a12y2=va21y1+a22y2=v


De forma similar, se puede demostrar que:

a11x1+a21x2=va12x1+a22x2=v


Puesto es forma matricial, nos queda:

AyT=vvxA=vv


Estas ecuaciones, junto con las dos siguientes:

x1+x2=1y1+y2=1


nos permiten resolver el sistema para x,y,v.

Si A es no singular (tiene determinante no nulo), entonces

x=vJA-1


Como xJT=1 (suma de las componentes de x), se tiene que

1=xJT=vJA-1JT


o bien

v=1JA-1JT


y

x=JA-1JA-1JT


De manera similar, se obtiene:

y=A-1JTJA-1JT


Si A es singular, se demuestra fácilmente que

x=JA*JA*JTy=A*JTJA*JT


son estrategias óptimas. También se tiene que

v=AJA*JT


sea A singular o no. Q.E.D.

EJEMPLOS.-

1. El juego cuya matriz de pagos (o utilidades) es

1001


carece de punto de silla, pues máxi mínj aij=01=mínj máxi aij. Sin embargo,

x=11100111100111=1212y=10011111100111=1212v=12


como es sencillo calcular.

2. El juego matricial

10-12


carece de punto de silla, pues maxi minj aij=01=minj maxi aij.

Siendo la matriz adjunta de A:

A*=2011


y A=2, JA*=31;A*JT=22, JA*JT=4, se tiene que:
x=3414y=1212v=12


son los pares de estrategias mixtas óptimas y el valor del juego, respectivamente.

________________________________________________

¹ Sea

A=aiji=1,,nj=1,n una matriz cuadrada de orden n sobre un cuerpo K.
Se llama menor complementario de un elemento ai0j0 de la matriz A al determinante de la matriz que se obtiene suprimiendo la fila i0 y la columna j0 de la matriz A, sin alterar el orden de las restantes.
Al menor complementario del elemento ai0j0 de la matriz A, lo denotaremos por αi0j0.

Se llama adjunto de un elemento ai0j0 de la matriz A, al producto:

Ai0j0=-1i0+j0αi0j0


A la matriz A*=Aiji,j=1,,n se le llama matriz adjunta de la matriz A.

Se demuestra en Álgebra Lineal que para toda matriz A=aijMnK, se cumple:

detA=A=ai1Ai1++ainAin;i=1,2,,n


domingo, 30 de abril de 2017

Análisis matemático de una situación de conflicto (V)

El Dilema del Prisionero.



Dos hombres se encuentran en prisión, cumpliendo sentencia por delitos previos, y en celdas separadas e incomunicadas.
Se sospecha que, además, los dos hombres fueron autores de otro delito sin esclarecer, aunque no hay evidencias suficientes para condenarlos.
El juez correspondiente, habla por separado con cada recluso, dándole la oportunidad de confesar y ofrecer evidencias sobre la participación del otro.
Se le promete a cada uno que, si confiesa y el otro no confiesa, el que confiese tendrá un año de reducción de su actual condena, y el otro recluso que no confiesa un incremento de su condena en 9 años.
Si ambos confiesan, cada uno tendrá 4 años más de condena y, sin ninguno confiesa, ambos tendrán un año más de condena.

La bimatriz de pagos del juego será, en virtud de lo antexpuesto, la siguiente:

C2¬C2C1-4,-41,-9¬C1-9,1-1,-1


Donde Ci,i=1,2 son las estrategias puras de confesar de cada jugador, y ¬Ci,i=1,2 las correspondientes de no confesar de cada jugador.

La estrategia pura C1 domina a la ¬C1, claramente, pues se satisface la siguiente relación entre (de orden producto) entre los vectores de pagos correspondientes a cada estrategia: -4,1-9,-1.
A su vez, la estrategia pura C2 domina a la ¬C2, pues -4,1-9,-1.

Luego desde el punto de vista de la racionalidad individual, ambos jugadores deberían confesar. Por lo tanto, C1,C2 es el único punto de equilibrio.
En efecto. Como debe verificarse

x0 1-x0-41-9-1y01-y0x 1-x-41-9-1y01-y0,x0,1


y

x0 1-x0-4-91-1y01-y0x0 1-x0-4-91-1y1-y,y0,1


Entonces:

x02-3y0x2-3y0,x0,1y02-3x0y2-3x0,y0,1


Y si y023,x023, entonces:

x0x,x0,1y0y,y0,1


En consecuencia: x0=1,y0=1.

Sin embargo, desde el punto de vista de la racionalidad colectiva, -1,-1-4,-4; es decir, el vector de pagos correspondiente al par de estrategias puras ¬C1,¬C2 es preferido al vector de pago del par de estrategias puras C1,C2. Pero como cada jugador desconoce lo que el otro va a hacer, e incluso si se lo hubiera comunicado podría engañarle, el dilema radica en si ambos jugadores han de conducirse por racionalidad individual o colectiva. Es evidente que si los dos se ponen de acuerdo (comunicándose de alguna manera) sobre no confesar, y cada uno respeta su compromiso, ambos quedan más favorecidos que aplicando el par de estrategias de equilibrio (los dos confiesan).

Por las razones indicadas, el papel de los equilibrios de Nash en la teoría de juegos de suma no nula no cooperativos, es controvertido.

sábado, 15 de abril de 2017

Análisis matemático de una situación de conflicto (IV)

Conflicto Banda Terrorista (BT)-Gobierno(G).



Nos restringiremos ahora al caso de terrorismo político, no yihadista.
La prolongada duración de este tipo de conflictos es consecuencia de que ambos jugadores se encuentran en un par de estrategias puras de equilibrio, en las condiciones correspondientes. Analizaremos este conflicto en el restringido caso del juego bipersonal de suma no nula no cooperativo, y con el conocimiento de que la resolución óptima del mismo debe hacer uso de la teoría de los juegos de suma no nula cooperativos (y extensiones de la misma), como sucede al final de los casos prácticos, que se materializan en determinadas "concesiones menores" a la BT, producto de "negociaciones".

Los jugadores son dos: Gobierno (Jugador 1) y Banda Terrorista (Jugador 2), con los espacios de estrategias puras, respectivamente: X1=c,¬c,X2=d,¬d, donde c y ¬c son, respectivamente, las estrategias puras del Gobierno "Cede a las pretensiones de la BT" y "No cede a las pretensiones de la BT". De la misma forma, las estrategias puras de la BT son d y ¬d: "La BT se desarma", "La BT no se desarma".

Ordenación de los pares de estrategias puras.



Gobierno. Para el Gobierno, obviamente, la estrategia de no ceder es la dominante. Es obvio, además, que se prefiere, no cediendo, que la BT se dasarmase a que no se desarme. Considerando la cesión, es evidente que se prefiere el desarme al no desarme. Por lo tanto, los pares de estrategias puras quedan de esta forma ordenados (y definida la función de pago o utilidad reportada) para el Gobierno:

¬c,d3¬c,¬d2c,d1c,¬d0


Banda Terrorista. Es evidente que la pretensión de una BT es que el Gobierno ceda, dominando esta estrategia para ella. Dentro de la misma, se prefiere, por razones obvias, el no desarme al desarme. En cuanto a la posibilidad de que no ceda el Gobierno, claramente impera el no desarme sobre el desarme. En consecuencia, la ordenación (y asignación de pagos) de los pares de estrategias puras, queda para la BT, así:

c,¬d3c,d2¬c,¬d1¬c,d0


Con los datos anteriores podemos construir la bimatriz de pagos:

Gc¬c1,20,33,02,1d      ¬dBT


Cálculo de pares de estrategias mixtas de equilibrio.



Denominemos al par citado en el título x0,1-x0,y0,1-y0, donde el par x0,1-x0 significa que el jugador Gobierno elige c con probabilidad x0 y ¬c con probabilidad 1-x0. De análoga forma, el jugador BT elige d con probabilidad y0 y ¬d con probabilidad 1-y0.

Se tiene que cumplir que:

x0 1-x01032y01-y0x 1-x1032y01-y0, x0,1


y

x0 1-x02301y01-y0x0 1-x02301y1-y, y0,1


De donde

y0-2x0+2y0-2x+2x0,12x0-y0+12x0-y+1y0,1


Es decir:

-x0-xx0,1-y0-yy0,1


Luego:

x0xx0,1y0yy0,1


Es decir: x0=0,y0=0.
Por lo tanto, el par de estrategias mixtas de equilibrio es x0,y0=0,1,0,1, que coincide con el par de estrategias puras ¬c,¬d.

lunes, 3 de abril de 2017

Análisis matemático de una situación de conflicto (III)

Análisis matemático del origen de la Guerra Civil española (1936-1939).





Frente Popular.

El objetivo del FP era la transformación social mediante la Revolución de la "clase proletaria" española, constituida en vanguardia revolucionaria. Pero para ello había que suprimir (como en la Revolución Bolchevique) a los elementos "reaccionarios", "contrarrevolucionarios": principalmente el clero y la burguesía.
En consecuencia, la eliminación o exterminio de estos grupos sociales era prioritaria. Así, pues, la estrategia de eliminación (m) domina a la contradictoria (¬m), para el FP.
Obviamente, el FP prefería la no rebelión (¬r) del BN a su rebelión (r), porque la rebelión suponía lucha y desgaste para el FP. Luego tanto en su estrategia m como en la ¬m, el FP prefiere ¬r.
Por lo tanto, la ordenación de pares de estrategias puras para el FP quedaría de la siguiente forma, según la relación de preferencia estricta :

¬r,mr,m¬r,¬mr,¬m


Bando Nacional.

En el BN se intuía que m (en correspondencia con lo acontecido en la Revolución Bolchevique) era la estrategia preferida del FP. Franco se mantenía fiel a la República hasta el último momento, y el par ¬r,¬m era claramente dominante. Pero puesto que m era muy probable, aun cuando se produjera ¬m (con baja probabilidad), Franco no se podía arriesgar a encontrarse en el par ¬r,m, que para él era el menos dominante.
En consecuencia, como segunda y tercera elección quedaban los pares r,¬m y r,m.

Consideraciones estratégicas respecto a la posibilidad del par  r,m, aconsejaban a Franco preferir  r,¬m a  r,m porque, en todo caso, al menos habría una respuesta defensiva en previsión de que el FP eligiese (como era muy probable por los antecedentes republicanos y el modelo bolchevique) a m.

Por lo tanto, la ordenación de pares de estrategias puras, para Franco, quedaba como sigue:

¬r,¬mr,¬mr,m¬r,m


Asignando ahora valores numéricos (pagos parciales) a cada par de estrategias, de tal forma que sean compatibles con las ordenaciones de las mismas, se tiene:

Franco (jugador 1):

¬r,¬m2r,¬m1r,m0¬r,m-1


Frente Popular (jugador 2).

¬r,m2r,m1¬r,¬m0r,¬m-1


De aquí podemos obtener la bimatriz de pago (que incluye las correspondientes matrices de pago para cada jugador).

r¬r0,11,-1-1,22,0m      ¬m


Cálculo del par de estrategias (puras o mixtas) de equilibrio del juego.



Denominemos al par citado en el título x0,1-x0,y0,1-y0, donde el par x0,1-x0 significa que el jugador Franco elige r con probabilidad x0 y ¬r con probabilidad 1-x0. De análoga forma, el jugador FP elige m con probabilidad y0 y ¬m con probabilidad 1-y0.

Se tiene que cumplir que:

x0 1-x001-12y01-y0x 1-x01-12y01-y0, x0,1


y

x0 1-x001-12y01-y0x0 1-x001-12y1-y, y0,1


De donde

x02y0-1x2y0-1,x0,1y0y,y0,1


Es decir, si y012:

x0x,x0,1y0y,y0,1


Luego :

x0=1y0=1



Por lo tanto, el par de estrategias mixtas de equilibrio es x0,y0=1,0,1,0, que coincide con el par de estrategias puras r,m.

CONCLUSIÓN.- En función de los acontecimientos históricos precedentes y de la información que ambos jugadores poseían, el Alzamiento y la consiguiente extensión de la Guerra Civil constituían un punto de equilibrio matemático casi ineludible.
La Guerra Civil española, desde el punto de vista del análisis matemático realizado, no fue sino una consecuencia de la optimización racional de decisores en una situación de conflicto, en el devenir histórico humano.

miércoles, 29 de marzo de 2017

Análisis matemático de una situación de conflicto (II)

Juegos bipersonales de suma no nula no cooperativos.



Sean 1 y 2 dos jugadores cuyos conjuntos de estrategias puras son, respectivamente:

A=α1,,αn,B=β1,,βm


Si 1 escoge αi y 2 escoge βj, se obtiene el resultado aij,bij, siendo aij la utilidad reportada para el jugador 1 y bij la utilidad reportada para el jugador 2, con aijbij, en general.

Las estrategias mixtas¹ de 1 se denotan por x=x1,,xn, y las de 2 por y=y1,,ym, siendo i=1nxi=1,xi0; j=1myj=1,yj0.

M1x,y,M2x,y son, respectivamente, las utilidades reportadas a 1 y 2, si cada uno de ellos emplean sus estategias mixtas x,y, respectivamente. Las funciones M1,M2 se obtienen de la bimatriz aij,bij1in1jm, tomando esperanzas matemáticas:

M1x,y=xAytM2x,y=xByt


siendo x=x1,,xn un vector fila n-dimensional (matriz 1×n), y

xt=x1xn


el respectivo vector columna n-dimensional (matriz n×1). Análogamente respecto de y.

DEFINICIÓN.- Un par de estrategias mixtas x0,y0 (donde los superíndices no son exponentes) se dicen de equilibrio, si se cumple:

M1x0,y0M1x,y0xXM2x0,y0M2x0,yyY


Entonces se verifica el siguiente importante (e histórico)

TEOREMA (John Nash).- Sean A=aij1in1jm,B=bij1in1jm dos matrices de pago para los jugadores 1 y 2, respectivamente, en un juego de suma no nula no cooperativo. Entonces existen estrategias mixtas

x0=x10,,xn0,y0=y10,,ym0


que verifican:

M1x0,y0M1x,y0xXM2x0,y0M2x0,yyY


Siendo X,Y los conjuntos de estrategias mixtas de 1,2, respectivamente.

_____________________________________________________________

¹ Una estrategia mixta x1,,xn para el jugador 1 significa que el jugador 1 elige su estrategia pura αi con probabilidad xi 1in. Y de forma análoga para el jugador 2.

domingo, 19 de marzo de 2017

Análisis matemático de una situación de conflicto (I)

La Teoría de los Juegos es la rama de la Matemática Aplicada adecuada para trazar modelos matemáticos de situaciones de conflicto reales: guerras convencionales, conflictos terroristas, control de armas nucleares, etc.
Primero vamos a esbozar una breve introducción (muy restringida y resumida, sin pretensiones de completitud) de la Teoría de Juegos, y luego analizaremos algunos ejemplos históricos.

DEFINICIÓN 1.- Un juego bipersonal en forma normal es una estructura formada por dos conjuntos no vacíos: X1,X2, llamados, respectivamente, espacios de estrategias puras de los jugadores 1,2 o J1,J2, y dos funciones reales (acotadas): M1,M2, definidas ambas sobre el conjunto producto cartesiano X1×X2, que representan el pago a cada uno de los jugadores.

Si J1 elige la estrategia pura x1X1 y J2 elige la estrategia pura x2X2, entonces J1 recibe el pago M1x1,x2 y J2 recibe el pago M2x1,x2.
Si M1x1,x2=-M2x1,x2, entonces el juego es de suma nula o cero.

Sea una representación G=X,Y;M1,M2 para un juego bipersonal, donde X,Y son los espacios de estrategias puras de los jugadores, respectivamente, J1,J2, y M1,M2:X×Y las funciones de pago a cada uno de los jugadores. Cuando el juego es bipersonal de suma cero, se representa mediante la terna G=X,Y;M, siendo M la función de pago a J1 y -M la función de pago a J2.

Entonces se tiene el siguiente

TEOREMA 1.- Si la función de pago de G posee un punto de silla¹, entonces G está determinado estrictamente, y el valor del juego es VG=Mx0,y0, siendo x0 una estrategia óptima de J1 y y0 una estrategia óptima de J2.

Por simplicidad, nos restringiremos a juegos matriciales finitos bipersonales, es decir, juegos en los que los conjuntos de estrategias puras X,Y verifican: cardX=cardY=2.

En forma matricial, el juego G=(X,Y;M) se representa así:

x1x2m11m12m21m22y1    y2


donde mij=Mxi,yj.

EJEMPLO.- El juego matricial:

x1x21201y1 y2


tiene, como es sencillo comprobar, el punto de silla x1,y1, y el valor del juego es 1. En efecto, eligiendo el primer jugador la estrategia pura x1 se asegura un pago de, al menos, 1; mientras que si eligiese x2, no podría asegurar más que 0, pues el segundo jugador elegirá, según la estrategia presumiblemente elegida por el primero, aquella de las del segundo que haga mínimo el pago al primero. Por lo tanto, el par de estrategias puras x1,y1 es un punto de silla (punto de equilibrio) del juego bipersonal, dado que ninguno de los jugadores mejora su pago (pérdida, en el caso del segundo jugador) eligiendo otro par de estrategias puras.

Como es fácil demostrar, para que exista en un juego bipersonal (matricial) de suma nula un punto de silla, es necesario y suficiente que se verifique la igualdad:

mi0j0= mín jmáxi mij=máxi mínj mij


Sin embargo, el luego matricial:

x1x21001y1 y2


no posee un punto de silla, y por lo tanto no admite un par de estrategias puras de equilibrio. Ha de ser resuelto en estrategias mixtas, como después veremos, aleatorizando los conjuntos de estrategias puras.

CASO HISTÓRICO.- En el curso de la II Guerra Mundial (O.G. Haywood. Military Decisions and Game Theory), en febrero de 1943, el general G.C. Kenney, comandante en jefe de las fuerzas aliadas en el sudoeste del pacífico, se enfrentaba con un problema. Los japoneses iban a reforzar su ejército en Nueva Guinea y tenía una elección entre dos itinerarios alternativos. Podrían zarpar, bien al norte de Nueva Bretaña, donde el tiempo era lluvioso, o al sur de Nueva Bretaña, donde el tiempo era generalmente bueno. En cualquier caso, el viaje supondría tres días. El general Kenney tenía que decidir dónde concentrar el grueso de su fuerza aérea de reconocimiento. Los japoneses querían que sus barcos estuviesen lo menos expuestos posible a los bombardeos del enemigo y, por supuesto, el general Kenney pretendía lo contrario. En la siguiente figura se representa el juego en forma normal que modeliza esta situación militar; los datos de la matriz representan el número de días supuestos de exposición al bombardeo.

Elección aliadaNorteSur2213Norte SurElección japonesa 


Obsérvese que, para los aliados, la estrategia "Norte" dominaba sobre la "Sur", dado que se aseguraban 2 días de bombardeos sobre el enemigo japonés. Pero también dicha estrategia dominaba para los japoneses, dado que si elegían la "Sur", podrían estar expuestos a 3 días de bombardeo caso de que los aliados, en consecuencia, escogieran la "Sur", puesto que estos pretendendían maximizar el número de días de bombardeo, mientras que los japoneses deseaban minimizarlo.
En consecuencia, el par de estrategias puras Norte,Norte es la solución de equilibrio del juego.

_____________________________________________________

¹Es decir, un x0,y0X×Y, tal que xXyYMx,y0Mx0,y0Mx0,y.