Valor Esperado (EV)

Se dice que en poker las decisiones correctas son las que maximizan el valor esperado de las jugadas. ¿Qué es esto?

En cada ocasión que tomamos una decisión las probabilidades de los diferentes sucesos, y las ganancias y pérdidas asociadas a cada suceso determinan un resultado esperado.
Las decisiones que tomamos en una mesa de poker deberían estar asociadas a maximizar las ganancias y a minimizar las pérdidas.

 

Cuando nos encontramos en un momento determinado de una mano de poker, siempre tenemos diferentes posibilidades. Una de esas posibilidades es botar la mano, tirar nuestras cartas y cortar la mano en ese momento.
Si está claro el concepto que la decisión debe ser evaluada en el momento en que se toma, y que todo lo anterior se resume en lo que hay en bote, y que el dinero que en el pasado hemos puesto en el bote ya no es nuestro sino del bote, es claro que un fold siempre implica un valor esperado CERO.

Siempre que foldeamos una mano, implica que no podremos ganar ni perder absolutamente nada de ahí en más.
Por lo tanto, si el fold tiene valor esperado (expected value o EV en inglés) simplemente tendremos que buscar situaciones de EV positivo como alternativas superadoras del fold. Si encontramos situaciones de EV+ (valor esperado positivo) las jugaremos, puesto que sabemos que es mejor que el fold, y si no las encontramos y sólo encontramos situaciones de valor esperado negativo, simplemente foldeamos puesto que es mejor.
Por lo tanto nuestro juego se reduce a buscar situaciones EV+, y en caso de encontrar más de una situación EV+ elegir la que sea mayor.

Parece simple, pero no lo es tanto.

Definiendo el EV

El valor esperado, o esperanza matemática, es un término utilizado en estadísticas que tiene que ver una medida que permite resumir los diversos resultados de un evento aleatorio y ponderar los mismos por su probabilidad de ocurrencia.
No se pretende aquí hacer una definición académica, y se intentará simplificar los conceptos a fin de centrar la atención en lo que nos compete como jugadores de poker. Puristas de la formalidad académica de las estadísticas sabrán disculpar las simplificaciones.

Con un ejemplo se observa mejor.

Se nos ofrece ingresar en el siguiente juego. Tendreos derecho a tirar una moneda. En caso que el resultado de esa tirada sea “cara” se nos pagará $1.00, en caso de que el resultado de esa tirada sea “cruz” deberemos pagar un nosotros $1.00
Tirar una moneda perfecta, es un “evento aleatorio”, puede salir cara, o puede salir cruz, y no tenemos forma de preveer lo que sucederá. Intuitivamente sabemos que el resultado puede ser una ganancia o una pérdida.

Visto así, o ganamos o perdemos. Si pensamos en este ejemplo al cabo de muchísimas tiradas, pensamos que no tiene demasiado sentido porque si la moneda es perfecta “esperamos” ganar la misma cantidad de veces que “esperamos” perder.
Esto no necesarimente sucederá de esta forma. Podeomos tirar la moneda 10 veces y obtener 5 resultados positivos y 5 negativos, y obtendremos un resultado neutro, pero podría darse que salgan 6 positivos, y 4 negativos y ganemos dinero, o podría suceder que salgan 4 positivos y 6 negativos y perdamos dinero. Incluso podría suceder que salgan 10 positivos o 10 negativos. Cosa que también intuímos poco probable, pero posible al fin y al cabo.

¿Pero que sucede cuando tiramos la moneda 1000 veces en lugar de 10?

De hecho esa probabilidad se puede calcular, y obtener 400 resultados negativos o menos tiene probabilidad inferior a 1 por cada siete mil millónes de veces.
Supongamos que para 1000 intentos se obtengan 510 positivos y 490 negativos. Obtendríamos una ganacia, y si se obtienen 490 positivos y 510 negativos una pérdida.
La probabilidad de obtener tan sólo 490 positivos es del 27% aproximadamente, y lo mismo sucede para un desvió de positivos en más.

Cuando en lugar de probar con 1000 intentos probamos con 1.000.000 de intentos, vemos que la probabilidad de tener 499.000 positivos o menos es de tan solo 2.2% y la de tener 501.000 o menos es de 97.7%. Esto implica que la probabilidad de que los resultados se ubiquen entre 501.000 y 499.000 positivos es de más del 95%.

Este es un resultado tremendamente importante. 1000 en 1.000.000 de veces es 1 entre 1000.
Con muchos eventos, sabemos que el 95% de las veces tendremos un desvío de menos de 1 en 1000. Un dato crucial.
A estas alturas, el lector podrá imaginar el punto de llegada. Las probabilidades sólo son importantes cuando los eventos se repiten suficientes veces. Sólo en este caso los valores reales observados “tienden” hacia los valores esperados.

Eso mismo es lo que sucede con el poker on-line. El poker on line nos permite (a diferencia del juego en vivo) jugar miles de manos por hora, decenas o cientos de miles de manos al mes, y muchos millones de manos en la vida de un jugador. Y precisamente eso es lo que debemos aprovechar.

Usar los conceptos estadísticos en poker funciona si y sólo si jugamos muchas manos.

Intuitivamente se decía antes que el experimento de la moneda daba rendimiento nulo. Uno no espera ni ganar ni perder. Simplemente si hubiera algún desvío del valor esperado podrían aparecer ganancias o pérdidas.
Podemos hacer una formulación matemática del evento de la moneda, de la siguietne forma:

Valor Esperado = Probabilidad de Cara x Ganancia si sale Cara – Probabilidad de Cruz x Pérdida si Cruz
Valor Esperado = 0.50 x 1 + 0.50 x (-1) = 0

Esta es la idea que tenemos que generalizar para determinar el valor esperado de un evento aleatorio. En el caso de la moneda hay sólo dos resultados posibles, o cara o cruz, pero en otro tipo de eventos pueden haber más resultados posibles, y cada uno de esos resultados tiene asociada una probabilidad y una “ganancia o pérdida” (genéricamente tiene un resultado). Si asumimos “n” posibles salidas del evento, tendremos “n” probabilidades asociadas y “n” resultados posibles para cada salida.

En este caso, resultaría:

EV=p(1).R(1)+p(2).R(2)+p(3).R(3)+⋯+p(n-1).R(n-1)+p(n).R(n)

Para cada uno de las salidas desde “1” hasta “n”, multiplicamos la probabilidad de ocurrencia de ese evento denominada “p(i)” por el resultado de la salida “i” que denominamos “R(i)”

EV= ∑(i) p(i).R(i)

No asustarse que esta expresión significa lo mismo que la de arriba. Para cada valor de “i” entre “1” y “n”, sumamos el producto de la probabilidad y el resultado.

Ejemplo,

Supongamos que se nos ofrece arrojar un dado. Para tener el derecho de arrojarlo, se nos cobrará por cada vez que lo arrojemos, $ 0.50

Se nos pagará en función del número que salga.

Si sale 1 cobramos $ 1.50
Si sale 2 cobramos $ 1.00
Si sale 3 cobramos $ 0.75
Si sale 4 cobramos $ 0.00
Si sale 5 cobramos $ 0.00
Si sale 6 cobramos $ 0.00

¿Deberíamos tomar este juego?

Calculemos el valor esperado,

El valor esperado estará determinado por la ganancia esperada en una tirada menos el costo de la misma.

EV = 1/6 x 1.50 + 1/6 x 1.00 + 1/6 x 0.75 + 3/6 x 0.00 – 0.50

EV = 0.25

Ahora bien, “esperamos ganar” 0.25, pero eso no significa de ninguna forma que “vamos a ganar 0.25”

De hecho los resultados posibles para un evento único son:

  • Si sale 1 Ganamos 1.00 (1.50-0.50)
  • Si sale 2 Ganamos 0.50 (1.00-0.50)
  • Si sale 3 Ganamos 0.25 (0.75-0.50)
  • Si sale 4, 5 o 6 Perdemos 0.50 (0.00-0.50)

Tan solo en el caso en que sale el 3, ganamos 0.25, el resto de los resultados NO COINCIDE con el resultado esperado.
Por lo tanto solo podemos aspirar al resultado esperado si en lugar de jugar este juego 1 vez, lo hacemos muchas veces. Y solo en este caso tiene sentido el Valor Esperado.

Basta de cuestiones matemáticas, pasemos a un ejemplo que tenga que ver con el poker.

Mesa de 6-Max en NL50 ($0.25/$0.50), stacks efectivos de $50
Hero es BB con A A
3 folds, BU sube a 4bb, fold, Hero sube a 12 bb, BU va all in, Hero ??

No hace falta matemáticas para saber que BB va a pagar el all in de BU, simplemente porque tiene la mejor mano posible pre flop, y no puede no ser favorito.

Pero que sucede si en realidad queremos determinar el EV en el momento en que BB decide pagar el all in.

Podrían pasar dos cosas:

Hero gana la mano y su ganancia es 113.50 bb (1.50 de las ciegas, 12bb ya invertidaas, y 100bb del oponente)

Hero pierde sus 88bb

Es importante detenerse en este punto. Todo lo que había ingresado al bote ANTES de la decisión no forma parte de la decisión sino que se considera en cuanto a que pertenece al bote.

Si hero decide jugar fold al all in del rival, su EV de ahí en más es CERO, no importa lo que haya pasado antes.
Por lo tanto, la decisión de Hero es que arriesga 88 ciegas (y por tanto no puede perder más que eso a partir de ese punto de la mano) para llevarse un bote de 113.50

EV = p(a) x 113.50 + p(b) x (-88) =

Dependerá de la mano que tenga el otro jugador, las probabilidades p(a) y p(b) que al ser todos los eventos posibles deben cumplir que p(a)+p(b)=1

Está muy claro que si el otro jugador no tuviera AA, y tienen cualquier otra mano ocurriría que p(a) > p(b) y por lo tanto, transladando a la ecuación previa, resultaría EV>0

Es decir si el otro jugador no tiene AA, el EV es mayor a cero y el fold no es una opción, hay que pagar el all in. Lo que intuitivamente ya sabíamos de antes.

Es interesante analizar el caso donde el otro jugador tiene AA, en ese caso especial, ocurre que p(a)=p(b)=0.50

Ambos jugadores tienen la misma probabilidad de ganar la mano. En realidad esto es una simplificación, lo que ocurre en este caso es que ambos jugadores tienen una probabilidad de 47.83% de empatar la mano, y cada uno de ellos tiene la probabilidad de 2.17% de ganar la mano (con cuatro cartas del mismo palo en la mesa, alguno completa color).

El 50% a que nos referimos no es la probabilidad sino más bien la parte del pozo que le corresponde. Concepto este que se analiza más adelante.

Pero siguiendo con la explicación, en este caso, utilizamos 50% en la ecuación del EV y tenemos:

EV = 0.50 x 113.50 + 0.50 x (-88) = 12.75.

¿Como es que si ambos tienen 50% hero tiene EV+?

Al momento de tomarse la decisión, en el bote hay 113.50 y hero tiene que pagar 88 para jugar por 113.50, es decir que en ese momento su contribución al bote es menor al 50% (lo anteriormente puesto no cuenta para la decisión).

Hero ingresa a un bote con probabilidades de 50%, pero contribuyendo menos que 50%, por lo tanto obtiene una ganancia que se visualiza en el EV+