Distribución Binomial

"Bi" significa "dos" (como una bicicleta tiene dos ruedas) ...
... así que este tema se trata de cosas con dos resultados.

bicicleta
   

cara y cruz en una moneda de dólar

Lanzar una Moneda:

Y decimos que la probabilidad de que caiga C es ½
Y la probabilidad de que caiga S es ½

dado

Lanzar un Dado:

Decimos que la probabilidad de un cuatro es 1/6 (una de las seis caras es un cuatro)
Y la probabilidad de no cuatro es 5/6 (cinco de las seis caras no son cuatro)

Ten en cuenta que un dado tiene 6 lados, pero aquí vemos solo dos casos: "cuatro: sí" o "cuatro: no"

¡Lancemos una moneda!

Lanza una moneda justa tres veces ... ¿cuál es la posibilidad de obtener dos caras?

Al lanzar una moneda tres veces (C es para cara, S para sello) se pueden obtener cualquiera de estos 8 resultados:

CCC   moneda (cara)moneda (cara)moneda (cara)
CCS   moneda (cara)moneda (cara)moneda (sello)
CSC   moneda (cara)moneda (sello)moneda (cara)
CSS   moneda (cara)moneda (sello)moneda (sello)
SCC   moneda (sello)moneda (cara)moneda (cara)
SCS   moneda (sello)moneda (cara)moneda (sello)
SSC   moneda (sello)moneda (sello)moneda (cara)
SSS   moneda (sello)moneda (sello)moneda (sello)

¿Qué resultados queremos?

"Dos Caras" pueden estar en cualquier orden: "CCS", "SCC" y "CSC" tienen dos caras (y un sello).

Entonces 3 de los resultados tienen "dos caras".

¿Cuál es la probabilidad de cada resultado?

Cada resultado es igualmente probable, y hay 8 de ellos, por lo que cada resultado tiene una probabilidad de 1/8

Así que la probabilidad del evento "Dos Caras" es:

Número de
resultados que queremos
    Probabilidad de
cada resultado
 
3   ×   1/8   =  3/8

Entonces la probabilidad de conseguir Dos Caras es 3/8

Usamos estas palabras especiales:

3 Caras, 2 Caras, 1 Cara, Ninguna

Los cálculos son (P significa "Probabilidad de"):

Podemos escribir esto en términos de una Variable Aleatoria, X, = "El número de Caras de 3 lanzamientos de una moneda":

Y así es como se ve en una Gráfica de Barras:

binomial 1
¡Es simétrica!

Elaborando una fórmula

Ahora imagina que queremos las posibilidades de 5 caras en 9 lanzamientos: ¡enumerar los 512 resultados llevará mucho tiempo!

Entonces hagamos una fórmula.

 

En nuestro ejemplo anterior, ¿cómo podemos obtener los valores 1, 3, 3 y 1?

Triángulo de Pascal

 

Bueno, ¡en realidad están en el Triángulo de Pascal!

 

¿Podemos obtenerlos usando una fórmula?

Claro que podemos, y aquí está:

binomial n en k = n! / k!(n-k)!

  Con frecuencia se le llama "n en k"

Puedes leer más sobre esto último en Combinaciones y Permutaciones.

Pongamos a prueba la fórmula.

Ejemplo: con 3 lanzamientos, ¿cuáles son las probabilidades de 2 Caras?

Tenemos n=3 y k=2:

n!k!(n-k)! =3!2!(3-2)!
=3×2×12×1 × 1
= 3
Entonces hay 3 resultados que tienen "2 Caras"

(Ya lo sabíamos, pero ahora tenemos una fórmula para ello).

Usémosla para una pregunta más difícil:

Ejemplo: con 9 lanzamientos, ¿cuáles son las probabilidades de 5 Caras?

Tenemos n=9 y k=5:

n!k!(n-k)! =9!5!(9-5)!
=9×8×7×6×5×4×3×2×15×4×3×2×1 × 4×3×2×1
=126
Entonces 126 de los resultados tendrán 5 cabezas

 
Y para 9 lanzamientos hay un total de 29 = 512 resultados, por lo que obtenemos la probabilidad:

 

Número de
resultados que queremos
    Probabilidad de
cada resultado
 
126   ×   1/512   =  126/512

Entonces:

P(X=5)  =  126512  = 0.24609375 

Aproximadamente una probabilidad del 25%.

(Más fácil que enumerarlas todas).

Parcialidad/sesgo

Hasta ahora, las probabilidades de éxito o fracaso han sido igualmente probables.

Pero, ¿qué pasa si las monedas están sesgadas (aterrizan más de un lado que del otro) o las opciones no son 50/50.

Ejemplo: Vendes sándwiches. El 70% de las personas elige pollo, el resto elige otra cosa.

¿Cuál es la probabilidad de vender exactamente a 2 de los siguientes 3 clientes sándwiches de pollo?

Esto es como el ejemplo de cara y sello, pero con 70/30 en lugar de 50/50.

Dibujemos un diagrama de árbol:

diagrama de árbol pollo

Los casos donde ocurren "Dos Pollos" están resaltados.

Las probabilidades para "Dos Pollos" resultan ser 0.147, porque estamos multiplicando dos 0.7s y un 0.3 en cada caso. En otras palabras:

0.147 = 0.7 × 0.7 × 0.3

O, usando exponentes:

= 0.72 × 0.31

El 0.7 es la probabilidad de cada opción que queremos, llamémosla p

El 2 es la cantidad de opciones que queremos, llamémosle k

Y tenemos (hasta ahora):

= pk × 0.31

El 0.3 es la probabilidad de la opción opuesta, entonces es: 1−p

El 1 es el número de opciones opuestas, por lo que es: n−k

Lo cual nos da:

= pk(1-p)(n-k)

Donde

Ejemplo: (continuación)

Así que tenemos:

pk(1-p)(n-k) =0.72(1-0.7)(3-2)
=0.72(0.3)(1)
=0.7 × 0.7 × 0.3
=0.147

que es lo que obtuvimos antes, pero ahora usando una fórmula

Ahora sabemos que la probabilidad de cada resultado es 0.147

Pero debemos incluir que hay tres formas en que puede suceder: (pollo, pollo, otro) o (pollo, otro, pollo) o (otro, pollo, pollo)

Ejemplo: (continuación)

El número total de resultados de "dos pollos" es:

n!k!(n-k)! =3!2!(3-2)!
=3×2×12×1 × 1
=3

Y tenemos:

Número de
resultados que queremos
    Probabilidad de
cada resultado
   
3   ×   0.147   =   0.441

 

Entonces, la probabilidad del evento "2 personas de cada 3 eligen pollo" = 0.441

Okay. Eso fue mucho trabajo para algo que ya sabíamos, pero ahora tenemos una fórmula que podemos usar para preguntas más difíciles.

Ejemplo: Sam dice "70% elige pollo, por lo que 7 de los siguientes 10 clientes deberían elegir pollo" ... ¿cuál es la probabilidad de que Sam tenga razón?

Tenemos:

Y obtenemos:

pk(1-p)(n-k) =0.77(1-0.7)(10-7)
=0.77(0.3)(3)
=0.0022235661
Esa es la probabilidad de cada resultado.

 

Y el número total de esos resultados es:
n!k!(n-k)!  =10!7!(10-7)!
=10×9×8×7×6×5×4×3×2×17×6×5×4×3×2×1 × 3×2×1
=10×9×83×2×1
=120

Finalmente:

Número de
resultados que queremos
    Probabilidad de
cada resultado
   
120   ×   0.0022235661   =   0.266827932

 

Entonces, la probabilidad de que 7 de cada 10 elijan pollo es aproximadamente 27%

 

Moraleja de la historia: a pesar de que el promedio a largo plazo es del 70%, no esperes 7 de los próximos 10.

Todo junto

Ahora sabemos cómo calcular cuántos:

n!k!(n-k)!

Y la probabilidad de cada uno:

pk(1-p)(n-k)

Cuando se multiplican juntos obtenemos:

Probabilidad de k de un total de n maneras:

P(k de n) =  n!k!(n-k)! pk(1-p)(n-k)

La Fórmula General de Probabilidad Binomial

Notas importantes:

Quincunce

quincunce

 

Juega con el Quincunce (luego lee Quincunce Explicado) para ver la Distribución Binomial en acción.

Lanza el dado

dado

Se lanza un dado justo cuatro veces. Calcule las probabilidades de obtener:

En este caso n=4, p = P(Dos) = 1/6

X es la variable aleatoria "Número de 2's en cuatro lanzamientos".

Sustituye x = 0 a 4 en la fórmula:

P(k de n) =  n!k!(n-k)! pk(1-p)(n-k)

Así (a 4 decimales):

Resumen: "para los 4 lanzamientos, hay un 48% de probabilidades de que no haya dos, 39% de 1 dos, 12% de 2, 1.5% de 3 y tan solo 0.08% de que todos los lanzamientos sean un dos (¡pero aún podría suceder!)"

Esta vez la Gráfica de Barras no es simétrica:

binomial 0 a 4 asimétrico
¡No es simétrica!

Es asimétrica porque p es diferente de 0.5

 

bicicleta

Bicicletas de montaña

Tu empresa fabrica bicicletas de montaña. El 90% pasa la inspección final (y el 10% falla y debe repararse).

¿Cuáles son los valores esperados para la Media y la Varianza de las siguientes 4 inspecciones?

Primero, calculemos todas las probabilidades.

X es la variable aleatoria "Número de bicicletas que pasan la prueba en las cuatro inspecciones".

Sustituye x = 0 a 4 en la fórmula:

P(k de n) =  n!k!(n-k)! pk(1-p)(n-k)

Así:

Resumen: "para las 4 próximas bicicletas, hay una pequeña probabilidad de 0.01% de que ninguna pase la inspección, 0.36% de probabilidad de 1 pase, 5% de probabilidad de 2 pases, 29% de probabilidad de 3 pases y una enorme probabilidad de 66% de que todas pasen la inspección".

Media, varianza y desviación estándar

Calculemos la Media, Varianza y Desviación Estándar para las inspecciones de bicicletas de montaña.

Hay fórmulas (relativamente) simples para ello. Son un poco difíciles de demostrar, ¡pero funcionan!

La media, o "valor esperado", es:

μ = np

Para las bicicletas de montaña:

μ = 4 × 0.9 = 3.6

Por lo tanto, podemos esperar que 3.6 bicicletas (de 4) pasen la inspección.
Realmente tiene sentido ... 0.9 de probabilidad por cada bicicleta multiplicada por 4 bicicletas es igual a 3.6

La fórmula para la varianza es:

Varianza: σ2 = np(1-p)

Y la desviación estándar es la raíz cuadrada de la varianza:

σ = √[np(1-p)]

Para las bicicletas de montaña:

Varianza: σ2 = 4 × 0.9 × 0.1 = 0.36

La desviación estándar es:

σ = √(0.36) = 0.6

 

Nota: también podríamos calcular todo manualmente, haciendo una tabla como esta:

X P(X) X × P(X) X2 × P(X)
0 0.0001 0 0
1 0.0036 0.0036 0.0036
2 0.0486 0.0972 0.1944
3 0.2916 0.8748 2.6244
4 0.6561 2.6244 10.4976
  SUMA: 3.6 13.32

La media es la Suma de (X × P(X)):

μ = 3.6

La varianza es la Suma de (X2 × P(X)) menos Media2:

Varianza: σ2 = 13.32 − 3.62 = 0.36

La desviación estándar es:

σ = √(0.36) = 0.6

Y obtuvimos los mismos resultados que antes (¡sí!)

 

Resumen


¡Refuerza tu aprendizaje resolviendo los siguientes retos sobre este tema! (Nota: están en inglés).