Teorema de Bayes

¡Bayes es mágico!

¿Alguna vez te preguntaste cómo aprenden las computadoras acerca de las personas?

cintas para calzado

Ejemplo:

Una búsqueda en Internet de "cordones de zapatos automáticos de películas" muestra "Regreso al Futuro"

¿El motor de búsqueda ha visto la película? No, pero conoce muchas otras búsquedas sobre lo que la gente probablemente está buscando.

Y calcula esa probabilidad usando el Teorema de Bayes.

El Teorema de Bayes es una manera de calcular una probabilidad cuando conocemos otras ciertas probabilidades.

La fórmula es:

P(A|B) = P(A) P(B|A)P(B)


Lo cual nos dice:   con qué frecuencia sucede A dado que sucede B, escrito como P(A|B),
Cuando sabemos:   con qué frecuencia sucede B dado que sucede A, escrito como P(B|A)
    qué tan probable es A por sí mismo, lo cual se escribe P(A)
    y qué tan probable es B por sí mismo, lo cual se escribe P(B)

 

Digamos que P(Fuego) significa con qué frecuencia hay fuego, y P(Humo) significa con qué frecuencia vemos humo, entonces:

P (Fuego|Humo) significa con qué frecuencia hay fuego cuando podemos ver humo
P (Humo|Fuego) significa con qué frecuencia podemos ver humo cuando hay fuego

Entonces, la fórmula nos dice las cosas "en un sentido" P(Fuego|Humo) cuando conocemos "el sentido contrario" P(Humo|Fuego)

Ejemplo:
  • los incendios peligrosos son raros (1%)
  • pero el humo es bastante común (10%) debido a la comida al carbón y a la leña,
  • y el 90% de los incendios peligrosos producen humo

Entonces podemos descubrir la probabilidad de Fuego peligroso cuando hay Humo:

P(Fuego|Humo) =P(Fuego) P(Humo|Fuego)P(Humo)
=1% x 90%10%
=9%

Así que vale la pena echar un vistazo a cualquier humo para estar seguros.

picnic

Ejemplo: día de picnic

Estás planeando un picnic hoy, pero la mañana está nublada.
¿Cuál es la probabilidad de lluvia durante el día?

Usaremos Lluvia para indicar lluvia durante el día, y Nubes para indicar mañana nublada.

La posibilidad de que ocurra Lluvia si se da Nubes se escribe P(Lluvia|Nubes)

Pongamos eso en la fórmula:

P(Lluvia|Nubes) = P(Lluvia) P(Nubes|Lluvia)P(Nubes)

P(Lluvia|Nubes) = 0.1 x 0.50.4  = .125

O una probabilidad del 12.5% de lluvia. No está mal, ¡hagamos un picnic!

Solo 4 números

Imagina a 100 personas en una fiesta, y que cuentas cuántos visten de rosa o no, y si son hombres o no, y obtienes estos números:

tabla de bayes

¡El Teorema de Bayes se basa solo en esos 4 números!

Hagamos algunas cuentas:

tabla de bayes con totales

Y calculemos algunas probabilidades:

un perrito destruyendo datos

 

¡Y entonces llega el cachorro! Qué lindo perrito.

 

¡Y ahora todos tus datos están despedazados! Solo sobreviven 3 valores:

¿Puedes hallar P(Hombre|Rosa) ?

Imagina que un invitado que vestía color de rosa olvidó dinero ... ¿fue un hombre? Podemos responder esta pregunta usando el Teorema de Bayes:

P(Hombre|Rosa) = P(Hombre) P(Rosa|Hombre)P(Rosa)

P(Hombre|Rosa) = 0.4 × 0.1250.25 = 0.2

Nota: si todavía tuviéramos los datos sin procesar podríamos calcular directamente 525 = 0.2

Generalizando

¿Por qué funciona?

Reemplacemos los números con letras:

tabla de bayes

Ahora veamos las probabilidades. Y tomemos algunas proporciones:

Y luego multiplicamos así:

 P(A) en una tabla de bayes

 

Ahora hagamos eso de nuevo pero usemos P(B) y P(A|B):

P(B) en una tabla de bayes

 

Ambas formas obtienen el mismo resultado de ss+t+u+v

Así que podemos ver que:

P(B) P(A|B) = P(A) P(B|A)

Agradable y simétrico, ¿no?

En realidad, tiene que ser simétrico, ya que podemos intercambiar filas y columnas y obtener la misma esquina superior izquierda.

Y también es la fórmula de Bayes ... simplemente divide ambos lados por P(B):

P(A|B) = P(A) P(B|A)P(B)

Recordar

Primero piensa "AB AB AB", luego recuerda agruparlo como: "AB  =  A  BA  /  B"

P(A|B) = P(A) P(B|A)P(B)

¿Alergia a los gatos?

Uno de los usos más famosos del Teorema de Bayes es sobre los Falsos Positivos y Falsos Negativos.

Para aquellos que tenemos dos casos posibles para "A", como Pasar/Fallar (o Sí/No, etc.)

Ejemplo: ¿Alergia o no?

Bianca dice que tiene comezón. Hay una prueba de alergia a los gatos, pero esta prueba no siempre es correcta:

Si el 1% de la población tiene alergia y la prueba de Bianca dice "Sí", ¿cuáles son las posibilidades de que Bianca realmente tenga la alergia?

Queremos saber la posibilidad de tener la alergia cuando la prueba dice "Sí", lo cual escribimos como P(Alergia|Sí)

Usemos la fórmula:

P(Alergia|Sí) = P(Alergia) P(Sí|Alergia)P(Sí)

¡Oh no! No sabemos cuál es la probabilidad general de que la prueba diga "Sí" ...

... pero podemos calcularlo sumando los que tienen y los que no tienen alergia:
Sumemos eso:

P(Sí) = 1% × 80% + 99% × 10% = 10.7%

Lo que significa que aproximadamente el 10.7% de la población obtendrá un resultado "Sí".

Entonces ahora podemos completar nuestra fórmula:

P(Alergia|Sí) = 1% × 80%10.7%  = 7.48%

P(Alergia|Sí) = about 7%

Este es el mismo resultado que obtuvimos en Falsos Positivos y Falsos Negativos.

De hecho, podemos escribir una versión especial de la fórmula de Bayes solo para cosas como esta:

P(A|B) = P(A)P(B|A) P(A)P(B|A) + P(no A)P(B|no A)

"A" con tres (o más) casos

Acabamos de ver "A" con dos casos (A y no A), de los cuales nos ocupamos en el resultado final.

Cuando "A" tiene 3 o más casos, los incluimos todos en la línea de fondo:

P(A1|B) = P(A1)P(B|A1) P(A1)P(B|A1) + P(A2)P(B|A2) + P(A3)P(B|A3) + ...etc

galería de arte

Ejemplo: el concurso de arte tiene participación de tres pintores: Pamela, Pedro y Pablo

¿Cuál es la posibilidad de que Pamela gane el primer lugar?

P(Pamela|Primer) =

P(Pamela)P(Primer|Pamela) P(Pamela)P(Primer|Pamela) + P(Pedro)P(Primer|Pedro) + P(Pablo)P(Primer|Pablo)

Pon los valores:

P(Pamela|Primer) =(15/30) × 4% (15/30) × 4% + (5/30) × 6% + (10/30) × 3%

Multiplica todo por 30 (facilita el cálculo):

P(Pamela|Primer) =15 × 4% 15 × 4% + 5 × 6% + 10 × 3%
=0.60.6 + 0.3 + 0.3
=50%
¡Una buena oportunidad!

Pamela no es la artista más exitosa, pero sí participa con muchas pinturas.

Ahora, de vuelta a los motores de búsqueda.

Los motores de búsqueda toman esta idea y la amplían mucho (además de algunos otros trucos).

¡Les hace parecer que pueden leer tu mente!

También se puede usar para filtros de correo, servicios de recomendación de música y más.

 

¡Refuerza tu aprendizaje resolviendo los siguientes retos sobre este tema! (Nota: están en inglés).