Falsos Positivos y Falsos Negativos
El test dice "Sí" ... ¿será cierto?
Cuando tienes una prueba (test) que puede indicar "Sí" o "No" (como una
prueba médica), debes pensar:
- Podría estar equivocada cuando indica "Sí".
- Podría estar equivocada cuando indica "No".
¿Una prueba equivocada?

¡Es como si te dijeran que sí hiciste algo cuando en realidad no
lo hiciste!
O que te digan que no lo hiciste cuando realmente sí lo hiciste.
Cada uno de estos errores tiene un nombre especial: "Falso
Positivo" y "Falso Negativo":
|
Cuando
te dicen que lo hiciste |
Cuando
te dicen que no lo hiciste |
Realmente
lo hiciste |
¡Están en lo correcto! |
"Falso Negativo" |
En
realidad no lo hiciste |
"Falso Positivo" |
¡Están en lo correcto! |
Aquí hay algunos ejemplos de "falsos positivos" y "falsos negativos":
- Seguridad aeroportuaria: un "falso positivo" es cuando los
objetos comunes como llaves o monedas se confunden con armas (la
máquina emite un "pitido")
- Control de calidad: un "falso positivo" es cuando un
artículo de buena calidad es rechazado, y un "falso negativo" es
cuando un artículo de mala calidad es aceptado. (Un resultado
"positivo" significa que hay un defecto).
- Software antivirus: un "falso positivo" es cuando se cree
que un archivo normal es un virus
- Evaluación médica: las pruebas de bajo costo que se
realizan a un grupo grande pueden dar muchos falsos positivos
(pueden indicar que alguien tiene una enfermedad cuando no la tiene)
y luego pedirle que se haga pruebas más precisas.
Pero muchas personas no entienden los números verdaderos detrás de "Sí"
o "No", como en este ejemplo:

Ejemplo: ¿alergia o no?
Horacio dice que tiene comezón. Hay una prueba de alergia a los gatos,
pero esta prueba no siempre es certera:
- Para las personas que realmente tienen alergia,
la prueba dice "Sí" el 80% del tiempo
- Para las personas que no tienen alergia, la
prueba dice "Sí" el 10% del tiempo ("falso
positivo")
Aquí está en una tabla:
|
El test
dice "Sí" |
El test
dice "No" |
Tiene
alergia |
80% |
20% "Falso Negativo" |
No tiene
alergia |
10% "Falso Positivo" |
90% |
Pregunta: Si el 1% de la población tiene alergia y la
prueba de Horacio dice "Sí", ¿cuáles son las posibilidades de que
Horacio realmente tenga la alergia?
¿Crees que el 75%? ¿O tal vez el 50%?
Una prueba similar se le dio a los médicos y
la mayoría dijeron que alrededor del 75% ...
... pero estaban muy equivocados!
(Fuente: "Razonamiento Probabilístico en Medicina Clínica:
Problemas y Oportunidades" de David M. Eddy 1982, en el que se basa
este ejemplo)
Hay tres formas diferentes de resolver esto:
- "Imagina 1000 personas",
- "Diagramas de árbol" o
- "Teorema de Bayes",
Usa cualquiera que prefieras. Miremos ahora con detalle cada una:
Intenta imaginar a mil personas
Cuando intentes comprender preguntas como esta, imagina un grupo
grande (digamos 1000) y juega con los números:
- De 1000 personas, solo 10 realmente tienen
alergia (1% de 1000 es 10)
- La prueba es 80% correcta para las personas que tienen alergia,
por lo que obtendrá 8 de esos 10 correctos.
- Pero 990 no tienen alergia, y la prueba dirá
"Sí" al 10% de ellos,
que son 99 personas a las que dice "Sí" erróneamente
(falso positivo)
- Entonces, de 1000 personas, la prueba dice "Sí" a
(8 + 99) = 107 personas
Veamos todo en una tabla:
|
1% son
alérgicos |
El test
dice "Sí" |
El test
dice "No" |
Tiene
alergia |
10 |
8 |
2 |
No tiene
alergia |
990 |
99 |
891 |
|
1000 |
107 |
893 |
Entonces, 107 personas obtienen un "Sí", pero solo 8 de ellos
realmente tienen alergia:
8 / 107 = aproximadamente 7%
Entonces, a pesar de que la prueba de Horacio decía "Sí", apenas es solo
un
7% probable que Horacio tenga una alergia a los gatos.
¿Por qué tan pequeña la probabilidad? Bueno, la alergia es tan rara que
aquellos que realmente la tienen se ven
ampliamente superados por
aquellos con un falso positivo.
Como un diagrama
Dibujar un diagrama de
árbol puede ser de mucha ayuda:

Antes que nada, verifiquemos que todos los porcentajes suman lo
correcto:
0.8% + 0.2% + 9.9% + 89.1% = 100% (¡bien!)
Y las dos respuestas "Sí" se suman 0.8% + 9.9% = 10.7%, pero
solo 0.8% son correctas.
0.8/10.7 = 7% (misma respuesta anterior)
Teorema de Bayes
Teorema de Bayes tiene una fórmula
especial para este tipo de cosas:
P(A|B) = P(A)P(B|A)
P(A)P(B|A) + P(no A)P(B|no A)
donde:
- P significa "Probabilidad de"
- | significa "dado que"
- A en este caso es "en realidad tiene alergia"
- B en este caso es "la prueba dice Sí"
Por lo tanto:
P(A|B) significa "La probabilidad de que Horacio realmente
tenga la alergia dado que la prueba dice Sí"
P(B|A) significa "La probabilidad de que la prueba indique
Sí, dado que Horacio en realidad tiene alergia"
Para ser más claros, cambiemos A por tiene (en
realidad tiene alergia) y B por Sí (la prueba dice
que sí):
P(tiene|Sí) = P(tiene)P(Sí|tiene)
P(tiene)P(Sí|tiene) + P(no tiene)P(Sí|no tiene)
Sustituyamos los valores:
P(tiene|Sí) = 0.01×0.8
0.01×0.8 + 0.99×0.1
= 0.0748...
Que es aproximadamente el 7%
Obtén más información sobre esto en Teorema
de Bayes.
Un último ejemplo
Ejemplo extremo: un virus informático

Un virus informático se propaga por todo el mundo, todos reportando
e informando a una computadora principal.
Los buenos capturan la computadora principal y descubren que un
millón de computadoras han sido infectadas (pero no saben cuáles).
¡Los gobiernos deciden tomar medidas!
Nadie puede usar Internet hasta que su computadora pase la prueba
"libre de virus". La prueba es 99% precisa (bastante buena,
¿verdad?) Pero el 1% de las veces dice que tiene el virus cuando no
lo tiene (un "falso positivo").
Ahora supongamos que hay 1000 millones de usuarios
de Internet.
- De 1 millón con el virus, el 99% de ellos
están prohibidos correctamente = aproximadamente 1 millón
- Pero los falsos positivos son 999 millones x 1% =
aproximadamente 10 millones
Entonces, se prohibió un total de 11 millones,
pero solo 1 de esos 11 en realidad tiene el virus.
Entonces, si te bloquearan el Internet, ¡solo habría un 9% de
posibilidades de que tengas el virus!
Conclusión
Al tratar con falsos positivos y falsos negativos (u otras preguntas
de probabilidad difíciles) podemos usar estos métodos:
- "Imaginar 1000 personas"
- "Diagramas de árbol" o
- "Teorema de Bayes"
¡Refuerza tu aprendizaje resolviendo los siguientes retos sobre este
tema! (Nota: están en inglés).