Valores Atípicos
Los "valores atípicos" son valores que "quedan fuera" de los otros valores.
Cuando recopilamos datos, a veces hay valores que están "muy lejos" del grupo principal de datos ... ¿qué hacemos con ellos?
Ejemplo: Salto de Longitud
Un nuevo entrenador ha estado trabajando con el equipo de Salto de
Longitud durante este mes, y el rendimiento de los atletas ha
cambiado.
Gus ahora puede saltar 0.15m más, Juana y Karla pueden saltar 0.06m
más.
Aquí están todos los resultados:
- Gus: +0.15m
- Tom: +0.11m
- Juana: +0.06m
- Karla: +0.06m
- Bob: + 0.12m
- Sam: -0.56m
Aquí están los resultados en la recta numérica:
La media es:
(0.15+0.11+0.06+0.06+0.12-0.56) / 6 = -0.06 / 6 = -0.01m
Entonces, en promedio, el rendimiento DISMINUYÓ.
El entrenador es obviamente inútil ... ¿verdad?
El resultado de Sam es un "valor atípico" ... ¿y si eliminamos el resultado de Sam?
Ejemplo: Salto de Longitud (continuación)
Probemos los resultados SIN Sam:
Media = (0.15+0.11+0.06+0.06+0.12)/5 = 0.1 m
¡Oye, el trabajo del entrenador parece que los ha hecho mejorar!
¿Pero es eso justo? ¿Podemos deshacernos de los valores que no nos gustan?
¿Qué podemos hacer?
Debes pensar "¿por qué ese valor está ahí?"
Puede ser bastante normal tener valores altos o bajos- Las personas pueden ser bajas o altas
- Algunos días no llueve, otros días puede llover
- Los atletas pueden rendir mejor o peor en diferentes días.
Ejemplo: Salto de Longitud (continuación)
Descubrimos que Sam se sentía enfermo ese día. No es culpa del
entrenador en absoluto.
Por lo tanto, es una buena idea en este caso
eliminar el resultado de Sam.
Y cuando nos deshacemos de ellos, debemos explicar lo que estamos haciendo y porqué.
Media, mediana y moda
Vimos cómo los valores atípicos afectan la media, ¿pero qué hay de la mediana o la moda?
Ejemplo: Salto de Longitud (continuación)
La mediana (valor "medio"):- incluyendo a Sam es: 0.085
- sin Sam es: 0.11 (subió un poco)
- incluyendo a Sam es: 0.06
- sin Sam es: 0.06 (se mantuvo igual)
También se quedaron donde está la mayoría de los datos.
Parece que los valores atípicos tienen el mayor efecto en la media, y
no tanto en la mediana o la moda.
Sugerencia: calcula la mediana y la moda cuando tengas valores
atípicos.
También puedes calcular la Media
Geométrica y la Media
Armónica.
¡Refuerza tu aprendizaje resolviendo los siguientes retos sobre este tema! (Nota: están en inglés).