Prueba Chi-Cuadrado
Solteros: 47 Casados: 71 Divorciados: 35 |
Solteros: 44 Casados: 85 Divorciados: 40 |
Grupos y Números
Imagina que has investigado dos grupos de personas y los colocas en categorías de solteros, casados o divorciados:Los números entre un grupo y otro son definitivamente diferentes, pero ...
- ¿Es solo una casualidad del azar?
- ¿O has encontrado algo interesante?
¡La Prueba Chi-Cuadrado te da un valor "p" para ayudarte a decidir!
Ejemplo: ¿Qué tipo de vacaciones prefieres?
Playa | Crucero | |
Hombres | 209 | 280 |
Mujeres | 225 | 248 |
¿El género influye en el tipo de vacaciones preferidas?
Si el género (hombre o mujer) sí afecta el tipo de vacaciones preferidas, decimos que son dependientes.Al hacer algunos cálculos especiales (explicados más adelante), obtenemos un valor "p":
el valor p es 0.132
Ahora, p <0.05 es el valor habitual para probar dependencia.En este caso, p es mayor que 0.05, por lo que creemos que las variables son independientes (es decir, no están vinculadas entre sí).
En otras palabras, entre hombres y mujeres probablemente no hay una preferencia diferente por vacaciones en la playa o cruceros.
Fueron solo diferencias aleatorias, mismas que se esperan al recopilar datos.
Entendiendo el valor "p"
"p" es la probabilidad de que las variables sean independientes.
Imagina que el ejemplo anterior fue, de hecho, dos muestras aleatorias de hombres en cada ocasión:
Hombres: Playa 209, Crucero 280 |
Hombres: Playa 225, Crucero 248 |
¿Es probable que obtengas resultados tan diferentes al encuestar a hombres en cada ocasión?
Bueno, el valor "p" de 0.132 nos dice que esto realmente podría suceder de vez en cuando.
Las encuestas son aleatorias
después de todo. Esperamos resultados ligeramente diferentes cada vez,
¿verdad?
Por lo tanto, la mayoría de las personas quieren ver un valor p
menor que 0.05 antes de contentarse con decir que los resultados
muestran que los grupos tienen una respuesta diferente.
Veamos otro ejemplo:
Ejemplo: "¿Qué mascota prefieres?"
Gatos | Perros | |
Hombres | 207 | 282 |
Mujeres | 231 | 242 |
Al hacer los cálculos (que se muestran más adelante), obtenemos:
el valor p es 0.043
En este caso p <0.05, entonces este resultado se considera "significativo", lo que significa que creemos que las variables no son independientes.En otras palabras, dado que 0.043 <0.05 creemos que el género está vinculado a la preferencia de mascotas (i.e., hombres y mujeres tienen diferentes preferencias para gatos y perros).
Solo por curiosidad, observa que los números en nuestros dos ejemplos son similares, pero los valores p resultantes son muy diferentes: 0.132 y 0.043. ¡Esto muestra cuán sensible es la prueba!
¿Por qué p<0.05 ?
¡Es solo una elección! Usar p <0.05 es común, pero podríamos haber elegido p <0.01 para estar aún más seguros de que los grupos se comportan de manera diferente, o en realidad cualquier valor.
Calcular el valor p
Entonces, ¿cómo calculamos este valor p? ¡Usamos la Prueba Chi-Cuadrado!
Prueba Chi-Cuadrado
Nota: A esta prueba a veces también se le conoce como Ji-Cuadrado
La letra griega Χ
se conoce en latín como Chi, y en español como Ji.
Por último, también se puede escribir esta prueba como Χ2
- Esta prueba solo funciona para datos categóricos (datos en categorías), como Sexo {Hombres, Mujeres} o color {Rojo, Amarillo, Verde, Azul}, etc., pero no para datos numéricos como altura o peso.
- Los números deben ser lo suficientemente grandes. Cada entrada debe ser 5 o más. En nuestro ejemplo, tenemos valores como 209, 282, etc., así que estamos listos.
Nuestro primer paso es exponer nuestras hipótesis:
Hipótesis: una afirmación que podría ser cierta y que se puede poner a prueba.