Avanzado

Prueba Chi-Cuadrado

grupos chi-cuadrado
Solteros: 47   Casados: 71   Divorciados: 35
 
grupos chi-cuadrado
Solteros: 44   Casados: 85   Divorciados: 40

 

Grupos y Números

Imagina que has investigado dos grupos de personas y los colocas en categorías de solteros, casados ​​o divorciados:

 
Los números entre un grupo y otro son definitivamente diferentes, pero ...

¡La Prueba Chi-Cuadrado te da un valor "p" para ayudarte a decidir!




Ejemplo: ¿Qué tipo de vacaciones prefieres?

  Playa Crucero
Hombres 209 280
Mujeres 225 248

¿El género influye en el tipo de vacaciones preferidas?

Si el género (hombre o mujer) sí afecta el tipo de vacaciones preferidas, decimos que son dependientes.

Al hacer algunos cálculos especiales (explicados más adelante), obtenemos un valor "p":

el valor p es 0.132

Ahora, p <0.05 es el valor habitual para probar dependencia.

En este caso, p es mayor que 0.05, por lo que creemos que las variables son independientes (es decir, no están vinculadas entre sí).

En otras palabras, entre hombres y mujeres probablemente no hay una preferencia diferente por vacaciones en la playa o cruceros.

Fueron solo diferencias aleatorias, mismas que se esperan al recopilar datos.

Entendiendo el valor "p"

"p" es la probabilidad de que las variables sean independientes.

Imagina que el ejemplo anterior fue, de hecho, dos muestras aleatorias de hombres en cada ocasión:

grupo 1, chi-cuadrado grupo 2, chi-cuadrado
Hombres:
Playa 209, Crucero 280
Hombres:
Playa 225, Crucero 248

¿Es probable que obtengas resultados tan diferentes al encuestar a hombres en cada ocasión?

Bueno, el valor "p" de 0.132 nos dice que esto realmente podría suceder de vez en cuando.

Las encuestas son aleatorias después de todo. Esperamos resultados ligeramente diferentes cada vez, ¿verdad?

Por lo tanto, la mayoría de las personas quieren ver un valor p menor que 0.05 antes de contentarse con decir que los resultados muestran que los grupos tienen una respuesta diferente.

Veamos otro ejemplo:

Ejemplo: "¿Qué mascota prefieres?"

  Gatos Perros
Hombres 207 282
Mujeres 231 242

Al hacer los cálculos (que se muestran más adelante), obtenemos:

el valor p es 0.043

En este caso p <0.05, entonces este resultado se considera "significativo", lo que significa que creemos que las variables no son independientes.

En otras palabras, dado que 0.043 <0.05 creemos que el género está vinculado a la preferencia de mascotas (i.e., hombres y mujeres tienen diferentes preferencias para gatos y perros).

Solo por curiosidad, observa que los números en nuestros dos ejemplos son similares, pero los valores p resultantes son muy diferentes: 0.132 y 0.043. ¡Esto muestra cuán sensible es la prueba!

¿Por qué p<0.05 ?

¡Es solo una elección! Usar p <0.05 es común, pero podríamos haber elegido p <0.01 para estar aún más seguros de que los grupos se comportan de manera diferente, o en realidad cualquier valor.

Calcular el valor p

Entonces, ¿cómo calculamos este valor p? ¡Usamos la Prueba Chi-Cuadrado!

Prueba Chi-Cuadrado

Nota: A esta prueba a veces también se le conoce como Ji-Cuadrado

La letra griega Χ se conoce en latín como Chi, y en español como Ji.
Por último, también se puede escribir esta prueba como Χ2

Puntos importantes antes de comenzar:

Nuestro primer paso es exponer nuestras hipótesis:

Hipótesis: una afirmación que podría ser cierta y que se puede poner a prueba.

Las dos hipótesis son.

Coloca los datos en una tabla:

  Gatos Perros
Hombres 207 282
Mujeres 231 242

Suma filas y columnas:

  Gatos Perros  
Hombres 207 282 489
Mujeres 231 242 473
  438 524 962

Calcula el "Valor Esperado" para cada entrada:

Multiplica el total de cada fila por el total de cada columna y divide por el total general:

  Gatos Perros  
Hombres 489×438962 489×524962 489
Mujeres 473×438962 473×524962 473
  438 524 962

Lo cual nos da:

  Gatos Perros  
Hombres 222.64 266.36 489
Mujeres 215.36 257.64 473
  438 524 962

Resta lo esperado de lo observado, eleva al cuadrado, luego divide entre el valor esperado:

En otras palabras, usa la fórmula (O−E)2E, donde

  Gatos Perros  
Hombres (207−222.64)2 222.64 (282−266.36)2 266.36 489
Mujeres (231−215.36)2 215.36 (242−257.64)2 257.64 473
  438 524 962

Lo cual nos da:

  Gatos Perros  
Hombres 1.099 0.918 489
Mujeres 1.136 0.949 473
  438 524 962

Ahora suma esos valores calculados:

1.099 + 0.918 + 1.136 + 0.949 = 4.102

Chi-Cuadrado es 4.102

De Chi-Cuadrado a p

Grados de Libertad

Primero necesitamos conocer los "Grados de Libertad"

Grados de Libertad = (filas − 1) × (columnas − 1)

Para nuestro ejemplo tenemos 2 filas y 2 columnas:

GL = (2 − 1)(2 − 1) = 1×1 = 1

valor p

El resto del cálculo es difícil, así que búscalo en una tabla o usa la Calculadora Chi-Cuadrado.

El resultado es:

p = 0.04283

¡Listo!

Fórmula Chi-Cuadrado

Esta es la fórmula para Chi-Cuadrado

Χ2 = Σ(O − E)2E

Así que calculamos (O−E)2E para cada par de valores observados y esperados, y luego sumamos todos.

 

¡Refuerza tu aprendizaje resolviendo los siguientes retos sobre este tema! (Nota: están en inglés).

 
Copyright © 2020 DisfrutaLasMatematicas.com
Math is Fun Website