2 puntos por GN⁺ 2025-08-24 | Aún no hay comentarios. | Compartir por WhatsApp
  • En las ciencias sociales y de la vida, existe cierto nivel de correlación entre casi todas las variables
  • Este fenómeno no es simple coincidencia ni un error estadístico, sino un hecho real derivado de factores genéticos y ambientales complejamente entrelazados
  • A medida que aumenta el tamaño de la muestra, aparecen correlaciones significativas en la mayoría de los pares de variables, y los investigadores terminan prestando más atención al patrón general de correlaciones que a cada correlación individual
  • El “crud factor” significa que existen pequeñas correlaciones en casi todos los pares de variables, por lo que incluso con una teoría arbitraria y una selección arbitraria de variables es muy probable obtener resultados significativos
  • En esta situación, el significado del nivel de significancia tradicional (0.05) se debilita, lo que exige cautela al interpretar estadísticas en ciencias sociales

Panorama general y contexto

  • En psicología y sociología, está ampliamente aceptada la idea de que “todo está correlacionado con todo hasta cierto punto”
  • Determinadas características están determinadas por diversos factores genéticos y ambientales, y esos factores también presentan correlaciones entre sí
  • Por lo tanto, en la práctica, casi todas las variables medibles tienen algún grado de interrelación

El “Crud Factor” y los hallazgos estadísticos

  • El “crud factor” se refiere al fenómeno por el cual, en investigaciones de ciencias sociales (y en parte de ciencias de la vida), siempre existen pequeñas correlaciones incluso entre pares de variables elegidos al azar
  • En un gran conjunto de datos de 57,000 estudiantes de preparatoria de Minnesota en 1966, se analizaron 105 tablas cruzadas (crosstabulation) entre variables como familia, educación, actividades recreativas, carrera y religión, y todas resultaron estadísticamente significativas
    • El 96% del total descartó la posibilidad de azar con una probabilidad extremadamente baja, al nivel de p<10⁻⁶
  • Al ampliar el número de variables a 45, el 92% de las 990 combinaciones totales resultó estadísticamente significativo
    • La mediana (median) de relaciones significativas entre una variable y todas las demás fue de 41 de 44

Casos reales entre variables

  • También se encontraron altos niveles de significancia estadística en las relaciones entre la puntuación del MCAT y variables como número de hermanos, orden de nacimiento, sexo, planes profesionales y preferencia religiosa
    • Ej.: las estudiantes obtienen puntajes más altos que los hombres, los puntajes tienden a bajar cuanto mayor es el número de hermanos, los primogénitos/hijos únicos son más inteligentes que los menores, y existen diferencias marcadas entre grupos religiosos, entre otras
  • También se observó alta significancia en las relaciones con varias variables dentro de cinco denominaciones protestantes representativas
    • Ej.: la probabilidad de que un hijo único sea Presbyterian es casi el doble que la de ser Baptist, además de diferencias por denominación en agrado por la escuela y aspiraciones profesionales, entre muchas otras correlaciones

Caso de los ítems del MMPI

  • De los 550 ítems del MMPI (prueba de personalidad), 507 (92%) mostraron diferencias significativas según el sexo
    • Algunos ítems permiten explicar con claridad diferencias de tendencia muy marcadas, mientras que en otros las razones son complejas o imposibles de explicar
  • Como estos resultados aparecen en estudios a gran escala con muestras muy grandes, se trata de un fenómeno real y no de un error estadístico (type I error)

Correlaciones en ciencias sociales y límites de la validación teórica

  • Incluso si se combinan al azar una teoría y pares de variables, si la correlación promedio (crud factor) está alrededor de 0.30, en la práctica es posible encontrar una diferencia significativa aproximadamente una de cada tres veces
    • Esto ocurre con mucha más frecuencia que el nivel de significancia (0.05) que normalmente se considera relevante en ciencias sociales
  • Como las correlaciones aparecen con facilidad incluso entre pares de variables que el investigador no predijo teóricamente, la significancia estadística por sí sola difícilmente respalda una relación causal sustantiva
  • Las causas complejas (genes/ambiente) y la riqueza de los datos observacionales generan estas correlaciones en muchas direcciones

Conclusión práctica

  • Al interpretar datos de ciencias sociales y validar teorías, es necesario tener siempre presente el “crud factor” como “correlaciones ordinarias pero realmente existentes”
  • En lugar de confiar ciegamente en estadísticas de significancia (por ej., p<0.05), hace falta un enfoque más centrado en la causalidad sustantiva entre variables y en la interpretación de patrones
  • Como en el aforismo de Thorndike, “todas las cosas buenas tienden a venir juntas”, en el mundo real demasiadas cosas están entrelazadas entre sí

Aún no hay comentarios.

Aún no hay comentarios.