Resultados del estudio sobre el sesgo de calificación secuencial
- Un análisis de más de 30 millones de registros de calificaciones en Canvas realizado por investigadores de la Universidad de Michigan encontró que los estudiantes con apellidos ubicados más atrás en orden alfabético tienden a recibir puntuaciones más bajas
- Esto se debe al sesgo de calificación secuencial y a que el orden predeterminado de las entregas estudiantiles en Canvas se basa en la posición alfabética del apellido
- Los estudiantes perjudicados por el orden alfabético reciben comentarios más negativos y menos corteses, y la calidad de la calificación, medida por las quejas posteriores de los estudiantes sobre sus notas, también es menor
- Los investigadores dijeron que, aunque piensan mucho en la equidad y la precisión de la evaluación, no habían reconocido este efecto hasta que vieron en los datos que el orden sí generaba diferencias
Datos y resultados de la investigación
- Se recopilaron todos los datos históricos disponibles de Canvas sobre programas, estudiantes y tareas desde el semestre de otoño de 2014 hasta el semestre de verano de 2022
- Se complementaron con datos de inscripción universitaria para incluir información detallada sobre el contexto, la demografía y la trayectoria académica de los estudiantes en la universidad
- Aunque los datos provienen de la Universidad de Michigan, los investigadores afirman que los hallazgos podrían generalizarse a otras instituciones y cursos debido a un problema de diseño común en los sistemas de gestión del aprendizaje
- Esto se debe a la configuración predeterminada que ordena las tareas de los estudiantes alfabéticamente por nombre
- Encontraron un patrón claro de deterioro en la calidad de la calificación a medida que el evaluador revisa más tareas
- Los estudiantes con apellidos que comienzan con A, B, C, D o E reciben 0.3 puntos más sobre 100 en comparación con una calificación aleatoria
- Del mismo modo, los estudiantes con apellidos ubicados al final del alfabeto reciben 0.3 puntos menos, lo que genera una diferencia total de 0.6 puntos
- Aunque una diferencia de 0.6 puntos puede parecer pequeña, estas discrepancias afectan el promedio de calificaciones de las materias y tienen un impacto negativo en las oportunidades a lo largo de la trayectoria profesional de cada estudiante
Contexto del estudio y propuestas
- La idea del estudio surgió mientras Wang, quien investiga tecnología educativa, y Fei, quien investiga IA, discutían el proyecto
- Observaron que el etiquetado de datos, una tarea básica del machine learning, también puede ser un trabajo largo y tedioso, pero normalmente se realiza de forma aleatoria
- A través de un estudio piloto comprobaron si existía desigualdad en las notas según el momento en que se calificaban
- Los investigadores suponen que la fatiga podría ser uno de los principales factores que provocan este efecto
- Cuando se hace algo durante mucho tiempo, uno se cansa, disminuye la atención y se reduce la capacidad cognitiva
- Canvas y otros sistemas de gestión del aprendizaje en línea ofrecen la opción de calificar tareas en orden aleatorio, y algunos docentes ya la utilizan, pero el modo predeterminado sigue siendo el orden alfabético
- Una solución simple sería convertir el orden aleatorio en la configuración predeterminada
- También proponen que las instituciones académicas contraten más evaluadores para cursos masivos, distribuyan la carga de trabajo entre más personas o capaciten al personal para reconocer y reducir este sesgo
Opinión de GN⁺
- Que el sesgo de calificación secuencial tenga un impacto real en las notas de los estudiantes plantea un problema de equidad en los sistemas de evaluación educativa. Dado que las calificaciones influyen fuertemente en el futuro de los estudiantes, parece urgente introducir mejoras
- Sin embargo, como se trata de un estudio limitado a países angloparlantes, quizá no sea un problema tan grande en Corea. Harían falta estudios locales para comprobar si el mismo fenómeno aparece al ordenar por consonantes y vocales del hangul o por el orden de trazos de los apellidos en caracteres chinos
- Que la fatiga del evaluador afecte la calidad de la calificación sugiere la necesidad de una compensación y un apoyo adecuados para las tareas de evaluación en el ámbito educativo. Una carga laboral excesiva puede perjudicar una evaluación justa
- La introducción de sistemas automáticos de calificación basados en inteligencia artificial también podría ser una alternativa. Aun así, será difícil eliminar por completo los problemas de sesgo, por lo que también harán falta medidas que refuercen los aspectos cualitativos de la evaluación
1 comentarios
Opiniones de Hacker News
A continuación, un resumen de los comentarios de Hacker News: