- La tasa de reprobación en cursos de CS de Berkeley subió con fuerza: en primavera de 2026 fue de 35.3% en CS 10 y 10.6% en CS 61A, muy por encima de semestres anteriores, y fuera de la guía de EECS que marca 7% para D y F en cursos introductorios y un GPA promedio de 2.8 a 3.3
- Dan Garcia considera que el uso de LLM como Claude, ChatGPT y Google Gemini, que ha incrementado mucho el fraude académico, fue el “primary driver” de estas tasas de reprobación anómalas; en CS 10 casi 30 estudiantes fueron detectados haciendo trampa en un take-home exam
- Ambos cursos se calificaron con criterios públicos de puntaje sin curva, por lo que las notas no dependieron del desempeño de otros estudiantes, y Garcia cree que ajustar con curva oculta el problema
- EECS 127 de Gireeja Ranade también registró una tasa de F de 16.8% en medio de una preparación matemática insuficiente y falta de personal; además, el proyecto final tradicional se eliminó por falta de asistentes, y la asistencia a office hours también bajó
- En la era de la IA, los cursos de CS y EECS de Berkeley están siendo replanteados para enseñar más, no menos, de modo que el alumnado aprenda pensamiento crítico y analítico al soportar problemas difíciles y la confusión, además de buscar apoyos complementarios
Fuerte alza en la tasa de reprobación y desviación de las guías de calificación
- Según Berkeleytime, en primavera de 2026 el 35.3% del alumnado de CS 10 y el 10.6% del de CS 61A recibió F
- En primavera de 2025 y primavera de 2024, en ambos cursos la proporción de F no superó el 10%
- La guía de calificaciones del departamento de EECS indica que en cursos introductorios como CS 10 y CS 61A la proporción de estudiantes con D y F debe ser de 7%
- Según esa guía, el rango típico de GPA en cursos introductorios es de 2.8 a 3.3, pero en primavera de 2026 el promedio de ambos cursos fue C+, equivalente a un GPA de 2.3
Dependencia de los LLM y problema de fraude académico
- Dan Garcia impartió en primavera de 2026 tanto CS 10 “The Beauty and Joy of Computing” como CS 61A “The Structure and Interpretation of Computer Programs”
- Garcia considera que el aumento del fraude académico derivado del uso de modelos de lenguaje grandes como Claude, ChatGPT y Google Gemini fue el “primary driver” de las tasas de reprobación inusualmente altas
- Algunas calificaciones reprobatorias provinieron de casos detectados de fraude y remitidos a procesos disciplinarios; en otros, se considera que el estudiantado dependió en exceso de los LLM y luego llegó mal preparado a los exámenes
- En CS 10 de primavera de 2026, casi 30 estudiantes fueron detectados haciendo trampa en un take-home exam
Sistema de evaluación sin curva
- Los dos cursos de Garcia se calificaron no con curva, sino con criterios de puntaje para cada letter grade
- En este sistema, la nota del estudiante no depende del desempeño de sus compañeros
- Garcia prefiere publicar los criterios de cada letter grade y dar muchas oportunidades para que el estudiantado alcance esos umbrales
- Garcia se opone firmemente a modelos como el de Harvard, donde solo cierta cantidad de estudiantes puede obtener A, y considera que la curva oculta los problemas reales
Preparación matemática y dificultades en EECS 127
- Además de la dependencia excesiva de la IA, Garcia cree que muchos estudiantes no estaban matemáticamente preparados, una preocupación que Gireeja Ranade también comparte
- EECS 127 de Ranade, “Optimization Models in Engineering”, registró en primavera de 2026 una tasa de F de 16.8%, muy por encima del 5% que el departamento de EECS presenta como tasa “typical” de D y F en cursos avanzados
- Se esperaba que quienes entraban a EECS 127 ya hubieran cursado álgebra lineal, cálculo vectorial y demostraciones matemáticas, pero Ranade confirmó en office hours que muchos tenían dificultades con álgebra lineal
- Un estudiante le dijo a Ranade que en un curso de álgebra lineal tomado en UC Berkeley las tareas y exámenes tenían una “open-internet, open-AI policy”
- Garcia y Ranade están entre los más de 1,300 profesores de la UC que firmaron una petición para restablecer los puntajes de exámenes estandarizados ACT y SAT en la admisión STEM del sistema UC
Falta de personal y menor participación estudiantil
- EECS 127 antes incluía un proyecto final guiado por equipos de profesorado y asistentes, y Ranade considera que la mayoría del estudiantado solía obtener notas altas en esa parte
- En 2026, por falta de personal, Ranade eliminó ese proyecto final del curso
- Según una publicación en X del director del departamento de EECS, Jelani Nelson, el campus tuvo que reducir tanto la matrícula de CS de licenciatura como el número de asistentes de docencia de pregrado debido al alto pago por hora de los TAs de EECS
- Los office hours de Ranade antes estaban llenos, pero este semestre, aunque animó al estudiantado a participar con frecuencia, la asistencia fue muy baja
- Garcia también vivió una baja similar en asistencia a office hours durante los últimos dos semestres, y por primera vez tuvo office hours a los que no asistió nadie
Rediseño de cursos y actitud frente al aprendizaje
- Garcia planea informar desde el primer día de clase sobre lo ocurrido en primavera de 2026 y buscar formas de identificar a estudiantes que necesiten apoyo complementario adicional
- Ranade cree que en la era de la IA el profesorado debe enseñar “más, no menos” al estudiantado
- Ranade quiere que sus estudiantes desarrollen el pensamiento crítico y analítico necesario para convertirse en líderes en un mundo competitivo
- Ambos profesores creen que los estudiantes necesitan sentirse más cómodos enfrentando problemas difíciles
- Garcia cita una expresión de un colega: “Confusion is the sweat of learning”, y cree que muchos estudiantes no están sudando lo suficiente ese “sudor”
1 comentarios
Comentarios en Hacker News
Si los LLM hubieran existido cuando yo era estudiante, creo que los habría usado para “terminar rápido” la tarea y me habría ido pésimo en todos los exámenes, así que hasta cierto punto entiendo a los estudiantes de ahora
Ahora trabajo sobre todo con doctores, pero incluso en gente que siempre estuvo en la élite se nota que la capacidad de pensar se está deteriorando rápidamente. Si el LLM no hace el 90%, muchos ya no pueden hacer brainstorming, programar, pensar en profundidad ni escribir, y hasta se les dificulta sentarse 30 minutos en silencio a pensar solos, algo necesario para el pensamiento original
Los adultos no tienen exámenes y, como gracias a los LLM se mantiene la producción, quizá el deterioro cognitivo no se mida bien, pero creo que ya está ocurriendo por todos lados a nuestro alrededor. No quería aceptarlo, pero ya es demasiado evidente como para ignorarlo
Dejé de hacer de cabeza la aritmética simple y los porcentajes que antes resolvía rápido, y pasé a depender de la calculadora y las hojas de cálculo; también delegué la cultura general a la RAM de internet que llevo en el bolsillo. Me es muy familiar esa sensación de “ah, antes lo sabía, voy a tener que buscarlo”. Capaz que ya había tocado fondo en mi estupidez personal incluso antes de los LLM
Pero hoy mi estado de comunicación se siente como una carga mental tremenda. Hay que llevar al mismo tiempo muchísimas conversaciones e hilos: correo, buzón de voz, chats, online, mensajes, lo personal, el trabajo, la casa, los hijos, la familia, los amigos, Messages, Messenger, WhatsApp, etc. Y aun así estoy mucho menos conectado que la gente que me rodea. No me da la capacidad para soportarlo, así que dejé casi todas las noticias y todos los deportes
Mi cerebro se formó antes de internet, y siento que el proceso de convertirlo de analógico a digital ya llegó a su límite. Como mínimo, se siente como una conversión con muchísima pérdida
Estoy aprendiendo un codebase nuevo en un trabajo nuevo, y la IA de verdad es un arma de doble filo. Por un lado, es increíblemente útil cuando hago preguntas sobre el codebase; pero si uno no tiene cuidado y deja que aplique cambios antes de investigar, termina sin aprender bien el codebase. Para conservar la comprensión, de verdad hay que escribir uno mismo el código nuevo y usar esos músculos mentales necesarios
Al mismo tiempo, este codebase grande también muestra los límites de la IA. Si uno intenta sacar features por pura vibra, sin entender, inevitablemente va a crear muchos problemas. Incluso arreglos de bugs bien dirigidos tienen un montón de consecuencias no intencionales que el LLM no ve. No es un mal codebase, pero tiene una escala que hasta a los modelos de punta les cuesta. Por eso no creo que hoy sea válida la idea de que “los problemas de IA se resuelven con más IA, así que no hace falta entender el codebase”
Hace falta alguna medida drástica. En las clases de matemáticas de secundaria todavía había muchas restricciones de “sin calculadora”, y yo las odiaba porque sentía que los cálculos aritméticos largos obstaculizaban el aprendizaje. Así que entiendo que los estudiantes se resistan a un modelo educativo de solo papel, pero tampoco veo muy bien qué se puede aprender cuando tienes al lado una máquina de hacer tareas de alta calidad
Que dejen a los estudiantes usar las herramientas de IA que quieran, pero guiándolos en cómo usarlas de manera profesional; y que las habilidades y conocimientos que realmente deben dominar se evalúen temprano y con frecuencia, de forma presencial y offline. Y creo que, en vez de poner F por hacer trampa, deberían suspender a los alumnos
Hace unos años leí sobre un profesor de secundaria que subía sus clases a YouTube para que los estudiantes las vieran por su cuenta, y usaba el tiempo de clase para interacción, preguntas y exámenes
Edit: Claude fue más rápido que buscar. Era el caso de dos profesores de química de secundaria en 2007, y se trata del aula invertida https://fltmag.com/the-flipped-classroom/
No diría que lo siento como “deterioro cognitivo”, pero sí noto que me he vuelto mucho más flojo. Cosas que cuando recién empecé a programar eran parte de mi rutina diaria, ahora se sienten pesadas
A diferencia de lo que sugiere el título del artículo, es muy probable que la verdadera razón esté escondida en un párrafo del texto. La parte que dice: “Garcia y Ranade, junto con más de 1,300 profesores de UC, firmaron una petición para restaurar los puntajes estandarizados ACT y SAT en las admisiones STEM del sistema UC. La petición y la carta abierta detallan preocupaciones similares sobre la preparación matemática de los estudiantes”
Antes y después del COVID, muchas universidades de élite experimentaron con eliminar el requisito de exámenes de admisión por razones de equidad, pero casi en todos lados fracasó y una buena parte de esas universidades ya está dando marcha atrás. Yale dijo: “En estudios antes y después de la pandemia, entre todos los elementos de la solicitud, los puntajes de examen fueron el indicador individual más fuerte para predecir el rendimiento futuro en Yale, y eso siguió siendo cierto incluso controlando por ingreso familiar y variables demográficas; además, no solo para ACT/SAT sino también para exámenes por materia como AP e IB” https://archive.is/8zxfo
Ese enlace es un archivo porque la página original fue eliminada. Yale probó durante un tiempo una estrategia ‘test flexible’, donde se podía elegir si enviar puntajes, pero pronto la descartó y volvió a exigir resultados de exámenes
No queda otra que verlo como una alternativa para admitir a menos estudiantes asiáticos, que eran los que tenían el promedio más alto en SAT/ACT. Poco después recibí un correo del mismo presidente elogiando el cambio porque había aumentado la diversidad racial, y en las cifras de antes y después que venían en el mail se veía que la proporción de asiáticos había bajado y todas las demás habían subido
Como profesor de CS, justo ayer tuve una discusión sobre proyectos del curso de computación paralela, y en uno de los tres grupos era evidente que habían ido por la vía ChatGPT. Ni siquiera entendían las decisiones que el LLM había tomado sobre la arquitectura y demás
La forma de detectar a estos estudiantes se parece a como antes se detectaba a quienes copiaban de otros estudiantes. Es como “darles la cuerda para que se ahorquen”: si les pides explicaciones, terminan metiéndose sin querer en un callejón sin salida
Cuando hay sospechas, me parece útil apelar a la honestidad con algo como: “Seamos sinceros, ¿qué parte de este código es tuya y qué parte es de ChatGPT?”, y también mostrar empatía, por ejemplo reconociendo que quizá esa misma semana tenían varias entregas. Aun así, no hay que perder la oportunidad de dejarles la lección de que esto debe hacerse de la manera correcta
Los otros dos grupos también usaron LLM, pero como apoyo para el diseño de alto nivel y la arquitectura. Aunque quizá no escribieron el código 100% a mano, claramente seguían siendo responsables de su trabajo y podían explicar el razonamiento y la estrategia que usaron para resolver el problema
Les pedí a mis colegas que contaran cuántos casos como este encontraban, porque todavía tenemos que revisar muchos proyectos, pero hasta ahora va 1 de 3, es decir, 33%
¿También habrían aceptado construir el proyecto copiando y pegando código de librerías? Si no, me pregunto por qué sería diferente usar código generado por un LLM
Los seres humanos son extraños: entran sonámbulos en cada crisis, no logran ponerse de acuerdo en nada, y cuando por fin llegan, tampoco logran ponerse de acuerdo sobre la causa
Cuando lleguemos al punto en que ya no podamos hacer bien “ingeniería” o “ciencia”, pasaremos la siguiente década discutiendo si realmente el problema fue la IA, si aunque lo fuera era inevitable, y si nadie o todos tienen la culpa. Es lo mismo de siempre. Y aun así, aquí estamos hoy, viendo un futuro sombrío y dando otro paso hacia adelante
¿Será que asumimos que la sociedad se autorregula? Hasta cierto punto sí, pero el costo de la autorregulación es realmente alto y doloroso. ¿Creemos que podemos aceptar ese costo si existe la posibilidad de que no seamos nosotros los primeros en sufrirlo?
Esto es evolución cultural, y así también funciona el mercado. ¿Esperaban planificación central?
Los datos de calificaciones vienen de https://berkeleytime.com/grades
Me preocupaba que hubieran escogido solo cursos que apoyaran la narrativa elegida, así que tracé la proporción de F con una línea roja para todos los cursos de CS que siguen impartiéndose, y mostré con barras celestes la cantidad de calificaciones asignadas en el semestre más reciente en que se ofreció cada curso, ordenado de mayor a menor
Parece que la preocupación era válida. Al ver las primeras gráficas, no se aprecia un gran aumento en la proporción de F en los últimos semestres
https://x.com/rahimnathwani/status/2062431813143019525?s=61
Hay incentivos para que un profesor no ponga demasiadas malas notas. Las malas notas suelen bajar las evaluaciones del curso, lo cual puede afectar aumentos salariales y ascensos, y además las malas notas tienden a atraer atención adicional de la administración, algo que ningún profesor quiere
En enero, como a mi hija le estaba costando la clase de matemáticas, construí con Claude una herramienta muy enfocada de generación de hojas de ejercicios. Generaba problemas para practicar repetidamente los conceptos con los que ella tenía dificultades
Funcionó, y habría sido mucho más difícil hacerlo de la manera tradicional
La herramienta generaba PDFs con hoja de respuestas y conjunto de soluciones, y resolvía los problemas con varios métodos, lo que me permitía revisar más fácilmente cómo los resolvía mi hija e iterar rápido
Es una herramienta poderosa. Al final todo vuelve a cómo se usa la herramienta: si se usa para mejorar o para tomar atajos
Si todos lo hicieran de la forma “correcta”, no habría problema, pero los incentivos sociales son complejos y contradictorios, así que para mucha gente el atajo inmediato resulta más atractivo
Esto es tanto un problema tecnológico como un problema social
Parece una noticia aparte, pero “más de 600 profesores de University of California, liderados por matemáticos de UC Berkeley, están pidiendo restablecer los requisitos de exámenes estandarizados para aspirantes a STEM. Dicen que seis años de admisión sin exámenes no han logrado evaluar de forma confiable la preparación, y que cada vez es más común que los profesores tengan que enseñar matemáticas de secundaria a los estudiantes de primer ingreso”
https://archive.ph/18spS
¿Y qué posible beneficio podría tener eso?
Los LLM realmente me preocupan mucho
Tengo un hijo de 15 años y administro el uso de su teléfono con Google Family Link. En general soy bastante abierto y solo recibo avisos de instalaciones, pero Gemini está estrictamente prohibido
Hemos hablado largo y tendido sobre los riesgos
Mi hijo dice que sus amigos usan LLM con frecuencia, y sospecha que esa es la razón de sus calificaciones en los exámenes. Algunos de sus amigos sacan entre 20% y 40% en los exámenes, mientras que mi hijo estudia preguntas de exámenes anteriores y responde preguntas durante el repaso, y saca más de 80%
Me preocupa el futuro, porque está claro que a los proveedores de IA no les va a importar si un estudiante usa un LLM para resolver la tarea
En vez de ver la IA solo como un riesgo, deberías ver cómo puede ayudar a tu hijo a acelerar y reforzar su aprendizaje. El verdadero peligro es más bien el entorno político que quiere eliminar los exámenes estandarizados para ocultar los datos de grupos que tradicionalmente fracasaban
“La guía dice que el GPA general de las materias de división inferior debería quedar en el rango de 2.8 a 3.3. Según Berkeleytime, en la primavera de 2026 la nota promedio de las dos clases fue C+, lo que corresponde a un GPA de 2.3”
Como egresado de Cal, de verdad me alegra ver que le ponen un freno a la inflación de notas. Trabajé muy duro para conseguir el GPA que obtuve, y odiaría que ese esfuerzo se devaluara si Cal se va por el camino de Yale y empieza a repartir A y A- al 79% de los estudiantes: https://yaledailynews.com/articles/professors-face-grading-dilemma-too-many-a-s-little-taste-for-limits
Aun así, notas altas + graduación de hace tiempo siguen siendo una señal
Bajar intencionalmente la calidad de las clases e intentar poner trampas a los estudiantes en los exámenes no mejora el resultado educativo de nadie. Quienes se quejan de la inflación de notas han olvidado por completo por qué existe la educación pública
Qué pena. Hace poco empecé una actividad entretenida para retomar matemáticas y, mientras resolvía problemas, le pedía a Gemini Live mode que verificara y sugiriera cosas, y a veces avanzábamos paso a paso
Fue bastante divertido, como si tuviera a un profesor increíblemente paciente parado a mi lado. Ha estado entre las mejores experiencias de aprendizaje de matemáticas que he tenido, y además no hace falta mandarle sobornos ni regalos a Gemini para que me siga cayendo bien
En cambio, si uno no intenta pensar por sí mismo y deja que el LLM haga todo el trabajo, eso suena como hacer trampa contra uno mismo