1 puntos por GN⁺ 6 시간 전 | 1 comentarios | Compartir por WhatsApp
  • La tasa de reprobación en cursos de CS de Berkeley subió con fuerza: en primavera de 2026 fue de 35.3% en CS 10 y 10.6% en CS 61A, muy por encima de semestres anteriores, y fuera de la guía de EECS que marca 7% para D y F en cursos introductorios y un GPA promedio de 2.8 a 3.3
  • Dan Garcia considera que el uso de LLM como Claude, ChatGPT y Google Gemini, que ha incrementado mucho el fraude académico, fue el “primary driver” de estas tasas de reprobación anómalas; en CS 10 casi 30 estudiantes fueron detectados haciendo trampa en un take-home exam
  • Ambos cursos se calificaron con criterios públicos de puntaje sin curva, por lo que las notas no dependieron del desempeño de otros estudiantes, y Garcia cree que ajustar con curva oculta el problema
  • EECS 127 de Gireeja Ranade también registró una tasa de F de 16.8% en medio de una preparación matemática insuficiente y falta de personal; además, el proyecto final tradicional se eliminó por falta de asistentes, y la asistencia a office hours también bajó
  • En la era de la IA, los cursos de CS y EECS de Berkeley están siendo replanteados para enseñar más, no menos, de modo que el alumnado aprenda pensamiento crítico y analítico al soportar problemas difíciles y la confusión, además de buscar apoyos complementarios

Fuerte alza en la tasa de reprobación y desviación de las guías de calificación

  • Según Berkeleytime, en primavera de 2026 el 35.3% del alumnado de CS 10 y el 10.6% del de CS 61A recibió F
  • En primavera de 2025 y primavera de 2024, en ambos cursos la proporción de F no superó el 10%
  • La guía de calificaciones del departamento de EECS indica que en cursos introductorios como CS 10 y CS 61A la proporción de estudiantes con D y F debe ser de 7%
  • Según esa guía, el rango típico de GPA en cursos introductorios es de 2.8 a 3.3, pero en primavera de 2026 el promedio de ambos cursos fue C+, equivalente a un GPA de 2.3

Dependencia de los LLM y problema de fraude académico

  • Dan Garcia impartió en primavera de 2026 tanto CS 10 “The Beauty and Joy of Computing” como CS 61A “The Structure and Interpretation of Computer Programs”
  • Garcia considera que el aumento del fraude académico derivado del uso de modelos de lenguaje grandes como Claude, ChatGPT y Google Gemini fue el “primary driver” de las tasas de reprobación inusualmente altas
  • Algunas calificaciones reprobatorias provinieron de casos detectados de fraude y remitidos a procesos disciplinarios; en otros, se considera que el estudiantado dependió en exceso de los LLM y luego llegó mal preparado a los exámenes
  • En CS 10 de primavera de 2026, casi 30 estudiantes fueron detectados haciendo trampa en un take-home exam

Sistema de evaluación sin curva

  • Los dos cursos de Garcia se calificaron no con curva, sino con criterios de puntaje para cada letter grade
  • En este sistema, la nota del estudiante no depende del desempeño de sus compañeros
  • Garcia prefiere publicar los criterios de cada letter grade y dar muchas oportunidades para que el estudiantado alcance esos umbrales
  • Garcia se opone firmemente a modelos como el de Harvard, donde solo cierta cantidad de estudiantes puede obtener A, y considera que la curva oculta los problemas reales

Preparación matemática y dificultades en EECS 127

  • Además de la dependencia excesiva de la IA, Garcia cree que muchos estudiantes no estaban matemáticamente preparados, una preocupación que Gireeja Ranade también comparte
  • EECS 127 de Ranade, “Optimization Models in Engineering”, registró en primavera de 2026 una tasa de F de 16.8%, muy por encima del 5% que el departamento de EECS presenta como tasa “typical” de D y F en cursos avanzados
  • Se esperaba que quienes entraban a EECS 127 ya hubieran cursado álgebra lineal, cálculo vectorial y demostraciones matemáticas, pero Ranade confirmó en office hours que muchos tenían dificultades con álgebra lineal
  • Un estudiante le dijo a Ranade que en un curso de álgebra lineal tomado en UC Berkeley las tareas y exámenes tenían una “open-internet, open-AI policy”
  • Garcia y Ranade están entre los más de 1,300 profesores de la UC que firmaron una petición para restablecer los puntajes de exámenes estandarizados ACT y SAT en la admisión STEM del sistema UC

Falta de personal y menor participación estudiantil

  • EECS 127 antes incluía un proyecto final guiado por equipos de profesorado y asistentes, y Ranade considera que la mayoría del estudiantado solía obtener notas altas en esa parte
  • En 2026, por falta de personal, Ranade eliminó ese proyecto final del curso
  • Según una publicación en X del director del departamento de EECS, Jelani Nelson, el campus tuvo que reducir tanto la matrícula de CS de licenciatura como el número de asistentes de docencia de pregrado debido al alto pago por hora de los TAs de EECS
  • Los office hours de Ranade antes estaban llenos, pero este semestre, aunque animó al estudiantado a participar con frecuencia, la asistencia fue muy baja
  • Garcia también vivió una baja similar en asistencia a office hours durante los últimos dos semestres, y por primera vez tuvo office hours a los que no asistió nadie

Rediseño de cursos y actitud frente al aprendizaje

  • Garcia planea informar desde el primer día de clase sobre lo ocurrido en primavera de 2026 y buscar formas de identificar a estudiantes que necesiten apoyo complementario adicional
  • Ranade cree que en la era de la IA el profesorado debe enseñar “más, no menos” al estudiantado
  • Ranade quiere que sus estudiantes desarrollen el pensamiento crítico y analítico necesario para convertirse en líderes en un mundo competitivo
  • Ambos profesores creen que los estudiantes necesitan sentirse más cómodos enfrentando problemas difíciles
  • Garcia cita una expresión de un colega: “Confusion is the sweat of learning”, y cree que muchos estudiantes no están sudando lo suficiente ese “sudor”

1 comentarios

 
GN⁺ 6 시간 전
Comentarios en Hacker News
  • Si los LLM hubieran existido cuando yo era estudiante, creo que los habría usado para “terminar rápido” la tarea y me habría ido pésimo en todos los exámenes, así que hasta cierto punto entiendo a los estudiantes de ahora
    Ahora trabajo sobre todo con doctores, pero incluso en gente que siempre estuvo en la élite se nota que la capacidad de pensar se está deteriorando rápidamente. Si el LLM no hace el 90%, muchos ya no pueden hacer brainstorming, programar, pensar en profundidad ni escribir, y hasta se les dificulta sentarse 30 minutos en silencio a pensar solos, algo necesario para el pensamiento original
    Los adultos no tienen exámenes y, como gracias a los LLM se mantiene la producción, quizá el deterioro cognitivo no se mida bien, pero creo que ya está ocurriendo por todos lados a nuestro alrededor. No quería aceptarlo, pero ya es demasiado evidente como para ignorarlo

    • No siento que mi capacidad haya empeorado de forma especial desde que uso LLM. Terminé la licenciatura hace 20 años y mis habilidades matemáticas, que alguna vez fueron agudas, ya habían caído bastante entre 5 y 10 años después de graduarme
      Dejé de hacer de cabeza la aritmética simple y los porcentajes que antes resolvía rápido, y pasé a depender de la calculadora y las hojas de cálculo; también delegué la cultura general a la RAM de internet que llevo en el bolsillo. Me es muy familiar esa sensación de “ah, antes lo sabía, voy a tener que buscarlo”. Capaz que ya había tocado fondo en mi estupidez personal incluso antes de los LLM
      Pero hoy mi estado de comunicación se siente como una carga mental tremenda. Hay que llevar al mismo tiempo muchísimas conversaciones e hilos: correo, buzón de voz, chats, online, mensajes, lo personal, el trabajo, la casa, los hijos, la familia, los amigos, Messages, Messenger, WhatsApp, etc. Y aun así estoy mucho menos conectado que la gente que me rodea. No me da la capacidad para soportarlo, así que dejé casi todas las noticias y todos los deportes
      Mi cerebro se formó antes de internet, y siento que el proceso de convertirlo de analógico a digital ya llegó a su límite. Como mínimo, se siente como una conversión con muchísima pérdida
    • No creo que el uso de IA haya reducido mi capacidad cognitiva real, pero sí noto con claridad que mi paciencia y mi tiempo de concentración se redujeron muchísimo
      Estoy aprendiendo un codebase nuevo en un trabajo nuevo, y la IA de verdad es un arma de doble filo. Por un lado, es increíblemente útil cuando hago preguntas sobre el codebase; pero si uno no tiene cuidado y deja que aplique cambios antes de investigar, termina sin aprender bien el codebase. Para conservar la comprensión, de verdad hay que escribir uno mismo el código nuevo y usar esos músculos mentales necesarios
      Al mismo tiempo, este codebase grande también muestra los límites de la IA. Si uno intenta sacar features por pura vibra, sin entender, inevitablemente va a crear muchos problemas. Incluso arreglos de bugs bien dirigidos tienen un montón de consecuencias no intencionales que el LLM no ve. No es un mal codebase, pero tiene una escala que hasta a los modelos de punta les cuesta. Por eso no creo que hoy sea válida la idea de que “los problemas de IA se resuelven con más IA, así que no hace falta entender el codebase”
    • En la universidad pasé francés sin aprenderlo realmente gracias a Google Translate. Por suerte la calidad era tan mala que igual tenía que revisar con mucho cuidado lo que salía, pero aun así logré pasar dos semestres sin desarrollar ni siquiera habilidades básicas del idioma
      Hace falta alguna medida drástica. En las clases de matemáticas de secundaria todavía había muchas restricciones de “sin calculadora”, y yo las odiaba porque sentía que los cálculos aritméticos largos obstaculizaban el aprendizaje. Así que entiendo que los estudiantes se resistan a un modelo educativo de solo papel, pero tampoco veo muy bien qué se puede aprender cuando tienes al lado una máquina de hacer tareas de alta calidad
    • Si hubieran existido LLM, creo que yo también habría quedado destruido. Puede que escuelas y universidades tengan que cambiar la forma en que enseñan y evalúan
      Que dejen a los estudiantes usar las herramientas de IA que quieran, pero guiándolos en cómo usarlas de manera profesional; y que las habilidades y conocimientos que realmente deben dominar se evalúen temprano y con frecuencia, de forma presencial y offline. Y creo que, en vez de poner F por hacer trampa, deberían suspender a los alumnos
      Hace unos años leí sobre un profesor de secundaria que subía sus clases a YouTube para que los estudiantes las vieran por su cuenta, y usaba el tiempo de clase para interacción, preguntas y exámenes
      Edit: Claude fue más rápido que buscar. Era el caso de dos profesores de química de secundaria en 2007, y se trata del aula invertida https://fltmag.com/the-flipped-classroom/
    • No tengo doctorado ni soy especialmente inteligente, pero desde hace como un año me obligo a hacer a propósito algo de programación y matemáticas a mano
      No diría que lo siento como “deterioro cognitivo”, pero sí noto que me he vuelto mucho más flojo. Cosas que cuando recién empecé a programar eran parte de mi rutina diaria, ahora se sienten pesadas
  • A diferencia de lo que sugiere el título del artículo, es muy probable que la verdadera razón esté escondida en un párrafo del texto. La parte que dice: “Garcia y Ranade, junto con más de 1,300 profesores de UC, firmaron una petición para restaurar los puntajes estandarizados ACT y SAT en las admisiones STEM del sistema UC. La petición y la carta abierta detallan preocupaciones similares sobre la preparación matemática de los estudiantes”
    Antes y después del COVID, muchas universidades de élite experimentaron con eliminar el requisito de exámenes de admisión por razones de equidad, pero casi en todos lados fracasó y una buena parte de esas universidades ya está dando marcha atrás. Yale dijo: “En estudios antes y después de la pandemia, entre todos los elementos de la solicitud, los puntajes de examen fueron el indicador individual más fuerte para predecir el rendimiento futuro en Yale, y eso siguió siendo cierto incluso controlando por ingreso familiar y variables demográficas; además, no solo para ACT/SAT sino también para exámenes por materia como AP e IB” https://archive.is/8zxfo
    Ese enlace es un archivo porque la página original fue eliminada. Yale probó durante un tiempo una estrategia ‘test flexible’, donde se podía elegir si enviar puntajes, pero pronto la descartó y volvió a exigir resultados de exámenes

    • El presidente de Berkeley les pidió a los estudiantes que votaran por la California Proposition 16 de 2020, que buscaba revertir la Proposition 209 de 1996, la cual prohibía las admisiones basadas en raza en las universidades públicas. La Prop 16 fracasó y después de eso Cal empezó a ignorar los puntajes SAT/ACT
      No queda otra que verlo como una alternativa para admitir a menos estudiantes asiáticos, que eran los que tenían el promedio más alto en SAT/ACT. Poco después recibí un correo del mismo presidente elogiando el cambio porque había aumentado la diversidad racial, y en las cifras de antes y después que venían en el mail se veía que la proporción de asiáticos había bajado y todas las demás habían subido
    • Si la eliminación de los exámenes estandarizados en 2021 fuera la verdadera causa, entonces habría que explicar por qué el aumento brusco en la tasa de reprobación recién está ocurriendo ahora
    • No soy estadounidense, así que quizá se me escape el contexto, pero me da curiosidad cómo funcionaban las admisiones sin puntajes de examen
    • El requisito del SAT se eliminó en 2021. El solo hecho de no haber rendido el SAT no explica que la proporción de F salte de 10% en 2025 a 35% en 2026
  • Como profesor de CS, justo ayer tuve una discusión sobre proyectos del curso de computación paralela, y en uno de los tres grupos era evidente que habían ido por la vía ChatGPT. Ni siquiera entendían las decisiones que el LLM había tomado sobre la arquitectura y demás
    La forma de detectar a estos estudiantes se parece a como antes se detectaba a quienes copiaban de otros estudiantes. Es como “darles la cuerda para que se ahorquen”: si les pides explicaciones, terminan metiéndose sin querer en un callejón sin salida
    Cuando hay sospechas, me parece útil apelar a la honestidad con algo como: “Seamos sinceros, ¿qué parte de este código es tuya y qué parte es de ChatGPT?”, y también mostrar empatía, por ejemplo reconociendo que quizá esa misma semana tenían varias entregas. Aun así, no hay que perder la oportunidad de dejarles la lección de que esto debe hacerse de la manera correcta
    Los otros dos grupos también usaron LLM, pero como apoyo para el diseño de alto nivel y la arquitectura. Aunque quizá no escribieron el código 100% a mano, claramente seguían siendo responsables de su trabajo y podían explicar el razonamiento y la estrategia que usaron para resolver el problema
    Les pedí a mis colegas que contaran cuántos casos como este encontraban, porque todavía tenemos que revisar muchos proyectos, pero hasta ahora va 1 de 3, es decir, 33%

    • Al final, ¿no delegaron todos los grupos el pensamiento al LLM? Dudo que hayan aprendido algo que puedan aplicar a otros tipos de proyectos en el futuro
    • Si “los otros dos grupos también usaron LLM de forma de alto nivel y arquitectónica”, entonces parece más cerca de 3/3, 100%
      ¿También habrían aceptado construir el proyecto copiando y pegando código de librerías? Si no, me pregunto por qué sería diferente usar código generado por un LLM
    • Me pregunto qué opina, desde la perspectiva de un profesor, del método socrático junto con un LLM. ¿Es mejor que simplemente usar prompts de “dame la respuesta”?
    • Tomé un curso de computación paralela hace 6 años y todavía no entiendo nada. Si hubiera usado un LLM como tutor personal, probablemente sí lo habría entendido
    • Me pregunto cómo les presentaron a los estudiantes la política y guía de uso de LLM
  • Los seres humanos son extraños: entran sonámbulos en cada crisis, no logran ponerse de acuerdo en nada, y cuando por fin llegan, tampoco logran ponerse de acuerdo sobre la causa
    Cuando lleguemos al punto en que ya no podamos hacer bien “ingeniería” o “ciencia”, pasaremos la siguiente década discutiendo si realmente el problema fue la IA, si aunque lo fuera era inevitable, y si nadie o todos tienen la culpa. Es lo mismo de siempre. Y aun así, aquí estamos hoy, viendo un futuro sombrío y dando otro paso hacia adelante
    ¿Será que asumimos que la sociedad se autorregula? Hasta cierto punto sí, pero el costo de la autorregulación es realmente alto y doloroso. ¿Creemos que podemos aceptar ese costo si existe la posibilidad de que no seamos nosotros los primeros en sufrirlo?

    • Llevamos décadas advirtiendo sobre la llegada de la IA. Para bien o para mal, está profundamente incrustada en la cultura popular y en los libros y películas de ciencia ficción. Pero averiguar qué hacer realmente al respecto es un problema totalmente distinto
      Esto es evolución cultural, y así también funciona el mercado. ¿Esperaban planificación central?
    • El debate sobre el cambio climático siguió la misma lógica
    • No todos están entrando sonámbulos. Mucha gente está gritando desde los techos, pero es fácil manipular a las masas
  • Los datos de calificaciones vienen de https://berkeleytime.com/grades
    Me preocupaba que hubieran escogido solo cursos que apoyaran la narrativa elegida, así que tracé la proporción de F con una línea roja para todos los cursos de CS que siguen impartiéndose, y mostré con barras celestes la cantidad de calificaciones asignadas en el semestre más reciente en que se ofreció cada curso, ordenado de mayor a menor
    Parece que la preocupación era válida. Al ver las primeras gráficas, no se aprecia un gran aumento en la proporción de F en los últimos semestres
    https://x.com/rahimnathwani/status/2062431813143019525?s=61

    • El artículo dice que revisaron CS 10 y 61A, que si no recuerdo mal son cursos introductorios en Berkeley. Me pregunto por qué esto sería cherry-picking y, especialmente si no son evaluados en curva como el curso del profesor citado, por qué no sería un punto de partida razonable para el análisis
    • Por otro lado, también podría ser que muchos profesores simplemente estén ajustando la curva de calificaciones para evitar reprobar a demasiados estudiantes
      Hay incentivos para que un profesor no ponga demasiadas malas notas. Las malas notas suelen bajar las evaluaciones del curso, lo cual puede afectar aumentos salariales y ascensos, y además las malas notas tienden a atraer atención adicional de la administración, algo que ningún profesor quiere
  • En enero, como a mi hija le estaba costando la clase de matemáticas, construí con Claude una herramienta muy enfocada de generación de hojas de ejercicios. Generaba problemas para practicar repetidamente los conceptos con los que ella tenía dificultades
    Funcionó, y habría sido mucho más difícil hacerlo de la manera tradicional
    La herramienta generaba PDFs con hoja de respuestas y conjunto de soluciones, y resolvía los problemas con varios métodos, lo que me permitía revisar más fácilmente cómo los resolvía mi hija e iterar rápido
    Es una herramienta poderosa. Al final todo vuelve a cómo se usa la herramienta: si se usa para mejorar o para tomar atajos

    • Si la clave es “usarla para mejorar o tomar atajos”, entonces a nivel social hay que mirar dónde están los incentivos para priorizar la calidad por encima de la eficiencia
      Si todos lo hicieran de la forma “correcta”, no habría problema, pero los incentivos sociales son complejos y contradictorios, así que para mucha gente el atajo inmediato resulta más atractivo
      Esto es tanto un problema tecnológico como un problema social
  • Parece una noticia aparte, pero “más de 600 profesores de University of California, liderados por matemáticos de UC Berkeley, están pidiendo restablecer los requisitos de exámenes estandarizados para aspirantes a STEM. Dicen que seis años de admisión sin exámenes no han logrado evaluar de forma confiable la preparación, y que cada vez es más común que los profesores tengan que enseñar matemáticas de secundaria a los estudiantes de primer ingreso”
    https://archive.ph/18spS

    • Es difícil encontrar la carta real, pero está aquí: https://ucstudentsuccess.org
    • ¿Quién toma exactamente la decisión de eliminar un criterio estándar para evaluar a los estudiantes?
      ¿Y qué posible beneficio podría tener eso?
  • Los LLM realmente me preocupan mucho
    Tengo un hijo de 15 años y administro el uso de su teléfono con Google Family Link. En general soy bastante abierto y solo recibo avisos de instalaciones, pero Gemini está estrictamente prohibido
    Hemos hablado largo y tendido sobre los riesgos
    Mi hijo dice que sus amigos usan LLM con frecuencia, y sospecha que esa es la razón de sus calificaciones en los exámenes. Algunos de sus amigos sacan entre 20% y 40% en los exámenes, mientras que mi hijo estudia preguntas de exámenes anteriores y responde preguntas durante el repaso, y saca más de 80%
    Me preocupa el futuro, porque está claro que a los proveedores de IA no les va a importar si un estudiante usa un LLM para resolver la tarea

    • Para eso existen los exámenes estandarizados. Porque permiten demostrar capacidad con el esfuerzo y la práctica fuera del horario de clase, soportando lo suficiente el tedio que se exige en entornos académicos y laborales
      En vez de ver la IA solo como un riesgo, deberías ver cómo puede ayudar a tu hijo a acelerar y reforzar su aprendizaje. El verdadero peligro es más bien el entorno político que quiere eliminar los exámenes estandarizados para ocultar los datos de grupos que tradicionalmente fracasaban
    • Me da curiosidad saber qué hizo tu hijo para que le instalaras Google Family Link, o si simplemente se lo instalaste por defecto
    • Eso de prohibir estrictamente Gemini suena a que, si internet hubiera aparecido por primera vez hace 5 años, también le habrías prohibido internet a tu hijo
  • “La guía dice que el GPA general de las materias de división inferior debería quedar en el rango de 2.8 a 3.3. Según Berkeleytime, en la primavera de 2026 la nota promedio de las dos clases fue C+, lo que corresponde a un GPA de 2.3”
    Como egresado de Cal, de verdad me alegra ver que le ponen un freno a la inflación de notas. Trabajé muy duro para conseguir el GPA que obtuve, y odiaría que ese esfuerzo se devaluara si Cal se va por el camino de Yale y empieza a repartir A y A- al 79% de los estudiantes: https://yaledailynews.com/articles/professors-face-grading-dilemma-too-many-a-s-little-taste-for-limits

    • Estaba leyendo el subreddit de la UC a la que asistí y, cuando salieron las admisiones este año, hubo muchas publicaciones con preguntas de admitidos. Entre un tercio y la mitad preguntaban qué tan grave era la deflación de notas y cómo se comparaba con otros campus
    • No va a durar mucho. Para conseguir trabajo después de graduarte necesitas buenas notas, así que si repartes notas bajas, al año siguiente bajan las postulaciones
      Aun así, notas altas + graduación de hace tiempo siguen siendo una señal
    • Opinión impopular, pero convertir las universidades públicas en unos Juegos del Hambre académicos va totalmente en contra de su razón de ser. El propósito de una universidad pública es formar ciudadanos educados
      Bajar intencionalmente la calidad de las clases e intentar poner trampas a los estudiantes en los exámenes no mejora el resultado educativo de nadie. Quienes se quejan de la inflación de notas han olvidado por completo por qué existe la educación pública
  • Qué pena. Hace poco empecé una actividad entretenida para retomar matemáticas y, mientras resolvía problemas, le pedía a Gemini Live mode que verificara y sugiriera cosas, y a veces avanzábamos paso a paso
    Fue bastante divertido, como si tuviera a un profesor increíblemente paciente parado a mi lado. Ha estado entre las mejores experiencias de aprendizaje de matemáticas que he tenido, y además no hace falta mandarle sobornos ni regalos a Gemini para que me siga cayendo bien
    En cambio, si uno no intenta pensar por sí mismo y deja que el LLM haga todo el trabajo, eso suena como hacer trampa contra uno mismo