- Se presentó una denuncia interna que afirma que Huawei copió grandes modelos de IA de Qwen y DeepSeek y luego los presentó como un producto propio llamado Pangu
- Según el testimonio de empleados internos del equipo Pangu, algunos modelos sustanciales no fueron desarrollados directamente, sino que se basaron en modelos open source externos a los que solo se les cambió el nombre
- Técnicamente, se habría evidenciado que modelos clave como 135B V2 y Pro MoE 72B coinciden en gran medida con la arquitectura de Qwen y DeepSeek
- Dentro de la organización, estas prácticas habrían provocado desmoralización y fuga de investigadores, agravadas además por la ineficiencia administrativa y políticas de personal poco transparentes
- Aunque también existen modelos realmente desarrollados de forma autónoma (como Pangu V3), la práctica de clonar y una cultura de investigación poco reconocida habrían dejado una herida profunda en la confianza de toda la organización
- La persona denunciante decidió revelar la verdad usando su nombre real y pidió reflexión y cambios dentro de la organización
La tragedia de Pangu: los dolorosos entresijos del gran modelo Pangu del Noah Ark Lab de Huawei
Presentación de la persona denunciante y ambiente en el lugar
- El autor pertenece al equipo de grandes modelos Pangu de Huawei Noah y validó su identidad haciendo coincidir información interna sobre la estructura principal de la organización, los proyectos y la composición del liderazgo
- En la práctica, el proyecto Pangu se parecía más a una organización de entrega que a una organización de investigación, y estaba sometido a plazos repetidos, sobrecarga laboral y presión constante por evaluaciones e informes
- La intensidad del trabajo y la burocracia eran extremas, con largas temporadas viviendo en alojamiento lejos de la familia y trabajo frecuente los fines de semana
- En la práctica, más que la autonomía y creatividad de la investigación, dominaba una cultura corporativa enfocada en fechas de entrega y resultados de cada línea de producto (Cloud, ICT, etc.)
Noches sin dormir, conciencia creativa pisoteada
- Tras la polémica por el presunto plagio del modelo Qwen, parte del personal de investigación experimentó al mismo tiempo vergüenza, rabia e impotencia
- La persona denunciante teme represalias de una gran corporación y de las redes internas, pero decidió hablar por conciencia porque ya no podía soportar el encubrimiento de los hechos ni la promoción engañosa hacia el exterior
Dificultades técnicas y el inicio del plagio
- Los primeros modelos Pangu intentaron entrenarse internamente sobre NPUs Huawei Ascend, pero enfrentaron graves tropiezos, como baja eficiencia del tokenizer y mal desempeño del modelo
- Quedaron rezagados frente a modelos basados en GPU de competidores (Alibaba, Zhipu), y el entrenamiento de su propio modelo dense de 230B terminó en fracaso
- Ante eso, el laboratorio de modelos pequeños lo presentó como “desarrollo propio”, pero en realidad habría creado y distribuido 135B V2, una copia con ligeras modificaciones del modelo Qwen-1.5 (110B), y dentro de la empresa también se evidenciaron similitudes en código y estructura
- El liderazgo principal y la gerencia sabían esta situación, pero la toleraron por la presión de mostrar resultados y desempeño de cara al exterior
Verdadero logro técnico: Pangu V3
- Tras grandes esfuerzos, el equipo entrenó de forma independiente en Ascend el modelo Pangu V3 (135B Ultra), desarrollado completamente desde cero
- Superó varios obstáculos técnicos (unificación del tokenizer, estabilización de la curva de pérdida, etc.) y alcanzó un desempeño similar al de sus competidores
- Este logro fue visto como una prueba de desarrollo independiente de grandes modelos, no de plagio, y fue fuente de orgullo para el personal investigador
El esfuerzo no reconocido detrás de la división del trabajo
- El laboratorio de modelos pequeños siguió tomando datos, código y resultados para modificar y distribuir modelos con facilidad, mientras que los logros y recompensas se concentraban sobre todo en esa organización
- Como resultado, investigadores dedicados abandonaron la organización o lamentaron con amargura que esto quedara como una mancha en su carrera técnica
Casos secundarios de plagio, como el clon 224B MoE/718B
- Durante el desarrollo del nuevo modelo 718B MoE, también se habría copiado casi intacto DeepSeekv3 y luego distribuido bajo el nombre Pangu Pro MoE 72B
- Internamente se conocían estas prácticas, pero prevalecía el silencio por la necesidad de sobrevivir y el miedo a revelar la verdad
Gestión administrativa absurda
- Al personal de investigación genuino se le aplicaban estrictos procesos, trazabilidad de modelos y sistemas de auditoría, lo que retrasaba el desarrollo
- Pero en el caso de los modelos clonados, seguía arraigado un doble rasero según el cual “si viene de arriba, todo pasa”
Motivo de la revelación y decisión de renunciar
- Después del caso HonestAGI, comenzaron los intentos de gestión de crisis y encubrimiento interno a nivel empresa
- La persona denunciante afirmó que ya no podía seguir participando en “informes falsos” ni en la complicidad interna, y expresó su intención de que se eliminara su nombre de las listas del equipo y de los informes, además de renunciar voluntariamente
Último llamado y aprecio por sus colegas
- Colegas ya se habían cambiado a otras empresas como ByteDance, DeepSeek, Tencent y Kuaishou, mostrando que la fuga de talento de Huawei es grave
- Se enfatiza que, con innovación, un entorno adecuado y menos trabas políticas, también sería posible desarrollar grandes modelos y chips de nivel mundial
- Expresó su disposición a asumir incluso posibles amenazas a su seguridad y la de su familia derivadas de la veracidad de este contenido y de revelaciones adicionales
Explicación adicional del contexto
- En el caso del clon 135B V2, el laboratorio de modelos pequeños se habría quedado solo con beneficios como recompensas e incentivos, mientras la carga de soporte downstream y mantenimiento se trasladó al equipo desarrollador original (4th brigade)
- Incluso en la autoría del informe técnico de Pangu, era común una práctica académica injusta en la que se excluía a personas que contribuyeron de forma clave al desarrollo del modelo, mientras se incluía a personas no contribuyentes del laboratorio de modelos pequeños
1 comentarios
Opiniones de Hacker News