Meta invierte una suma comparable a la del Proyecto Manhattan en GPUs

(twitter.com/emollick)

1 puntos por GN⁺ 2024-05-06 | 1 comentarios | Compartir por WhatsApp

1 comentarios

GN⁺ 2024-05-06

Opiniones en Hacker News

Sorprende que el Manhattan Project y el Apollo Program suenen más “baratos” de lo esperado.
Es extraño que el costo de enviar personas a la Luna en los años 60 sea similar al de la reciente recompra de acciones de Apple.
- Puede deberse a que durante los últimos casi 100 años se ha subestimado la inflación. Con el tiempo, esa diferencia se acumula mucho por interés compuesto.
  Una comparación más justa es verlo como cuántos años de salario de un ciudadano promedio representa.
  El Manhattan Project costó 2,000 millones de dólares en 1944, lo que, según el ingreso mediano de los hogares del censo de 1940, equivale a 121 mil hogares-año.
  La recompra de acciones de Apple fue de 110,000 millones de dólares en 2024, lo que, según el censo de 2022, equivale a 122,910 hogares-año.
  Es decir, en 80 años las cifras oficiales de inflación habrían estimado el costo unas 3.5 veces por debajo.
- En ese entonces Estados Unidos era mucho más pobre y el nivel de vida era mucho más bajo. Por eso los salarios también eran mucho más bajos incluso ajustados por inflación y, al estar en guerra, las personas reclutadas tenían que trabajar por salarios bajos sin opción. Eso explica una gran parte.
- Creo que esta caricatura lo dice todo: https://pbs.twimg.com/media/DuJMkjIXcAcRru9?format=jpg
- En realidad no fue nada barato; simplemente se difirieron los costos al futuro. Se estima que la limpieza del sitio de Hanford costará entre 16,800 millones y 550,000 millones de dólares.
  La instalación de Santa Susana, donde se probaron cohetes del Apollo, también requerirá miles de millones de dólares para su limpieza, y allí hay otros factores de costo.
- En situaciones de presión, la relación costo-beneficio es clave. En una sociedad relativamente rica y laxa como la actual, comparada con la WWII y los años 60 de la posguerra, todos los costos suben.
  En aquel entonces se podían construir carreteras, ferrocarriles y barcos, pero ahora hay cientos de reglas, lobistas y partes interesadas que exigen su tajada.
  Después de que el problema de supervivencia se resuelve temporalmente, los incentivos monetarios se vuelven mucho más importantes.
El Manhattan Project y el Apollo Program fueron ambos el 0.4% del GDP. Con el GDP actual de 27 billones de dólares, 108,000 millones de dólares sería la misma proporción, y lo que Meta gastó en GPU ni siquiera llega a un tercio de eso.
- ¿Entonces una sola empresa gastó alrededor del 0.1% del GDP de Estados Unidos en un proyecto de hobby en el que ni siquiera es líder del mercado?
  Es una escala difícil de creer, y no es algo bueno.
- Meta está pagando estas GPU a lo largo de varios años, no en un solo año. El gasto anual de capital de Meta ronda los 30,000 millones de dólares, y no todo eso fue a GPU.
  Además, no es como si Meta estuviera pagando precio minorista.
- Entonces la recompra de acciones de 110,000 millones de dólares de Apple es todavía mayor que eso.
- Si sumas el gasto o los ingresos de todas las empresas, el total puede superar por mucho al GDP.
- Creo que sería mejor compararlo con el gasto del gobierno federal que con el GDP.
  https://fred.stlouisfed.org/series/FYONGDA188S
Parece que la abrumadora complejidad de las GPU, CPU y SoC modernas en realidad no nos impacta tanto.
Comparado con el proceso de producir chips de 3 nm con decenas de miles de millones de transistores, el Manhattan Project difícilmente puede considerarse un proyecto gigantesco. Fue revolucionario, sí, pero frente al desarrollo de obleas EUV cuesta llamarlo “gigantesco”.
- También vale la pena mencionar los grandes logros menos conocidos del Manhattan Project. La clave no fueron los científicos, sino Hanford y Oak Ridge.
  Hanford no solo fueron reactores: fue un proyecto que creó una ciudad de más de 43 mil personas literalmente en medio de la nada.
  Oak Ridge tenía el K-25, el edificio más grande del mundo en ese momento, y solo fue superado más de 20 años después por la Boeing Everett Factory.
  Esos dos lugares también fueron los principales centros de costo del proyecto. La ciencia es barata, pero enriquecer uranio y producir plutonio —sobre todo hacer algo que nadie había hecho antes— no lo es.
- 10% es complejidad abrumadora y 90% es el margen de ganancia de Nvidia.
Me sorprende cada vez que veo la calidad y la artesanía de los productos creados, en términos generales, antes de la década de 1960.
No sé qué hizo que la sociedad de esa época se convirtiera en esta sociedad moderna tan derrochadora, lenta, cara y poco ambiciosa, pero si pudiera volver, lo haría.
- Creo que fue por la clase gerencial profesional. Hubo varias grandes reformas, en manufactura y otros sectores, que promovían una gestión “más eficiente”, y luego eso se aplicó también al trabajo del conocimiento.
  En particular, en el trabajo burocrático de oficina disminuyó la especialización. Hoy todos, incluso los médicos, terminan haciendo de su propio asistente.
  Según anécdotas de personas que vivieron directamente la transición, una de las cosas que arruinó esta nueva cultura gerencial fue la propia gestión, en especial la de niveles bajos y medios.
  Antes, el tiempo que un gerente pasaba en reuniones con colegas o superiores variaba de forma gradual según el nivel jerárquico, y los gerentes de menor nivel tenían menos de esas reuniones y se enfocaban en las necesidades de sus subordinados y en mantener la operación.
  Después del cambio, todos los niveles gerenciales quedaron absorbidos por una cultura de reuniones, reuniones y más reuniones, y la mayoría aportaba poco valor. El exhibicionismo y la politiquería también se filtraron hasta las capas bajas de la organización con mucha más fuerza que antes.
- Se dice que detrás del Apollo 11 hubo 400.000 personas. Si casi medio millón de personas dedican su vida a construir una sola cosa, creo que incluso hoy podrían crear un resultado de alta calidad y bien hecho.
  Nvidia: 26.000 personas
  TSMC: 73.000 personas
  Intel: 124.000 personas
  AMD: 25.000 personas
  Qualcomm: 50.000 personas
  ASML: 42.000 personas
  En términos de escala de personal, toda la industria mundial de semiconductores podría estar en un nivel similar.
- No es solo un problema de calidad del resultado y de artesanía. Los salarios de los trabajadores no aumentaron, pero la productividad sí; los ricos se hicieron más ricos, y el 90% inferior por ingresos quedó sin poder mejorar.
  Es bastante demencial que tantos indicadores hayan empeorado de forma sostenida desde 1971[1].
  [1] https://wtfhappenedin1971.com/
- Después de la guerra sobraban máquinas herramienta y había abundante experiencia en procesos de fabricación de metales.
  Escaseaban los termoplásticos de moldeo por inyección adecuados para usos mucho más amplios que los juguetes.
  Los costos laborales relativamente altos quizá reducían el incentivo para ahorrar en materiales.
  Los consumidores esperaban pagar más por los productos manufacturados a cambio de que fueran reparables y duraderos.
  Los productos electrónicos basados en tubos de vacío a menudo requerían alto voltaje y transformadores o baterías pesadas, lo que definía sus carcasas como de metal o madera y su uso como no portátil. Por ejemplo, las radios de consumo solían estar integradas en muebles.
- Tengo mis propias hipótesis, pero creo que será mejor guardármelas y dar lo mejor en mis proyectos.
Entonces, ¿sería menos de lo que IBM gastó en System/360?
Citando a Dijkstra: https://cacm.acm.org/news/an-interview-with-edsger-w-dijkstr...

I had no idea of the power of large companies. Only recently I learned that in constant dollars the development of the IBM 360 has been more expensive than the Manhattan Project.
La parte que viene justo después también es interesante:
I was beginning to see American publications in the first issue of Communications of the ACM. I was shocked by the clumsy, immature way in which they talked about computing. There was a very heavy use of anthropomorphic terminology, the "electronic brain" or "machines that think." That is absolutely killing. The use of anthropomorphic terminology forces you linguistically to adopt an operational view. And it makes it practically impossible to argue about programs independently of their being executed.
Revisando los datos clave, https://thehistoryofcomputing.net/the-ibm-system360 dice que “IBM gastó 5.000 millones de dólares en moneda de mediados de la década de 1960”, mientras que el Manhattan Project costó 2.000 millones de dólares.
Según https://en.wikipedia.org/wiki/Manhattan_Project, eso está en dólares de 1945, y con la calculadora de inflación CPI de https://www.bls.gov/data/inflation_calculator.htm equivale a unos 3.500 millones de dólares de 1965.
Haciendo el cálculo inverso, esos 30.000 millones de dólares gastados en entrenamiento con GPU serían apenas 3.000 millones de dólares de 1965, así que saldría más barato que el 360.
¿Cómo es que, aun gastando tanto, todavía no logran alcanzar a OpenAI? ¿Por qué OpenAI lo hace tan bien?
- No soy experto en machine learning, pero creo que decir “no logran” es una expresión fuerte. Si ves el podcast en el que aparece Mark Zuckerberg, se puede interpretar que Meta no quiere competir de frente con OpenAI.
  Solo con sus servicios de IA existentes, como recomendaciones, ya usan muchos recursos. La publicidad es y seguirá siendo su generador de efectivo, y los modelos de lenguaje a gran escala todavía no generan grandes ingresos.
  Los ingresos de OpenAI en 2023 fueron de unos 2.000 millones de dólares y crecerán mucho en 2024, pero Meta tuvo 40.000 millones de dólares de utilidad neta en 2023. Desde el punto de vista financiero, todavía no hay motivo para competir.
- Llama 400B todavía está en entrenamiento y podría superar ampliamente muchos casos de uso de GPT-4.
- Me pregunto si han probado meta.ai, que ofrecen gratis. En cuanto a capacidades, ya es bastante competitivo; simplemente Meta todavía no le presta tanta atención ni lo promociona demasiado.
- No es poca la posibilidad de que Llama 3 405B, que todavía está en entrenamiento, supere al mejor modelo actual de OpenAI.
  En inglés, Llama 3 70B ya vence a todos los modelos de Google y Anthropic, y solo queda por detrás de la versión más reciente de GPT-4. Esto según los resultados de Open LLM Arena.
- LLAMA 3 es bastante bueno, y sus trabajos de visión, como segment anything, también están en la frontera del estado del arte. Facebook ya tiene una vía sólida de monetización, así que no necesita necesariamente publicar papers ni crear demos.
¿Se sabe cuánto está usando Meta estas GPU en sus operaciones internas y qué ahorros está viendo ahí?
Además del decepcionante cuadro de chat de “meta ai”, parece que hay muchísimas áreas donde podrían aplicar H100: desde motores de recomendación de contenido hasta prevención de abusos, optimización de ancho de banda de red y flujos de tráfico.
- @MetaAI como miembro en chats grupales me pareció bastante bueno. Puedes jugar con imágenes, escribir historias, hacer que imite a autores o que escriba capítulos de libros pésimos.
  Algunos chats grupales viejos que llevaban días sin mensajes revivieron como espacios para seguir jugando con la IA.
Siento que este tipo de comparaciones son difíciles de interpretar. Incluso descontando la inflación, la economía a la que pertenece este gasto también está creciendo.
Creo que sería más claro expresar el costo como porcentaje de la economía mundial, de una zona económica como Europa o el mundo chino, o de la economía de un país.
Puede que se me esté escapando algo.
No entiendo por qué todos hablan solo de la inflación. Si en la época del Manhattan Project se hubiera querido construir un dispositivo como una GPU moderna, habría sido necesario construir una supercomputadora mucho más grande y costosa que el propio proyecto.
La tecnología simplemente se volvió muchísimo más barata, requiere menos materiales y la investigación ya fue pagada.
Si eso es cierto, quisiera agregar algo: todo es dinero obtenido de la atención humana capturada por la publicidad y de la explotación de datos personales de los usuarios. Felicidades, humanidad.
¿Qué se habría logrado si ese dinero se hubiera usado en áreas útiles?
- Más bien, otros sectores de industria pesada de la economía ya están monopolizados, así que es difícil lograr algo ahí.
  Cuando Google entró en telecomunicaciones, parecía que iba a derribar fácilmente a viejos parásitos como AT&T, Verizon y Comcast, pero ¿qué pasó en realidad?
  Lo mismo con los intentos de Apple de entrar en autos, banca (tarjetas de crédito) y contenidos.
  Por eso ese dinero termina usándose solo de esta manera. No puedes tocar a Exxon, Monsanto, Pfizer ni Boeing, y tampoco puedes hacer mucho con vivienda, educación, salud o banca.
  Al final, quemar efectivo en algo nuevo se vuelve la ruta predeterminada de menor resistencia. Todas las “áreas útiles” están amuralladas.
- Meta no vende datos personales; solo los usa para publicidad.

Meta invierte una suma comparable a la del Proyecto Manhattan en GPUs

Lecturas relacionadas

1 comentarios

Opiniones en Hacker News