3 puntos por GN⁺ 2025-01-28 | 1 comentarios | Compartir por WhatsApp
  • El autor trabajó durante 10 años como analista de inversiones en varios hedge funds y tiene una perspectiva única sobre el avance de la tecnología de IA y la valuación de acciones en el mercado bursátil
  • En los últimos años ha trabajado como desarrollador y actualmente lleva adelante varios proyectos de código abierto relacionados con modelos y servicios de IA.

# Nvidia : The Bull Case

Contexto del alza en la acción de Nvidia

  • Crecimiento de la IA y el aprendizaje profundo: el aprendizaje profundo y la IA son considerados la tecnología más revolucionaria desde internet, y Nvidia aseguró una posición casi monopólica en el sector de GPU, impulsando inversiones masivas y gasto en infraestructura por parte de las principales empresas
  • Altos márgenes: registra márgenes de ganancia superiores al 90% en productos avanzados para centros de datos
  • Mercado escalable: junto con el crecimiento de la IA, se está creando nueva demanda en diversos campos de aplicación como centros de datos, robótica y reemplazo del trabajo humano
  • "leyes de escalamiento": el rendimiento de los modelos mejora de forma constante con la expansión de los datos y los recursos de cómputo, y Nvidia lo está aprovechando al máximo

Posición actual de Nvidia y ventajas competitivas

  • Plataforma CUDA: el ecosistema de software de Nvidia que se convirtió en el estándar de facto para la programación de GPU
  • Adquisición de Mellanox: ofrece una ventaja frente a competidores en centros de datos gracias a tecnología de interconexión de alto rendimiento entre GPU
  • Software propietario y calidad de drivers: drivers superiores y mayor estabilidad del software en comparación con AMD
  • Estrategia para mantener el liderazgo: reinvierte sus altas ganancias en investigación y desarrollo (I+D) para sostener continuamente su ventaja tecnológica

# Principales amenazas para Nvidia

Competencia en hardware

  • Cerebras: presenta un nuevo enfoque con chips de IA del tamaño de una oblea que evita los problemas de procesamiento paralelo e interconexión de las GPU de Nvidia
  • Groq: maximiza el rendimiento de inferencia de IA con tecnología basada en "cómputo determinista"
  • Desarrollo de chips propios por parte de clientes clave:
    • Amazon: adopción de chips propios como Trainium2 e Inferentia2
    • Google: desarrollo interno de chips TPU de sexta generación
    • Microsoft y OpenAI: anuncio de planes para desarrollar sus propios chips de IA
    • Apple: posibilidad de aplicar a chips de IA la experiencia acumulada en chips orientados al consumidor

Competencia en software

  • Frameworks de abstracción de alto nivel:
    • plataformas como MLX, Triton y JAX reducen la importancia de CUDA y amplían las posibilidades de reemplazo
  • Tecnología de conversión de código: se están desarrollando tecnologías que usan LLM para convertir código CUDA a otros hardwares
  • Mejoras en los drivers de AMD: desarrolladores de código abierto están trabajando en nuevos drivers para optimizar el rendimiento de las GPU de AMD

Innovaciones en eficiencia de los modelos de IA

  • Aparición de DeepSeek:
    • DeepSeek logra un rendimiento competitivo frente a modelos rivales con un costo de 1/45 respecto de Nvidia, gracias a entrenamiento de precisión mixta FP8 y técnicas de inferencia de alta eficiencia
    • utiliza una arquitectura Mixture-of-Experts(MOE) para implementar modelos de gran escala con eficiencia de memoria
    • reduce drásticamente el uso de VRAM con técnicas como "Multi-head Latent Attention"
    • el costo de llamadas a la API es 95% más barato que el de OpenAI y Anthropic

Cambios en la estructura de la industria

  • Papel de TSMC: como Nvidia no fabrica sus propios chips, TSMC puede producir también chips de otros competidores usando el mismo proceso
  • Esfuerzos de integración vertical por parte de todos los clientes: para reducir la dependencia de los productos de alto margen de Nvidia, los principales clientes están invirtiendo en diseñar sus propios chips

Perspectiva del mercado y desafíos para Nvidia

  • El precio actual de la acción de Nvidia depende de un escenario de crecimiento muy optimista que asume 20 veces los ingresos de 2025 y márgenes de ganancia superiores al 75%
  • Existe la posibilidad de una desaceleración del crecimiento y una caída de márgenes debido a innovaciones en eficiencia y a la intensificación de la competencia en hardware y software
  • Incluso si Nvidia sigue manteniendo su ventaja en el campo de la IA, los desafíos constantes de sus competidores podrían afectar su participación de mercado y su potencial de crecimiento a largo plazo

# Conclusión

  • Nvidia ocupa hoy una posición inigualable como líder de la innovación en IA, pero podría ser difícil sostener su alta valuación actual debido a amenazas competitivas desde múltiples frentes y cambios rápidos en la industria
  • Los inversionistas deben valorar positivamente la ventaja tecnológica de Nvidia y el potencial de crecimiento del mercado de IA, pero también observar de cerca los riesgos derivados de la innovación tecnológica de sus competidores y de los cambios en la estructura del mercado

1 comentarios

 
GN⁺ 2025-01-28
Opiniones de Hacker News
  • La explicación de DeepSeek recuerda la experiencia de redes de los años 80 y 90. En ese entonces, el video bajo demanda era un gran mercado y se ignoró el potencial de los algoritmos avanzados de codificación de video. La posibilidad del video en internet no se debió a un internet más rápido, sino a algoritmos más inteligentes.

    • En el caso de la IA, los GPU siguen volviéndose más rápidos, pero una mejora de 10 veces en el rendimiento del silicio tomará mucho tiempo. DeepSeek sugiere la posibilidad de descubrir nuevos algoritmos.
  • Si DeepSeek puede hacer más con menos recursos, entrará en juego la paradoja de Jevons. Las ventas de GPU aumentarán por la idea de que incluso las empresas pequeñas pueden competir. DeepSeek afirma que, con unos 200 empleados, puede entrenar modelos competitivos con un costo 20 veces menor que las grandes empresas.

  • Se destaca la desventaja de ser el primero en moverse en el desarrollo de modelos de IA. Si se puede copiar un modelo por el 5% del costo, hay dos decisiones racionales:

    • enfocarse en la eficiencia de costos para reducir la ventaja del segundo en moverse
    • construir defensas competitivas mediante economías de escala, efectos de red y captura regulatoria
  • Empresas como OpenAI deben convertirse en plataformas que disfruten de efectos de red directos.

  • La mayor parte del cómputo de IA se está concentrando en la inferencia. R1 (680B) puede ejecutarse de forma distribuida en 3 computadoras de consumo. La ventaja de NVIDIA es conectar eficientemente miles de GPU, pero eso solo será importante para una pequeña parte del cómputo de IA.

  • Varias de las ventajas de NVIDIA están siendo atacadas. Sin embargo, como los competidores están atacando solo ventajas individuales, NVIDIA seguirá siendo la única empresa que conserva todas esas ventajas.

  • La verdadera prueba para la IA de robots humanoides es doblar la ropa. Sigue siendo un problema difícil con la tecnología actual. Hay curiosidad por saber si ha habido avances recientes en la IA para robots.

  • Se sobreestima la eficiencia de desplegar un modelo MoE de 687B en hardware común. En hardware de Apple es imposible, y en una computadora de escritorio apenas es viable. Un trabajo de programación tarda 12 minutos por problemas de ancho de banda de PCIe.

  • Podría haber una estrategia ilegal: esperar un rebote en el precio de NVDA y ganar dinero creando un competidor de OpenAI.

  • Poca gente está viendo correctamente el efecto de DeepSeek. Si es 10 veces más eficiente, no significa usar una décima parte de los recursos, sino usar 10 veces más. Los productos tecnológicos siempre han avanzado en esa dirección.

  • Incluso sin interés en estrategias de short en el mercado bursátil, los papers de DeepSeek v3 y R1 tienen mucho contenido técnico excelente que resume con claridad ideas interesantes.