8 puntos por xguru 2024-08-06 | 2 comentarios | Compartir por WhatsApp
  • Hace unos 10 años, investigadores de Google anticiparon que la demanda de cómputo para IA superaría la capacidad de la infraestructura de ese momento
  • Al darse cuenta de que no había alternativas en el mercado que pudieran cubrir esa demanda, comenzaron a desarrollar un nuevo tipo de chip: la TPU (Tensor Processing Unit)

Un chip de propósito específico

  • Mientras que la CPU funciona como el “cerebro” multipropósito de la computadora, la TPU es un chip de propósito específico optimizado para IA
  • La TPU es un ASIC (application-specific integrated circuit) especializado en operaciones matemáticas basadas en matrices y vectores, necesarias para construir y ejecutar modelos de IA
  • La TPU v1, desplegada internamente en 2015, fue un éxito inmediato en todo Google, y durante los siguientes 10 años las TPU siguieron mejorando en rendimiento y eficiencia

Mantener el ritmo de la innovación en IA

  • La evolución de las TPU ha estado estrechamente ligada a la innovación en machine learning e IA
  • La TPU v1 se centró en inferencia, pero poco después desarrollaron la supercomputadora de entrenamiento TPU v2 para hacer más eficiente el entrenamiento de modelos
  • Desde entonces, las TPU se han lanzado con ciclos más rápidos y han dado grandes saltos en rendimiento, eficiencia y capacidad de procesamiento
  • En la generación más reciente, la velocidad de procesamiento de datos es tan alta que incluso requiere cuidado en el cableado de interconexión entre chips

Compartiendo el avance

  • Al principio, Google no era la única empresa que buscaba una mejor forma de desarrollar y ejecutar modelos de IA
  • A inicios de 2018, Google Cloud lanzó la primera generación de Cloud TPU para que los clientes pudieran acelerar sus propias cargas de trabajo de entrenamiento e inferencia
  • Hoy, equipos de IA muy conocidos como Anthropic, Midjourney y Salesforce usan Cloud TPU de forma intensiva
  • Y toda esta capacidad de procesamiento sigue siendo apenas el comienzo
  • En adelante, planean transformar el diseño de los centros de datos para adaptarlo mejor a los requisitos de las TPU
  • Más allá de un solo chip o un solo pod de TPU, están construyendo una red global de centros de datos llenos de TPU
  • El futuro será de personalización full stack de punta a punta, del silicio al concreto

2 comentarios

 
ing03201 2024-08-06

La TPU realmente fue una visión adelantada a su tiempo
Lo demostró muy bien con el procesamiento de cámara única del Google Pixel 2 XL, y en la era de los LLM está viviendo su época dorada
Así que por favor actualicen la placa Coral Micro Dev.... snif snif

 
ganadist 2024-08-06

El procesador de imágenes incluido en los primeros modelos de Pixel (al que llamaban Visual Core) está basado en la plataforma Monette Hill de Intel.