- Hace unos 10 años, investigadores de Google anticiparon que la demanda de cómputo para IA superaría la capacidad de la infraestructura de ese momento
- Al darse cuenta de que no había alternativas en el mercado que pudieran cubrir esa demanda, comenzaron a desarrollar un nuevo tipo de chip: la TPU (Tensor Processing Unit)
Un chip de propósito específico
- Mientras que la CPU funciona como el “cerebro” multipropósito de la computadora, la TPU es un chip de propósito específico optimizado para IA
- La TPU es un ASIC (application-specific integrated circuit) especializado en operaciones matemáticas basadas en matrices y vectores, necesarias para construir y ejecutar modelos de IA
- La TPU v1, desplegada internamente en 2015, fue un éxito inmediato en todo Google, y durante los siguientes 10 años las TPU siguieron mejorando en rendimiento y eficiencia
Mantener el ritmo de la innovación en IA
- La evolución de las TPU ha estado estrechamente ligada a la innovación en machine learning e IA
- La TPU v1 se centró en inferencia, pero poco después desarrollaron la supercomputadora de entrenamiento TPU v2 para hacer más eficiente el entrenamiento de modelos
- Desde entonces, las TPU se han lanzado con ciclos más rápidos y han dado grandes saltos en rendimiento, eficiencia y capacidad de procesamiento
- En la generación más reciente, la velocidad de procesamiento de datos es tan alta que incluso requiere cuidado en el cableado de interconexión entre chips
Compartiendo el avance
- Al principio, Google no era la única empresa que buscaba una mejor forma de desarrollar y ejecutar modelos de IA
- A inicios de 2018, Google Cloud lanzó la primera generación de Cloud TPU para que los clientes pudieran acelerar sus propias cargas de trabajo de entrenamiento e inferencia
- Hoy, equipos de IA muy conocidos como Anthropic, Midjourney y Salesforce usan Cloud TPU de forma intensiva
- Y toda esta capacidad de procesamiento sigue siendo apenas el comienzo
- En adelante, planean transformar el diseño de los centros de datos para adaptarlo mejor a los requisitos de las TPU
- Más allá de un solo chip o un solo pod de TPU, están construyendo una red global de centros de datos llenos de TPU
- El futuro será de personalización full stack de punta a punta, del silicio al concreto
2 comentarios
La TPU realmente fue una visión adelantada a su tiempo
Lo demostró muy bien con el procesamiento de cámara única del Google Pixel 2 XL, y en la era de los LLM está viviendo su época dorada
Así que por favor actualicen la placa Coral Micro Dev.... snif snif
El procesador de imágenes incluido en los primeros modelos de Pixel (al que llamaban Visual Core) está basado en la plataforma Monette Hill de Intel.