La expansión de la capacidad de IA de Tesla: H100, Dojo D1, D2, HW 4.0, X.AI y proveedores de servicios en la nube

xguru · 2023-07-04T10:47:01+09:00

Tesla busca convertirse en una de las mejores empresas de IA del mundo Claro, todavía no ha lanzado la mejor conducción autónoma y tampoco se ve a Tesla en el mundo de la IA generativa, pero... Actualmente Tesla tiene internamente una pequeña infraestructura de IA propia, del orden de 4 mil V100 y 16 mil A100 Microsoft y Meta tienen más de 100 mil GPU y están intentando duplicar esa cifra La débil infraestructura de IA de Tesla se debe en parte al retraso del chip de entrenamiento D1 desarrollado internamente Pero ahora eso está cambiando rápidamente Tesla está aumentando su capacidad de IA más de 10 veces en apenas 1.5 años Una parte es para sus propias funciones, pero otra parte es para X.AI Tesla ha estado diseñando sus propios chips de IA desde 2016 para autos, y desde 2018 para centros de datos Hasta ahora no había logrado producirlos, pero en 2023 está aumentando la producción Esta arquitectura es adecuada para el caso particular de Tesla, pero no es útil para los LLM (está enfocada en redes de imagen) Tesla HW 4.0, chip FSD de segunda generación El chip que realiza la inferencia de IA dentro de los autos Tesla se llama chip FSD Tesla cree que no se necesita un rendimiento enorme dentro del auto para lograr conducción totalmente autónoma, por lo que el rendimiento del chip instalado en el vehículo es bastante limitado Además, como Tesla vende a gran escala, tiene restricciones de costos mucho más estrictas que Waymo/Cruise Waymo/Cruise usó GPU de tamaño completo con un precio más de 10 veces mayor durante el desarrollo y las pruebas iniciales, y está creando SoC más rápidos y más caros Los chips de segunda generación ya se están aplicando a los vehículos vendidos desde febrero de 2023 La primera generación usa el proceso de 14nm de Samsung y está compuesta por 12 Arm Cortex-A72 (2.2Ghz) organizados en 3 clústeres de cuatro núcleos La segunda generación tiene 20 Arm Cortex-A72 organizados en 5 clústeres de cuatro núcleos La parte más importante de la segunda generación son sus tres núcleos NPU Los 3 núcleos usan 32MiB de SRAM cada uno para almacenar pesos del modelo y activaciones En cada ciclo se leen desde la SRAM 256 bytes de datos de activación y 128 bytes de datos de pesos hacia la MAC (Multiply Accumulate Unit) La MAC está diseñada en forma de cuadrícula, y cada núcleo NPU tiene una cuadrícula de 96x96, para un total de 9216 MAC y 18,432 operaciones por ciclo de reloj Con la NPU funcionando a 2.2Ghz, la potencia de cómputo es de 121.641 TOPS (trillion operations per second) El chip FSD de segunda generación está montado sobre un bus de memoria de 128bit con almacenamiento NVMe de 256GB y 16GB de Micron DDR6 (14Gbps) con un ancho de banda de 224GB/s El ancho de banda es 3.3x mayor que en la primera generación HW 4.0 incluye 2 chips FSD Con la mejora de rendimiento de la placa HW4 también aumentó el consumo de energía (el doble que HW3) A pesar de la mejora de rendimiento de HW4, Tesla quiere seguir soportando FSD en HW3, para que los usuarios existentes de HW3 que compraron FSD no necesiten hacer un retrofit El sistema de infoentretenimiento usa una GPU/APU de AMD. Está en la misma placa que el chip FSD (antes estaba en una daughterboard separada) La plataforma HW4 soporta 12 cámaras. Una es para redundancia y 11 se usan realmente Antes se usaban 3 cámaras de baja resolución de 1.2 megapíxeles en el hub de cámaras frontales, pero la nueva plataforma usa 2 cámaras de 5 megapíxeles Actualmente Tesla no usa sensores aparte de LIDAR y cámaras Antes usaba radar, pero fue eliminado desde una generación intermedia Con eso redujo significativamente el costo de fabricación del vehículo, y cree que es posible lograr conducción autónoma usando solo cámaras, por lo que sigue optimizando ese enfoque De todos modos, sí ha dicho que si existiera un radar viable lo integraría con el sistema de cámaras Está previsto que la plataforma HW4 incorpore un radar de diseño propio llamado Phoenix El objetivo de Phoenix es combinar el sistema de radar con el sistema de cámaras para crear vehículos más seguros aprovechando más datos El radar Phoenix usa el espectro de 76-77Ghz Es un sistema de radar automotriz no pulsado que admite tres modos de detección Diferenciación de los modelos de IA de Tesla Tesla apunta a desarrollar modelos fundacionales de IA para mover robots autónomos y autos Ambos necesitan reconocer el entorno y desplazarse por él, así que el mismo tipo de modelo de IA puede aplicarse a ambos La inferencia de este modelo requiere bajo consumo energético y baja latencia, así que las limitaciones de hardware restringen fuertemente el tamaño máximo del modelo que Tesla puede ofrecer Entre todas las empresas, Tesla posee el mayor conjunto de datos utilizable exclusivamente para redes neuronales de deep learning Cada auto en la carretera captura datos usando sensores e imágenes, y al multiplicarlo por la cantidad de vehículos eléctricos Tesla en circulación se obtiene un conjunto de datos enorme Tesla llama a esta recolección de datos "Fleet Scale Auto Labeling" Cada vehículo eléctrico Tesla toma clips de registro de 45 a 60 segundos con video, datos de la IMU interna (unidad de medición inercial), GPS, kilometraje y otros datos densos de sensores, y los envía a los servidores de entrenamiento de Tesla Tesla usa solo una fracción muy pequeña de los datos que recopila Tesla es conocida por sobreentrenar sus modelos para lograr la mayor precisión posible dentro de un tamaño de modelo dado, debido a las limitaciones de inferencia

(semianalysis.com)

9 puntos por xguru 2023-07-04 | 3 comentarios | Compartir por WhatsApp

Tesla busca convertirse en una de las mejores empresas de IA del mundo
Claro, todavía no ha lanzado la mejor conducción autónoma y tampoco se ve a Tesla en el mundo de la IA generativa, pero...
Actualmente Tesla tiene internamente una pequeña infraestructura de IA propia, del orden de 4 mil V100 y 16 mil A100
- Microsoft y Meta tienen más de 100 mil GPU y están intentando duplicar esa cifra
La débil infraestructura de IA de Tesla se debe en parte al retraso del chip de entrenamiento D1 desarrollado internamente
Pero ahora eso está cambiando rápidamente
Tesla está aumentando su capacidad de IA más de 10 veces en apenas 1.5 años
Una parte es para sus propias funciones, pero otra parte es para X.AI
Tesla ha estado diseñando sus propios chips de IA desde 2016 para autos, y desde 2018 para centros de datos
Hasta ahora no había logrado producirlos, pero en 2023 está aumentando la producción
Esta arquitectura es adecuada para el caso particular de Tesla, pero no es útil para los LLM (está enfocada en redes de imagen)

Tesla HW 4.0, chip FSD de segunda generación

El chip que realiza la inferencia de IA dentro de los autos Tesla se llama chip FSD
Tesla cree que no se necesita un rendimiento enorme dentro del auto para lograr conducción totalmente autónoma, por lo que el rendimiento del chip instalado en el vehículo es bastante limitado
Además, como Tesla vende a gran escala, tiene restricciones de costos mucho más estrictas que Waymo/Cruise
Waymo/Cruise usó GPU de tamaño completo con un precio más de 10 veces mayor durante el desarrollo y las pruebas iniciales, y está creando SoC más rápidos y más caros
Los chips de segunda generación ya se están aplicando a los vehículos vendidos desde febrero de 2023
La primera generación usa el proceso de 14nm de Samsung y está compuesta por 12 Arm Cortex-A72 (2.2Ghz) organizados en 3 clústeres de cuatro núcleos
La segunda generación tiene 20 Arm Cortex-A72 organizados en 5 clústeres de cuatro núcleos
La parte más importante de la segunda generación son sus tres núcleos NPU
- Los 3 núcleos usan 32MiB de SRAM cada uno para almacenar pesos del modelo y activaciones
- En cada ciclo se leen desde la SRAM 256 bytes de datos de activación y 128 bytes de datos de pesos hacia la MAC (Multiply Accumulate Unit)
- La MAC está diseñada en forma de cuadrícula, y cada núcleo NPU tiene una cuadrícula de 96x96, para un total de 9216 MAC y 18,432 operaciones por ciclo de reloj
- Con la NPU funcionando a 2.2Ghz, la potencia de cómputo es de 121.641 TOPS (trillion operations per second)
El chip FSD de segunda generación está montado sobre un bus de memoria de 128bit con almacenamiento NVMe de 256GB y 16GB de Micron DDR6 (14Gbps) con un ancho de banda de 224GB/s
- El ancho de banda es 3.3x mayor que en la primera generación
HW 4.0 incluye 2 chips FSD
Con la mejora de rendimiento de la placa HW4 también aumentó el consumo de energía (el doble que HW3)
A pesar de la mejora de rendimiento de HW4, Tesla quiere seguir soportando FSD en HW3, para que los usuarios existentes de HW3 que compraron FSD no necesiten hacer un retrofit
El sistema de infoentretenimiento usa una GPU/APU de AMD. Está en la misma placa que el chip FSD (antes estaba en una daughterboard separada)
La plataforma HW4 soporta 12 cámaras. Una es para redundancia y 11 se usan realmente
- Antes se usaban 3 cámaras de baja resolución de 1.2 megapíxeles en el hub de cámaras frontales, pero la nueva plataforma usa 2 cámaras de 5 megapíxeles
Actualmente Tesla no usa sensores aparte de LIDAR y cámaras
Antes usaba radar, pero fue eliminado desde una generación intermedia
- Con eso redujo significativamente el costo de fabricación del vehículo, y cree que es posible lograr conducción autónoma usando solo cámaras, por lo que sigue optimizando ese enfoque
- De todos modos, sí ha dicho que si existiera un radar viable lo integraría con el sistema de cámaras
Está previsto que la plataforma HW4 incorpore un radar de diseño propio llamado Phoenix
- El objetivo de Phoenix es combinar el sistema de radar con el sistema de cámaras para crear vehículos más seguros aprovechando más datos
- El radar Phoenix usa el espectro de 76-77Ghz
- Es un sistema de radar automotriz no pulsado que admite tres modos de detección

Diferenciación de los modelos de IA de Tesla

Tesla apunta a desarrollar modelos fundacionales de IA para mover robots autónomos y autos
Ambos necesitan reconocer el entorno y desplazarse por él, así que el mismo tipo de modelo de IA puede aplicarse a ambos
La inferencia de este modelo requiere bajo consumo energético y baja latencia, así que las limitaciones de hardware restringen fuertemente el tamaño máximo del modelo que Tesla puede ofrecer
Entre todas las empresas, Tesla posee el mayor conjunto de datos utilizable exclusivamente para redes neuronales de deep learning
Cada auto en la carretera captura datos usando sensores e imágenes, y al multiplicarlo por la cantidad de vehículos eléctricos Tesla en circulación se obtiene un conjunto de datos enorme
Tesla llama a esta recolección de datos "Fleet Scale Auto Labeling"
Cada vehículo eléctrico Tesla toma clips de registro de 45 a 60 segundos con video, datos de la IMU interna (unidad de medición inercial), GPS, kilometraje y otros datos densos de sensores, y los envía a los servidores de entrenamiento de Tesla
Tesla usa solo una fracción muy pequeña de los datos que recopila
- Tesla es conocida por sobreentrenar sus modelos para lograr la mayor precisión posible dentro de un tamaño de modelo dado, debido a las limitaciones de inferencia

3 comentarios

wkwnqlw 2023-07-05

Tesla ya ofrece su software de conducción autónoma en Beta desde hace 2 años. A partir de la siguiente versión, está previsto que se lance oficialmente.
La primera versión era muy deficiente, pero cada vez hay más personas que dicen que el software que se ofrece actualmente ya supera el nivel de una persona promedio. En este momento, el software de conducción autónoma de Tesla (FSD) tiene una tasa de accidentes aproximadamente 3 veces menor que la de los humanos.

bbongcol 2023-07-04

Parece que hay un error tipográfico en «1832 operaciones por ciclo de reloj». En el texto original aparece como 18,432 operaciones.

xguru 2023-07-04

Como es un artículo de pago, no se puede ver la parte final, pero la primera parte ya está tan interesante que quise compartir una traducción.

La expansión de la capacidad de IA de Tesla: H100, Dojo D1, D2, HW 4.0, X.AI y proveedores de servicios en la nube

Tesla HW 4.0, chip FSD de segunda generación

Diferenciación de los modelos de IA de Tesla

Lecturas relacionadas

3 comentarios