MTIA v1: el acelerador de inferencia de IA de primera generación de Meta
(ai.facebook.com)- Las GPU no son óptimas para ejecutar el DLRM (modelo de recomendación de aprendizaje profundo) de Meta
- Por eso desarrollaron el ASIC Meta Training and Inference Accelerator (MTIA), adecuado para recomendaciones
- Lo codiseñaron pensando en los requisitos de los modelos de recomendación de próxima generación, y lo integraron en PyTorch para construir un sistema de ranking completamente optimizado
- Proceso TSMC de 7 nm, 800Mhz, 102.4 TOPS @ INT8, 51.2 TFLOPS @ FP16, 25W
Aún no hay comentarios.