En comparación con Llama 3.2 405B, parece tener un rendimiento similar o ligeramente mejor
Según Zuck, este es el último lanzamiento de la serie Llama 3, y se espera que Llama 4 salga en 2025
Hace recordar la famosa frase de Steve Jobs sobre Dropbox: “es una función, no un producto”
Meta está convirtiendo la IA en una commodity al ofrecer modelos potentes como open source, y con eso puede fortalecer los servicios de Facebook e Instagram
No se trata de vender IA, sino de usar IA para reforzar el negocio principal
Al ofrecerlo como open source, puede obtener la ventaja de una adopción amplia y desarrollo por parte de terceros
En nuestros benchmarks, rindió mejor de lo esperado
Vamos a revisarlo más a fondo, pero es impresionante
Sigue la discusión sobre un buen cliente de escritorio “general” para Mac
Quieren usar Ollama, ChatGPT, Claude, Perplexity, etc.
Quieren usar chat con IA en varias apps, y no necesariamente tiene que ser una app de escritorio
MacMind está bueno, pero sale caro como frontend para otras API
La respuesta de “no seas tacaño” también parece razonable
Muestra un rendimiento parecido a GPT-4o en varios benchmarks
Subieron a Hugging Face versiones 4bit bitsandbytes, GGUFs y los pesos originales de 16bit
Es posible afinar Llama 3.3 70B hasta 2 veces más rápido con menos de 48GB de VRAM, y reducir el uso de memoria en 70%
Están siguiendo el precio de 1M tokens en OpenRouter, y el precio baja cada vez que refrescan
El open sourcing de Llama es un excelente ejemplo de la estrategia “Commoditize Your Complement”
Para quienes no conozcan esta estrategia, comparten el enlace de Gwern “Laws of Tech: Commoditize Your Complement”
Preguntas sobre el modelo en Hugging Face
Si se puede ejecutar en una laptop a través de JupyterLab
Qué ventajas tiene
Si se puede actualizar de forma regular
Si se puede afinar para un caso de uso específico
Cuánto tiempo y esfuerzo requiere afinar el modelo
Piden una URL sobre si Hugging Face ofrece respuestas a estas preguntas
Meta sigue superando expectativas al lanzar modelos abiertos potentes para competir con OpenAI/Anthropic
1 comentarios
Opiniones en Hacker News
En comparación con Llama 3.2 405B, parece tener un rendimiento similar o ligeramente mejor
En nuestros benchmarks, rindió mejor de lo esperado
Sigue la discusión sobre un buen cliente de escritorio “general” para Mac
Muestra un rendimiento parecido a GPT-4o en varios benchmarks
Subieron a Hugging Face versiones 4bit bitsandbytes, GGUFs y los pesos originales de 16bit
Están siguiendo el precio de 1M tokens en OpenRouter, y el precio baja cada vez que refrescan
El open sourcing de Llama es un excelente ejemplo de la estrategia “Commoditize Your Complement”
Preguntas sobre el modelo en Hugging Face
Meta sigue superando expectativas al lanzar modelos abiertos potentes para competir con OpenAI/Anthropic