2 puntos por GN⁺ 2024-12-07 | 1 comentarios | Compartir por WhatsApp
  • Colección Llama 3.3
    • Esta colección incluye el transformador y el repositorio original de Llama 3.3
    • Actualizado recientemente hace 8 horas
    • Incluye un total de 1 elemento

1 comentarios

 
GN⁺ 2024-12-07
Opiniones en Hacker News
  • En comparación con Llama 3.2 405B, parece tener un rendimiento similar o ligeramente mejor

    • Según Zuck, este es el último lanzamiento de la serie Llama 3, y se espera que Llama 4 salga en 2025
    • Hace recordar la famosa frase de Steve Jobs sobre Dropbox: “es una función, no un producto”
    • Meta está convirtiendo la IA en una commodity al ofrecer modelos potentes como open source, y con eso puede fortalecer los servicios de Facebook e Instagram
    • No se trata de vender IA, sino de usar IA para reforzar el negocio principal
    • Al ofrecerlo como open source, puede obtener la ventaja de una adopción amplia y desarrollo por parte de terceros
  • En nuestros benchmarks, rindió mejor de lo esperado

    • Vamos a revisarlo más a fondo, pero es impresionante
  • Sigue la discusión sobre un buen cliente de escritorio “general” para Mac

    • Quieren usar Ollama, ChatGPT, Claude, Perplexity, etc.
    • Quieren usar chat con IA en varias apps, y no necesariamente tiene que ser una app de escritorio
    • MacMind está bueno, pero sale caro como frontend para otras API
    • La respuesta de “no seas tacaño” también parece razonable
  • Muestra un rendimiento parecido a GPT-4o en varios benchmarks

  • Subieron a Hugging Face versiones 4bit bitsandbytes, GGUFs y los pesos originales de 16bit

    • Es posible afinar Llama 3.3 70B hasta 2 veces más rápido con menos de 48GB de VRAM, y reducir el uso de memoria en 70%
  • Están siguiendo el precio de 1M tokens en OpenRouter, y el precio baja cada vez que refrescan

  • El open sourcing de Llama es un excelente ejemplo de la estrategia “Commoditize Your Complement”

    • Para quienes no conozcan esta estrategia, comparten el enlace de Gwern “Laws of Tech: Commoditize Your Complement”
  • Preguntas sobre el modelo en Hugging Face

    • Si se puede ejecutar en una laptop a través de JupyterLab
    • Qué ventajas tiene
    • Si se puede actualizar de forma regular
    • Si se puede afinar para un caso de uso específico
    • Cuánto tiempo y esfuerzo requiere afinar el modelo
    • Piden una URL sobre si Hugging Face ofrece respuestas a estas preguntas
  • Meta sigue superando expectativas al lanzar modelos abiertos potentes para competir con OpenAI/Anthropic

    • Los grandes beneficiados son los desarrolladores