- Un modelo de lenguaje grande de código abierto que puede usarse tanto para investigación como para fines comerciales
- Entrenado con 2 billones de tokens de datos, un 40% más que Llama 1
- El doble de longitud de contexto: 4096
- Modelos en tres tamaños: 7B, 13B, 70B
- Mejor rendimiento que otros modelos de lenguaje de código abierto en muchos benchmarks de razonamiento, programación, competencia y pruebas de conocimiento (MPT, Falcon, Llama-1)
- Fue entrenado con fuentes de datos públicas, y el Llama-2-chat ajustado también aprovecha conjuntos públicos de instrucciones y más de un millón de anotaciones humanas
- Uso de Reinforcement Learning from Human Feedback (RLHF). Incluye Rejection Sampling y Proximal Policy Optimization (PPO)
- Incluye en la descarga
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
1 comentarios
Opiniones de Hacker News