g1 - Generación de una cadena de razonamiento similar a o1 usando Llama-3.1 70B en Groq
(github.com/bklieger-groq)- g1 es un prototipo inicial que usa estrategias de prompting para mejorar la capacidad de razonamiento de los LLM
- Esto permite que los LLM resuelvan problemas lógicos y abordar problemas que a los modelos existentes les cuesta resolver
- g1 se publicó como open source para inspirar a la comunidad de código abierto a desarrollar nuevas estrategias
Cómo funciona
- g1 usa Llama3.1-70b para generar una Chain of Thought dinámica.
- En cada paso, el LLM puede avanzar al siguiente paso de razonamiento o entregar una respuesta final.
- El system prompt incluye consejos para el LLM.
- Por ejemplo, incluye instrucciones como "explorar respuestas alternativas" y "usar al menos 3 métodos para llegar a la respuesta".
- Estos métodos mejoran la capacidad de razonamiento del LLM.
Ejemplos
- g1 puede resolver problemas lógicos simples con una precisión de 60-80%.
- Ejemplo: ante la pregunta "¿cuántas R hay en strawberry?", g1 muestra una precisión del 70%.
Inicio rápido
-
Cómo usar la UI de Streamlit:
python3 -m venv venv source venv/bin/activate pip3 install -r requirements.txt export GROQ_API_KEY=gsk... streamlit run app.py -
Cómo usar la UI de Gradio:
cd gradio pip3 install -r requirements.txt python3 app.py
Estrategias de prompting
-
Ejemplo de prompt:
{ "title": "Identifying Key Information", "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...", "next_action": "continue" } -
Estructura del prompt:
- Asignar el rol de asistente experto en IA
- Proporcionar un título y contenido en cada paso
- Responder en formato JSON
- Usar al menos 3 pasos de razonamiento
- Reconocer las limitaciones del LLM e incluir exploración de respuestas alternativas
- Al revisar, usar realmente un enfoque distinto
Forks principales
- Mult1: genera una cadena de razonamiento similar a o1 usando varios proveedores de IA (repositorio de GitHub)
Créditos
- Esta app fue desarrollada por Benjamin Klieger
Resumen de GN⁺
- g1 es un prototipo inicial que usa estrategias de prompting para mejorar la capacidad de razonamiento de los LLM.
- Se publicó como open source para inspirar a la comunidad de código abierto a desarrollar nuevas estrategias.
- g1 muestra una mayor precisión que los modelos existentes para resolver problemas lógicos simples.
- Este artículo es útil para explorar distintos métodos para mejorar la capacidad de razonamiento de los LLM.
- Otro proyecto con funciones similares es o1 de OpenAI.
1 comentarios
Opinión de Hacker News