- Una guía que comparte estrategias y técnicas para obtener mejores resultados con modelos de lenguaje a gran escala (también llamados modelos GPT)
- Los métodos explicados aquí a veces pueden combinarse para lograr un efecto mayor, y se recomienda experimentar para encontrar el enfoque más adecuado
- Se pueden explorar prompts de ejemplo para aprender qué puede hacer el modelo
Seis estrategias para obtener mejores resultados
Escribir instrucciones claras
- Como el modelo no puede leer la mente, hay que pedir con claridad lo que se quiere.
- Incluir detalles para obtener respuestas más relevantes, pedirle al modelo que interprete a un personaje específico o usar delimitadores para indicar con claridad las partes diferenciadas de la entrada.
- Especificar los pasos necesarios para completar la tarea, proporcionar ejemplos e indicar la longitud deseada de la salida.
Proporcionar texto de referencia
- Los modelos de lenguaje pueden inventar respuestas falsas con seguridad, especialmente cuando se les piden temas difíciles, citas o URL.
- Indicarle al modelo que responda usando un texto de referencia, o que responda citando a partir de ese texto.
Dividir tareas complejas en subtareas simples
- Así como descomponer sistemas complejos en componentes modulares es una buena práctica en ingeniería de software, lo mismo aplica a las tareas que se entregan a un modelo de lenguaje.
- Las tareas complejas tienen una tasa de error más alta y a menudo pueden redefinirse como un flujo de trabajo de tareas simples.
- Usar clasificación de intención para identificar las instrucciones más relevantes para la consulta del usuario y, en el caso de aplicaciones conversacionales que requieren diálogos muy largos, resumir o filtrar conversaciones previas.
- Resumir documentos largos por partes y construir de forma recursiva un resumen general.
Darle al modelo "tiempo para pensar"
- Si se le pide al modelo una "cadena de pensamiento" antes de redactar la respuesta, en lugar de apresurarse a responder, puede producir respuestas más confiables.
- Indicarle al modelo que primero formule su propia solución y usar un monólogo interno o una serie de consultas para ocultar el proceso de razonamiento del modelo.
- Preguntarle al modelo si hay algo que haya pasado por alto en una iteración anterior.
Usar herramientas externas
- Proporcionar al modelo la salida de otras herramientas para compensar sus debilidades.
- Implementar recuperación eficiente de conocimiento mediante búsqueda basada en embeddings, usar ejecución de código para realizar cálculos más precisos o llamar APIs externas.
- Permitir que el modelo tenga acceso a funciones específicas.
Probar sistemáticamente los cambios
- Mejorar el rendimiento es más fácil cuando puede medirse.
- Es necesario definir una suite de pruebas integral (o "eval") para verificar si los cambios tienen un impacto positivo en el rendimiento general.
- Evaluar comparando la salida del modelo con respuestas de referencia.
Opinión de GN⁺
- Lo más importante: la ingeniería de prompts es un método clave para optimizar el rendimiento de los modelos de lenguaje, ya que permite comprender con precisión la intención del usuario y ofrecer instrucciones concretas para obtener los resultados deseados.
- Por qué resulta interesante: estas estrategias hacen más efectivo el uso de modelos de lenguaje de inteligencia artificial y permiten lograr un mejor desempeño, especialmente en modelos recientes como GPT-4.
- Punto destacable: esta guía ofrece ejemplos y estrategias concretas que ayudan a resolver problemas comunes que puede enfrentar un ingeniero de software principiante al usar modelos de lenguaje, y muestra cómo aprovecharlos de forma más efectiva en el trabajo real.
2 comentarios
Buenas prácticas de GPT de OpenAI: resumen. 6 estrategias para redactar prompts y obtener mejores respuestas
Opiniones de Hacker News
Discusión sobre el prompt de sistema de ChatGPT
Experiencia al pedir una cheeseburger en español
Discusión sobre las características de los LLM (Large Language Models)
Dudas sobre aprender a escribir prompts
Comparación entre el prompt engineering y las consultas avanzadas de búsqueda de Google
Comparación entre los prompts de búsqueda en Google y los prompts para LLM
Fallas en la comunicación entre humanos y límites de los LLM
Crítica al término "prompt engineering"
El papel de los LLM al enseñar comunicación clara a los humanos
Facilidad de implementar apps de chat basadas en LLM