En el uso de GPT, los prompts concisos dan mejores resultados
- GPT puede confundirse más si se explicita en exceso dentro del prompt contenido que ya conoce por sentido común
- Por ejemplo, en una tarea de clasificar el estado mencionado en un texto, pedir simplemente el nombre del estado da resultados más precisos que proporcionar la lista de los 50 estados
Solo con la chat API de OpenAI ya es posible implementar funciones suficientemente diversas y potentes
- Sin herramientas adicionales como Langchain, se pueden implementar fácilmente funciones necesarias como la extracción de JSON usando solo la chat API
- Incluso al actualizar el modelo GPT, basta con modificar una sola cadena en el codebase
- Solo hace falta agregar lógica simple para manejar errores de la API de OpenAI y límites de longitud de entrada
Es difícil manejar los casos en que GPT no encuentra nada
- En prompts como "si no encuentras nada, devuelve un valor vacío", GPT a menudo inventa cosas o muestra poca confianza
- La solución es no enviar un prompt a GPT cuando la entrada está vacía
GPT solo puede generar salidas de longitud limitada
- El límite de entrada de GPT-4 es de 128k tokens, pero su límite de salida es de apenas 4k tokens
- Al pedir una lista de objetos JSON, a GPT le cuesta generar de forma estable más de 10 ítems
Las bases de datos vectoriales y RAG/embeddings no ayudan mucho para usos generales
- Para usos distintos de la búsqueda, RAG no funciona bien
- Su utilidad práctica cae por dificultades para juzgar la relevancia, problemas de aislamiento de datos y menor satisfacción del usuario, entre otras razones
- Para búsqueda general, son más adecuados la búsqueda facetada con GPT o la generación de consultas complejas
En la práctica, GPT no genera alucinaciones (hallucinations)
- En tareas de extraer información de un texto dado, GPT ofrece resultados muy confiables
- Sin embargo, cuando la información no está en el texto, puede inventarla
- Por eso es importante proporcionar suficiente contexto y manejar bien las respuestas de GPT
Opinión de GN⁺
- Parece difícil llegar a la AGI solo con modelos transformer, datos web e infraestructura a gran escala
- GPT-4 es claramente útil, pero para avanzar más allá probablemente hará falta innovar en la propia arquitectura del modelo
- Las alternativas fuera de OpenAI todavía parecen no estar al nivel de GPT, así que al final habrá que seguir de cerca las nuevas versiones de GPT
- Se espera que el rendimiento de GPT-5 no sea revolucionario frente a GPT-4. Parece que la relación costo-beneficio está llegando a su límite
- Por eso, por ahora parece una opción realista enfocarse en aprovechar GPT-4 para diseñar prompts óptimos y sus aplicaciones
1 comentarios
Opiniones de Hacker News
sufficient information, puede plantear una hipótesis, pero debe indicarlo claramente y presentar la evidencia y la base lógica) y luego se le pide evaluar su propia respuesta.null: