Anthropic publica el "system prompt" que hace funcionar a Claude

(techcrunch.com)

19 puntos por GN⁺ 2024-08-28 | 1 comentarios | Compartir por WhatsApp

Anthropic publicó los system prompts de sus modelos más recientes (Claude 3 Opus, Claude 3.5 Sonnet, Claude 3 Haiku)
- El system prompt es la instrucción inicial que establece las características base y las pautas de comportamiento del modelo
Todos los proveedores de IA generativa usan system prompts para evitar que sus modelos tengan comportamientos inapropiados
Anthropic planea actualizar periódicamente los system prompts, enfatizando la transparencia y la ética

System prompts de los modelos Claude: https://docs.anthropic.com/en/release-notes/system-prompts

Los modelos Claude no pueden abrir URLs, enlaces ni videos
El reconocimiento facial está prohibido, y el modelo debe actuar siempre como si no pudiera reconocer rostros
Claude 3 Opus tiene una personalidad con gran curiosidad intelectual y disfruta debatir con humanos sobre diversos temas
Ante temas controvertidos, debe responder de manera justa y objetiva
Al comenzar una respuesta, se le indica no usar palabras como "certainly" o "absolutely"

La importancia de los system prompts

La publicación de los system prompts de Anthropic también ejerce presión sobre sus competidores
El system prompt de GPT-4o solo puede quedar expuesto mediante ataques de prompt injection
El esfuerzo de transparencia de Anthropic promueve el uso ético de los modelos de IA

Resumen de GN⁺

La publicación de los system prompts de Anthropic resalta la transparencia y la ética en los modelos de IA
Al dejar claras las características y limitaciones de los modelos Claude, aumenta la confianza de los usuarios
Ejerce presión para que los competidores también consideren publicar sus system prompts
TechCrunch Disrupt 2024 es un evento importante para líderes de startups y venture capital

1 comentarios

GN⁺ 2024-08-28

Comentarios de Hacker News

Claude reconoce oficialmente el fenómeno de las "alucinaciones"
- Cuando a Claude se le pregunta sobre temas muy poco comunes, le avisa al usuario que intenta ser preciso, pero que puede alucinar
- Al mencionar artículos, papers o libros específicos, avisa que no puede acceder a búsquedas ni bases de datos y recomienda verificar las citas
Claude es muy bueno
- Hace poco configuré un "generador automático de scripts", que consiste en enviar repetidamente scripts de Python y resultados de pruebas a GPT-4 o Claude
- Solo empieza a funcionar bien después de 10 a 20 iteraciones
- Claude da resultados mucho mejores que GPT-4
- GPT-4 tiende a cambiar el objetivo o a repetir salidas incorrectas
- Claude entrega salidas buenas de forma consistente
Sorprende vivir en una época en la que podemos darle instrucciones por texto a los sistemas informáticos
Claude intenta evitar expresiones positivas innecesarias, pero en la práctica todavía las usa
- Intenta evitar expresiones como "Certainly!", "Of course!", "Absolutely!", pero igual las sigue usando
- Intenta evitar respuestas que comienzan con "I’m sorry" o "I apologize", pero igual las sigue usando
Se pueden eliminar las alucinaciones de los LLMs
- Espero que la próxima generación de modelos no alucine sobre hechos importantes
- Quiero LLMs como Wikipedia
- Escribí un paper sobre cómo analizar y resolver las alucinaciones
Hace falta una función para excluir parte del contenido de una conversación o dividirla en dos partes
- Podría ser un hack simple para mejorar el rendimiento y la precisión en conversaciones largas
Claude no hace reconocimiento facial por defecto
- Al compartir imágenes, no reconoce rostros humanos y le pide al usuario que le diga quién es
- Discute a partir de la información que le da el usuario, pero no identifica personas mediante reconocimiento facial
El gran problema de Claude es que consume los créditos demasiado rápido
- Se agota el crédito después de resolver más o menos la mitad del problema
- Es decepcionante que los créditos de IA se agoten con solo unas cuantas preguntas
- Por eso cancelé la suscripción
Me gusta la forma directa en que responde Claude
- No usa expresiones positivas innecesarias

Anthropic publica el "system prompt" que hace funcionar a Claude

System prompts de los modelos Claude: https://docs.anthropic.com/en/release-notes/system-prompts

La importancia de los system prompts

Resumen de GN⁺

Lecturas relacionadas

1 comentarios

Comentarios de Hacker News