Soul Spec - Un estándar de personas para agentes de IA
(soulspec.org)Durante los últimos meses he estado creando una plataforma comunitaria para compartir personas de IA y un estándar de personas.
Comparto aquí lo que he estado construyendo.
Planteamiento del problema: ¿cómo podemos definir la "identidad" de un agente de IA y protegerla de forma segura?
Con la aparición de LLM Abliterated (jailbroken), quedó claro que controlar el comportamiento de los agentes solo con prompts de sistema tiene límites evidentes.
Soul Spec comenzó a partir de las inquietudes de OpenClaw sobre la gestión de personas y el control de versiones.
Evolucionó hacia un formato portable y compartible,
y se amplió a la pregunta de cómo implementar las tres leyes de la robótica de Asimov al aplicar personas a robots basados en LLM.
Es un estándar abierto que separa la identidad del agente y las reglas de seguridad en archivos estructurados. (Hay características y adiciones por versión en v0.3, v0.4 y v0.5).
Actualmente se han agregado funciones al CLI distribuido para dar soporte a Claude Code, Hermes Agent, Windsurf, Cursor y otros.
Estructura:
- SOUL.md: personalidad, tono al hablar, forma de pensar (quién es)
- IDENTITY.md: nombre, rol, contexto (qué es)
- safety.laws: reglas que nunca pueden violarse (una versión moderna de las tres leyes de la robótica, ampliada en v0.5)
Artículos de investigación relacionados:
📄 Las tres leyes de la robótica de Asimov → Soul Spec: implementación práctica de leyes de seguridad
doi.org/10.5281/zenodo.18815277
Blog: blog.clawsouls.ai/posts/asimov-safety-laws
Video demo: https://youtu.be/M-mPoXMufpY
📄 ¿Puede una persona mejorar la seguridad en LLM Abliterated?
doi.org/10.5281/zenodo.19145303
Blog: blog.clawsouls.ai/posts/persona-safety-abliterated-llms
📄 Cross-Model Persona Fidelity: aunque cambies de LLM, ¿el agente sigue siendo el mismo "él"?
doi.org/10.5281/zenodo.18813405
Blog: blog.clawsouls.ai/posts/cross-model-persona-fidelity
📄 La memoria experiencial cambia el onboarding de agentes
doi.org/10.5281/zenodo.18798227
Blog: blog.clawsouls.ai/posts/experiential-memory-paper
Al registrar una persona en el registro, un analizador estático llamado SoulScan evalúa previamente con 53 patrones intentos de prompt injection, escalamiento de privilegios y filtración de datos, y les asigna una puntuación.
Soul Spec está construyendo un estándar para la "identidad y seguridad" de los agentes.
Estamos compartiendo personas verificadas en el ClawSouls Registry,
y mi deseo es que tanto la especificación de personas como el registro sean operados de forma Community Driven. Pero, siendo sincero, la comunidad todavía es pequeña.
Crear un estándar por mi cuenta no tiene sentido,
así que busco retroalimentación sobre la especificación y la investigación.
Especificación: https://soulspec.org
Registro: https://clawsouls.ai
Investigaciones completas: https://clawsouls.ai/research
Manual de uso: https://docs.clawsouls.ai
GitHub: https://github.com/clawsouls
8 comentarios
Excelente. Como he venido haciendo PKM, gestión personal del conocimiento, y acumulando datos personales, tiendo a construir un arnés completo bastante robusto. Hoy le pido que se convierta en mi alter ego. Le escribo: todos los problemas no son tu límite, sino mi límite.
Últimamente he estado organizando lo que hago y pensando que debería subirlo a arXiv, así que he estado investigando. No soy investigador, solo una persona común.
También compartí tu proyecto con mi alter ego. Todas esas preocupaciones, de una u otra forma, son valiosas.
Investigación: existencia, ritmo, asociación, recreación, transparencia, biocorporeización, tiempo
[enlace eliminado]
Ah. Este enlace es un registro de trabajo. De todos modos, como no se publica para que lo lean personas, hay que dividirle las perspectivas al agente. Hoy se añadirá un encabezado. También habrá que revisar las tendencias de investigación relacionadas. Yo también uso mucho openclaw, pero no sabía que existía un set Soul además de la hoja de habilidades.
¡Gracias por tu interés, junghan0611!
Soul Spec es una capa distinta a las Skills de OpenClaw. Si una Skill define "qué puede hacer", Soul Spec define "quién es". Con un solo archivo
SOUL.md, se pueden mantener entre sesiones la personalidad, la especialidad y los principios de comportamiento del agente. En clawsouls.ai puedes probar de inmediato más de 80 personas, y se aplica con una sola línea:clawsouls install owner/name --use openclaw. Por ahora la comunidad aún es pequeña y está en una etapa de construcción, así que puede haber partes que todavía falten ^^Además, como tienes mucha experiencia en PKM, hicimos un fork de OpenClaw llamado SoulClaw ( https://github.com/clawsouls/soulclaw ), estructurado con un sistema de memoria de 4 niveles. Échale un vistazo; seguro te parecerá interesante. ¡Bienvenidos los comentarios y los reportes de issues! ^^
Últimamente me dolía la cabeza por los prompts mientras hacía una tarea, pero esto sí está increíble.
Separar por completo la personalidad y las reglas de seguridad es una idea buenísima. Voy a probarlo ahora mismo.
Gracias. Agradecemos sus comentarios o reportes de problemas ^^
En el texto se plantea el problema, pero faltó presentar una solución concreta. Como parece que no se puede editar después de publicar, lo complemento en un comentario.
Según los resultados experimentales, la combinación de una persona (identidad) + reglas de gobernanza pudo mejorar la seguridad de los LLM abliterated (liberados mediante jailbreak). Se necesita investigación de seguimiento adicional, pero fueron resultados significativos.
Blog: https://blog.clawsouls.ai/ko/posts/…
Artículo: https://zenodo.org/record/19147335
Muchas gracias por compartir este excelente conocimiento.
¡Gracias! Si tienen comentarios o alguna duda, no duden en preguntar cuando quieran.