SongRyeon Core - experimento de runtime de agente local que separa lo que escribió el LLM de la información verificada por código
(github.com/Junghoo-developer)Hola. Soy Junghoo y, mientras aprendo a programar, estoy experimentando directamente con runtimes de agentes de IA.
SongRyeon Core es un pequeño experimento local-first de agent runtime que maneja por separado “los juicios que dice el LLM” y “los hechos que el código realmente verificó”.
Últimamente, al crear agentes basados en LLM, sentí que aparecen con frecuencia los siguientes problemas.
- El contenido que el LLM infiere se muestra como si fueran hechos del sistema
- Los
fallbacko heurísticas creados por el código se mezclan como si fueran juicios del LLM - La cantidad de documentos leídos y qué ejecuciones ocurrieron realmente se muestran distinto en cada pantalla
- La respuesta final no coincide con el estado interno del runtime
Por eso, en este proyecto la información se divide y se maneja en tres grandes categorías.
- Información absoluta: valores que pueden verificarse mediante código/trace/schema/tool result
- Información relativa: juicio del LLM que corresponde a una sola pieza de información absoluta
- Información mixta: juicio del LLM basado en varios
source bundle
Por ahora sigue siendo una versión pequeña de práctica, pero estoy experimentando con una estructura como la siguiente.
- node_0 memory supplier
- node_1 router
- L loop
- node_3 reporter
- node_4 verifier
- validación de regresión basada en smoke-test
- verificación de honestidad del runtime terminal/final renderer
Más que hacer una “demo impresionante”, el objetivo es construir un runtime pequeño que oculte lo menos posible con qué fundamentos el agente de IA dijo cada cosa.
Todavía sigo aprendiendo a programar, así que hay muchas partes toscas.
Agradecería muchísimo cualquier retroalimentación sobre la estructura, el README, las pruebas, la definición de términos y el diseño del agent runtime.
1 comentarios
Información adicional.
Por ahora, SongRyeon Core es más un experimento de runtime enfocado en CLI local /
smoke-testque un servicio web.Lo que pueden revisar de inmediato es la forma de ejecución en el README y:
Eso es todo.
En particular, me gustaría recibir retroalimentación sobre lo siguiente.
code-verified factparece útil en un runtime real de agentesComo todavía es un proyecto en aprendizaje, hay muchas partes toscas. Les agradecería mucho que me señalaran lo que vean con confianza.