1 puntos por anima 4 시간 전 | 1 comentarios | Compartir por WhatsApp

Hola. Soy Junghoo y, mientras aprendo a programar, estoy experimentando directamente con runtimes de agentes de IA.

SongRyeon Core es un pequeño experimento local-first de agent runtime que maneja por separado “los juicios que dice el LLM” y “los hechos que el código realmente verificó”.

Últimamente, al crear agentes basados en LLM, sentí que aparecen con frecuencia los siguientes problemas.

  • El contenido que el LLM infiere se muestra como si fueran hechos del sistema
  • Los fallback o heurísticas creados por el código se mezclan como si fueran juicios del LLM
  • La cantidad de documentos leídos y qué ejecuciones ocurrieron realmente se muestran distinto en cada pantalla
  • La respuesta final no coincide con el estado interno del runtime

Por eso, en este proyecto la información se divide y se maneja en tres grandes categorías.

  • Información absoluta: valores que pueden verificarse mediante código/trace/schema/tool result
  • Información relativa: juicio del LLM que corresponde a una sola pieza de información absoluta
  • Información mixta: juicio del LLM basado en varios source bundle

Por ahora sigue siendo una versión pequeña de práctica, pero estoy experimentando con una estructura como la siguiente.

  • node_0 memory supplier
  • node_1 router
  • L loop
  • node_3 reporter
  • node_4 verifier
  • validación de regresión basada en smoke-test
  • verificación de honestidad del runtime terminal/final renderer

Más que hacer una “demo impresionante”, el objetivo es construir un runtime pequeño que oculte lo menos posible con qué fundamentos el agente de IA dijo cada cosa.

Todavía sigo aprendiendo a programar, así que hay muchas partes toscas.
Agradecería muchísimo cualquier retroalimentación sobre la estructura, el README, las pruebas, la definición de términos y el diseño del agent runtime.

GitHub:
https://github.com/Junghoo-developer/SongRyeon

1 comentarios

 
anima 4 시간 전

Información adicional.

Por ahora, SongRyeon Core es más un experimento de runtime enfocado en CLI local / smoke-test que un servicio web.

Lo que pueden revisar de inmediato es la forma de ejecución en el README y:

  • python -m compileall songryeon_core main.py
  • python main.py smoke-test

Eso es todo.

En particular, me gustaría recibir retroalimentación sobre lo siguiente.

  • si la distinción entre información absoluta / información relativa / información mixta resulta convincente a nivel de diseño
  • si la forma de separar el juicio del LLM y los code-verified fact parece útil en un runtime real de agentes
  • qué partes del README son difíciles de entender para alguien que lo ve por primera vez

Como todavía es un proyecto en aprendizaje, hay muchas partes toscas. Les agradecería mucho que me señalaran lo que vean con confianza.