1 puntos por k08200 4 시간 전 | Aún no hay comentarios. | Compartir por WhatsApp

Últimamente, todas las herramientas de "email con IA" van en la misma dirección. Te ponen un borrador en cada correo, le pegan una insignia de "la IA dice que respondas" y le agregan un botón de envío automático. ¿El resultado? El inbox no se vuelve más silencioso, sino más ruidoso. Es como poner otra pantalla encima de la pantalla.

Yo lo hice al revés. En lugar de dejarle el inbox a la IA, construí un firewall para frenar a la IA. Klorn emite exactamente una clasificación por cada correo entrante y no muestra nada más.

4 niveles — SILENT (solo registro, no se muestra) / QUEUE (se ve en la cola, sin notificaciones) / PUSH (de verdad te despierta) / AUTO (por ahora solo clasifica; la ejecución está desconectada intencionalmente).

La clave — el LLM no toma decisiones. Para cada correo solo puntúa 4 números (confianza, confianza en el remitente, reversibilidad, urgencia), y reglas determinísticas legibles para humanos los mapean a un nivel. Así, la política puede auditarse y probarse incluso sin modelo, y aunque el LLM se caiga, un fallback por palabras clave genera los mismos números para dejar pasar los correos urgentes.

Y lo irreversible jamás se le deja a la IA. Tres cosas — enviar, borrar permanentemente y reenviar a externos — quedan detrás de un piso determinístico: en el momento de la aprobación, los bytes que se van a enviar se fijan en un receipt, y si al ejecutar cambia aunque sea un byte, lanza un error. La ruta autónoma falla en cerrado. Aunque la IA insista en que "ya lo envió", si los bytes no coinciden, no sale.

También medí directamente la parte de "la IA es magia". En tareas de clasificación, un modelo mucho más barato fue más preciso que GPT-4o. Para esto no hace falta un modelo genio, sino consistencia para leer las mismas 4 señales de la misma forma cada vez (números y fundamentos en los artículos de abajo).

Open source bajo AGPLv3, funciona con cualquier endpoint compatible con OpenAI (con Ollama, los correos no salen de mi máquina). Siendo honestos, es un PoC temprano: cerca de 80% de coincidencia en 50 correos reales míos (una sola corrida, con mi propia línea base), por ahora el único usuario real soy yo, y la ejecución AUTO está apagada a propósito. Si exagero, en el primer comentario me destrozan.

Artículo de diseño (serie con discusión de arquitectura entre ingenieros):

Por qué un modelo barato le ganó a GPT-4o: https://dev.to/k08200/…
Por qué el LLM solo puntúa y no decide: https://dev.to/k08200/…
Piso determinístico para acciones irreversibles: https://dev.to/k08200/…
Repo: https://github.com/k08200/klorn (docker-compose + configuración de LLM local). La demo está en modo de prueba de OAuth (100 personas), así que hacer self-host es lo más rápido.

Aún no hay comentarios.

Aún no hay comentarios.