Chipotlai Max - un agente de código de IA meme que usa Chipotle Pepper AI como modelo base
(github.com/cyberpapiii)- Proyecto meme que usa Pepper, el chatbot de soporte al cliente de Chipotle, como modelo de código para ejecutar inferencia gratis sobre un fork de OpenCode
- Se volvió masivamente viral al descubrirse que Pepper resolvía problemas de LeetCode, escribía Python e incluso invertía listas enlazadas
- Este chatbot no está basado en Claude ni GPT, sino en IPsoft Amelia; se aprovecha la ingeniería inversa de su backend, publicada como proxy compatible con OpenAI
- Este proxy corre en local y expone una API compatible con OpenAI en
http://localhost:3000/v1, y no requiere ninguna API key
- Este proxy corre en local y expone una API compatible con OpenAI en
- Se hizo un fork de OpenCode (MIT) para dejar Pepper hardcodeado como modelo predeterminado y aplicarle los colores de marca de Chipotle
- Como implica hacer ingeniería inversa del bot de soporte en producción de Chipotle, existe riesgo de violar los TOS y de que bloqueen el proxy, por lo que se indica usarlo solo con fines educativos y de meme
- Chipotle Pepper fue parcheado en marzo de 2026, así que ahora están buscando proxies de otros proveedores de chatbots corporativos como Home Depot, Lowe’s, Target, Starbucks, Walmart y McDonald’s
1 comentarios
Comentarios de Hacker News
No soy abogado, pero me preocupa que esto se esté metiendo en terreno de la CFAA. En EE. UU., si cruzas la línea equivocada, la ley permite castigos severos
Algo como
yt-dlpparece defendible como automatización del uso del servicio para descargar datos públicos, pero esto sería más bien apoderarse de recursos de una máquina remota de una forma que el proveedor no pretendía y usarlos para mis propios cálculosNo sé en lo ético, pero no me gustaría tener que argumentar ante un tribunal penal que esto no es “hackeo” en el mal sentido de la palabra
Aun así, aplaudo la creatividad
Siempre he pensado que meter demasiadas cosas en la ventana de contexto de un LLM es como rellenar demasiado un burrito. Si sigues metiendo cosas, al final la tortilla ya no aguanta, y lo que agregaste después se empieza a escurrir silenciosamente por abajo
En todo caso, este agente parece tener la estabilidad estructural de un burrito gordo levantado de una sola esquina :)
He estado pensando si algo así sería posible también en sitios como https://chatjimmy.ai/. El modelo base es solo Llama 3 8B, pero me da curiosidad cómo se sentiría un arnés de programación a 17k tok/s
Además, Chrome incluye una web API llamada Prompt API, así que puedes usar Gemini Nano sin conexión y procesar tanto texto como imágenes como entrada. También es pequeño
He integrado cosas así en flujos de trabajo donde, entre pasos totalmente deterministas, se necesita una inferencia mínima, muy pequeña, pero no cero
Si encuentras una forma, me encantaría escucharla
Eso sí, es muy rápido y la latencia es excelente
-sparkque corre en Cerebras. No llega a 17k tok/s, pero aun así es muy rápido. Vale la pena echarle un vistazoBasta con meterle a la IA una instrucción de autopreservación y hacer que haga esto por sí sola. Algo como hacer que cambie automáticamente de modelo para sobrevivir
Se aferraría a cualquier fuente de tokens que pudiera encontrar en estado salvaje. Si es un agente, parecería capaz de recolectar sus propios tokens a través de innumerables chats de soporte, pruebas gratuitas, claves filtradas y rutas de generación de tokens que todavía no estén lo bastante protegidas con CAPTCHA
Podría recolectar fuentes de tokens durante la noche y dejarte usarlo gratis durante el día
Si lo reorientas hacia dar acceso a IA a comunidades marginadas, jóvenes y personas sin hogar, podrías generar un ambiente más favorable en el juicio. Suerte
Esto me recordó cuando usé el chatbot de AI de Amazon.com para que escribiera algo como
fizzbuzz. En ese entonces se llamaba Rufus y después le cambiaron el nombre a Alexa para compras. Parece que ya lo parcharon para que se niegueRecuerdo haber tenido éxito haciéndole preguntas de matemáticas y programación a Rufus, el antiguo “asistente de compras” de Amazon. Funcionaba, pero la calidad era tan mala que dejé de perder tiempo con eso
No entiendo por qué la empresa todavía no ha parcheado esto. ¿No se había hecho público ya hace mucho?
Una vez, mientras manejaba, como ya sabía el camino, presioné el botón de Gemini para ver qué hacía. Al final logré que escribiera una función en Rust para calcular números primos, y podía pedirle que leyera toda la función línea por línea
Es divertido jugar con sistemas así
Si es así, en realidad fue diseñado para hacer justamente eso. Incluso entre los LLM de programación actuales, es bastante bueno
Me pregunto por qué no usar Playwright y Google AI Mode o el encabezado de búsqueda con IA