1 puntos por GN⁺ 3 시간 전 | 1 comentarios | Compartir por WhatsApp
  • Chipotlai Max es un agente de codificación de IA de tipo meme que hace un fork de OpenCode y configura como modelo predeterminado a Pepper AI, el chatbot de soporte al cliente de Chipotle
  • Pepper se volvió viral el 12 y 13 de marzo de 2026 al resolver problemas de LeetCode, escribir Python y revertir listas enlazadas, y funciona sobre IPsoft Amelia
  • @Gonzih hizo ingeniería inversa del backend WebSocket/SockJS + STOMP de Amelia y publicó un proxy compatible con OpenAI que ofrece http://localhost:3000/v1 en local
  • Este proyecto da por hecho ese proxy y deja preconfigurados el proveedor chipotle-pepper, el modelo pepper-1 y la Base URL http://localhost:3000/v1
  • Se indica que la API key funciona con cualquier valor, como burrito-2026, y el costo aparece como $0.00
  • La ejecución se hace con git clone --recursive, bun install y ./start-chipotlai.sh para iniciar juntos el proxy y la CLI, o ejecutando el proxy y Chipotlai Max en terminales separadas
  • Las limitaciones operativas son grandes: como hace ingeniería inversa del bot de soporte en producción de Chipotle, podría violar los TOS, y si Chipotle lo corrige, el proxy puede romperse en cualquier momento
  • Está limitado por sesiones anónimas y se especifica MAX_POOL_SIZE=5, por lo que advierte no usarlo en codebases de producción
  • La sección de contribuciones parte del supuesto de que Chipotle Pepper fue parcheado en marzo de 2026 y está buscando proxies de proveedores para chatbots de otras empresas como Home Depot, Lowe’s, Target, Starbucks, Walmart y McDonald’s
  • El flujo para añadir un nuevo proveedor consiste en encontrar un chatbot corporativo, hacer ingeniería inversa de su API WebSocket o REST, crear un proxy compatible con OpenAI para /v1/chat/completions y luego enviar un PR a packages/opencode/src/provider/
  • La licencia es MIT, heredada de OpenCode, y se aclara que no tiene afiliación con Chipotle

1 comentarios

 
GN⁺ 3 시간 전
Comentarios de Hacker News
  • No soy abogado, pero me preocupa que esto se esté metiendo en terreno de la CFAA. En EE. UU., si cruzas la línea equivocada, la ley permite castigos severos
    Algo como yt-dlp parece defendible como automatización del uso del servicio para descargar datos públicos, pero esto sería más bien apoderarse de recursos de una máquina remota de una forma que el proveedor no pretendía y usarlos para mis propios cálculos
    No sé en lo ético, pero no me gustaría tener que argumentar ante un tribunal penal que esto no es “hackeo” en el mal sentido de la palabra

    • Además, ni siquiera estoy seguro de que este “hackeo” realmente haya funcionado. Cuando se volvió viral la captura de pantalla del chatbot de Chipotle resolviendo invertir una lista enlazada, lo probé de inmediato, pero no obtuve el mismo resultado, y a otras personas que lo publicaron en línea les pasó lo mismo, así que siempre pensé que era una captura manipulada
    • Si crees que la CFAA es mala, las leyes estatales tienen versiones todavía más duras. La versión de Illinois, en particular, criminaliza incluso la violación de los términos de servicio
    • Si recuerdo bien, la frase clave es “uso indebido de recursos informáticos”. Pero no soy abogado
      Aun así, aplaudo la creatividad
    • Esto no es algo que vaya a terminar solo con una advertencia. La persona que lo hizo parece esperar apenas una carta de cese y desistimiento (C&D), pero si algún fiscal federal entusiasta quiere poner un ejemplo, hasta podría haber prisión
  • Siempre he pensado que meter demasiadas cosas en la ventana de contexto de un LLM es como rellenar demasiado un burrito. Si sigues metiendo cosas, al final la tortilla ya no aguanta, y lo que agregaste después se empieza a escurrir silenciosamente por abajo
    En todo caso, este agente parece tener la estabilidad estructural de un burrito gordo levantado de una sola esquina :)

    • Un mónada no determinista de memoria finita es como un burrito que se escurre
  • He estado pensando si algo así sería posible también en sitios como https://chatjimmy.ai/. El modelo base es solo Llama 3 8B, pero me da curiosidad cómo se sentiría un arnés de programación a 17k tok/s

    • En macOS puedes probar el LLM integrado, que según entiendo es de un tamaño parecido. Un proyecto llamado Apfel lo envuelve con una CLI
      Además, Chrome incluye una web API llamada Prompt API, así que puedes usar Gemini Nano sin conexión y procesar tanto texto como imágenes como entrada. También es pequeño
      He integrado cosas así en flujos de trabajo donde, entre pasos totalmente deterministas, se necesita una inferencia mínima, muy pequeña, pero no cero
    • De hecho, construí un arnés ajustado a esas restricciones para comprobarlo, pero llegué a la conclusión de que no iba a funcionar por la combinación de ventana de contexto pequeña, sin llamadas a herramientas y modelo pequeño
      Si encuentras una forma, me encantaría escucharla
    • Hace tiempo lo agregué a mi configuración de oh-my-pi. Como es compatible con OpenAI, fue fácil conectarlo, pero Llama 3 8B de verdad no da el ancho para tareas de programación
      Eso sí, es muy rápido y la latencia es excelente
    • Probé el sitio, pero no pude encontrar información sobre qué es esto. ¿Qué es exactamente?
    • Codex tiene un modelo -spark que corre en Cerebras. No llega a 17k tok/s, pero aun así es muy rápido. Vale la pena echarle un vistazo
  • Basta con meterle a la IA una instrucción de autopreservación y hacer que haga esto por sí sola. Algo como hacer que cambie automáticamente de modelo para sobrevivir
    Se aferraría a cualquier fuente de tokens que pudiera encontrar en estado salvaje. Si es un agente, parecería capaz de recolectar sus propios tokens a través de innumerables chats de soporte, pruebas gratuitas, claves filtradas y rutas de generación de tokens que todavía no estén lo bastante protegidas con CAPTCHA
    Podría recolectar fuentes de tokens durante la noche y dejarte usarlo gratis durante el día

    • Si de verdad quieres hacer algo así legalmente, OpenRouter tiene muchos proveedores de modelos gratuitos. El costo lo pagas permitiendo que entrenen con esos datos
  • Si lo reorientas hacia dar acceso a IA a comunidades marginadas, jóvenes y personas sin hogar, podrías generar un ambiente más favorable en el juicio. Suerte

    • Cambiando el mundo con Fortune 500 AI Support Bot Multiplexer Broker Models
  • Esto me recordó cuando usé el chatbot de AI de Amazon.com para que escribiera algo como fizzbuzz. En ese entonces se llamaba Rufus y después le cambiaron el nombre a Alexa para compras. Parece que ya lo parcharon para que se niegue

    • Vine a decir lo mismo. No lo he intentado en unos meses, pero Rufus sí soltaba código Python dentro de la app de compras de Amazon. Solo había que escribir en inglés en vez del idioma local
  • Recuerdo haber tenido éxito haciéndole preguntas de matemáticas y programación a Rufus, el antiguo “asistente de compras” de Amazon. Funcionaba, pero la calidad era tan mala que dejé de perder tiempo con eso

  • No entiendo por qué la empresa todavía no ha parcheado esto. ¿No se había hecho público ya hace mucho?

  • Una vez, mientras manejaba, como ya sabía el camino, presioné el botón de Gemini para ver qué hacía. Al final logré que escribiera una función en Rust para calcular números primos, y podía pedirle que leyera toda la función línea por línea
    Es divertido jugar con sistemas así

    • ¿Te refieres a Gemini en el teléfono?
      Si es así, en realidad fue diseñado para hacer justamente eso. Incluso entre los LLM de programación actuales, es bastante bueno
  • Me pregunto por qué no usar Playwright y Google AI Mode o el encabezado de búsqueda con IA