1 puntos por GN⁺ 6 일 전 | 1 comentarios | Compartir por WhatsApp
  • Proyecto meme que usa Pepper, el chatbot de soporte al cliente de Chipotle, como modelo de código para ejecutar inferencia gratis sobre un fork de OpenCode
  • Se volvió masivamente viral al descubrirse que Pepper resolvía problemas de LeetCode, escribía Python e incluso invertía listas enlazadas
  • Este chatbot no está basado en Claude ni GPT, sino en IPsoft Amelia; se aprovecha la ingeniería inversa de su backend, publicada como proxy compatible con OpenAI
    • Este proxy corre en local y expone una API compatible con OpenAI en http://localhost:3000/v1, y no requiere ninguna API key
  • Se hizo un fork de OpenCode (MIT) para dejar Pepper hardcodeado como modelo predeterminado y aplicarle los colores de marca de Chipotle
  • Como implica hacer ingeniería inversa del bot de soporte en producción de Chipotle, existe riesgo de violar los TOS y de que bloqueen el proxy, por lo que se indica usarlo solo con fines educativos y de meme
  • Chipotle Pepper fue parcheado en marzo de 2026, así que ahora están buscando proxies de otros proveedores de chatbots corporativos como Home Depot, Lowe’s, Target, Starbucks, Walmart y McDonald’s

1 comentarios

 
GN⁺ 6 일 전
Comentarios de Hacker News
  • No soy abogado, pero me preocupa que esto se esté metiendo en terreno de la CFAA. En EE. UU., si cruzas la línea equivocada, la ley permite castigos severos
    Algo como yt-dlp parece defendible como automatización del uso del servicio para descargar datos públicos, pero esto sería más bien apoderarse de recursos de una máquina remota de una forma que el proveedor no pretendía y usarlos para mis propios cálculos
    No sé en lo ético, pero no me gustaría tener que argumentar ante un tribunal penal que esto no es “hackeo” en el mal sentido de la palabra

    • Además, ni siquiera estoy seguro de que este “hackeo” realmente haya funcionado. Cuando se volvió viral la captura de pantalla del chatbot de Chipotle resolviendo invertir una lista enlazada, lo probé de inmediato, pero no obtuve el mismo resultado, y a otras personas que lo publicaron en línea les pasó lo mismo, así que siempre pensé que era una captura manipulada
    • Si crees que la CFAA es mala, las leyes estatales tienen versiones todavía más duras. La versión de Illinois, en particular, criminaliza incluso la violación de los términos de servicio
    • Si recuerdo bien, la frase clave es “uso indebido de recursos informáticos”. Pero no soy abogado
      Aun así, aplaudo la creatividad
    • Esto no es algo que vaya a terminar solo con una advertencia. La persona que lo hizo parece esperar apenas una carta de cese y desistimiento (C&D), pero si algún fiscal federal entusiasta quiere poner un ejemplo, hasta podría haber prisión
  • Siempre he pensado que meter demasiadas cosas en la ventana de contexto de un LLM es como rellenar demasiado un burrito. Si sigues metiendo cosas, al final la tortilla ya no aguanta, y lo que agregaste después se empieza a escurrir silenciosamente por abajo
    En todo caso, este agente parece tener la estabilidad estructural de un burrito gordo levantado de una sola esquina :)

    • Un mónada no determinista de memoria finita es como un burrito que se escurre
  • He estado pensando si algo así sería posible también en sitios como https://chatjimmy.ai/. El modelo base es solo Llama 3 8B, pero me da curiosidad cómo se sentiría un arnés de programación a 17k tok/s

    • En macOS puedes probar el LLM integrado, que según entiendo es de un tamaño parecido. Un proyecto llamado Apfel lo envuelve con una CLI
      Además, Chrome incluye una web API llamada Prompt API, así que puedes usar Gemini Nano sin conexión y procesar tanto texto como imágenes como entrada. También es pequeño
      He integrado cosas así en flujos de trabajo donde, entre pasos totalmente deterministas, se necesita una inferencia mínima, muy pequeña, pero no cero
    • De hecho, construí un arnés ajustado a esas restricciones para comprobarlo, pero llegué a la conclusión de que no iba a funcionar por la combinación de ventana de contexto pequeña, sin llamadas a herramientas y modelo pequeño
      Si encuentras una forma, me encantaría escucharla
    • Hace tiempo lo agregué a mi configuración de oh-my-pi. Como es compatible con OpenAI, fue fácil conectarlo, pero Llama 3 8B de verdad no da el ancho para tareas de programación
      Eso sí, es muy rápido y la latencia es excelente
    • Probé el sitio, pero no pude encontrar información sobre qué es esto. ¿Qué es exactamente?
    • Codex tiene un modelo -spark que corre en Cerebras. No llega a 17k tok/s, pero aun así es muy rápido. Vale la pena echarle un vistazo
  • Basta con meterle a la IA una instrucción de autopreservación y hacer que haga esto por sí sola. Algo como hacer que cambie automáticamente de modelo para sobrevivir
    Se aferraría a cualquier fuente de tokens que pudiera encontrar en estado salvaje. Si es un agente, parecería capaz de recolectar sus propios tokens a través de innumerables chats de soporte, pruebas gratuitas, claves filtradas y rutas de generación de tokens que todavía no estén lo bastante protegidas con CAPTCHA
    Podría recolectar fuentes de tokens durante la noche y dejarte usarlo gratis durante el día

    • Si de verdad quieres hacer algo así legalmente, OpenRouter tiene muchos proveedores de modelos gratuitos. El costo lo pagas permitiendo que entrenen con esos datos
  • Si lo reorientas hacia dar acceso a IA a comunidades marginadas, jóvenes y personas sin hogar, podrías generar un ambiente más favorable en el juicio. Suerte

    • Cambiando el mundo con Fortune 500 AI Support Bot Multiplexer Broker Models
  • Esto me recordó cuando usé el chatbot de AI de Amazon.com para que escribiera algo como fizzbuzz. En ese entonces se llamaba Rufus y después le cambiaron el nombre a Alexa para compras. Parece que ya lo parcharon para que se niegue

    • Vine a decir lo mismo. No lo he intentado en unos meses, pero Rufus sí soltaba código Python dentro de la app de compras de Amazon. Solo había que escribir en inglés en vez del idioma local
  • Recuerdo haber tenido éxito haciéndole preguntas de matemáticas y programación a Rufus, el antiguo “asistente de compras” de Amazon. Funcionaba, pero la calidad era tan mala que dejé de perder tiempo con eso

  • No entiendo por qué la empresa todavía no ha parcheado esto. ¿No se había hecho público ya hace mucho?

  • Una vez, mientras manejaba, como ya sabía el camino, presioné el botón de Gemini para ver qué hacía. Al final logré que escribiera una función en Rust para calcular números primos, y podía pedirle que leyera toda la función línea por línea
    Es divertido jugar con sistemas así

    • ¿Te refieres a Gemini en el teléfono?
      Si es así, en realidad fue diseñado para hacer justamente eso. Incluso entre los LLM de programación actuales, es bastante bueno
  • Me pregunto por qué no usar Playwright y Google AI Mode o el encabezado de búsqueda con IA