5 puntos por GN⁺ 2026-01-28 | 1 comentarios | Compartir por WhatsApp
  • El entorno de ejecución de contenedores de ChatGPT se amplió a gran escala, y ahora permite ejecutar comandos de Bash, instalar paquetes con pip/npm y descargar archivos
  • Al entorno previo, centrado en Python, se sumaron más de 10 lenguajes, como Node.js, Ruby, Go, Java, Swift, Kotlin, C y C++, con soporte para ejecución de código multilenguaje
  • El acceso a redes externas sigue restringido, pero se configuró para que pip install y npm install funcionen a través de un proxy interno de OpenAI
  • La nueva herramienta container.download puede obtener archivos desde URLs públicas y guardarlos dentro del contenedor, pasando por un proceso de validación de seguridad
  • Esta mejora amplía de forma importante las capacidades de ejecución de código y procesamiento de datos de ChatGPT, y subraya la necesidad de documentación oficial

Principales ampliaciones de los contenedores de ChatGPT

  • ChatGPT ahora puede ejecutar comandos de Bash directamente; antes solo podía ejecutar código Python
    • Esto deja atrás la ejecución indirecta mediante el módulo subprocess de Python y permite control a nivel de línea de comandos
  • Se añadió un entorno de Node.js, lo que permite ejecutar JavaScript; también se probó con éxito Ruby, Perl, PHP, Go, Java, Swift, Kotlin, C y C++
    • Rust todavía no es compatible
  • El contenedor aún no puede hacer solicitudes directas a redes externas, pero pip install y npm install funcionan mediante un proxy
  • Con la herramienta container.download es posible descargar archivos de la web a una ruta específica
    • ChatGPT puede identificar la URL, guardar ese archivo en el entorno sandbox y luego procesarlo

Función de container.download

  • container.download es una herramienta que obtiene archivos desde URLs de acceso público y los guarda en el sistema de archivos del contenedor
  • Los archivos descargados pueden recibir posprocesamiento dentro del contenedor, como descompresión, parsing o conversión
  • Según las pruebas, los encabezados de la solicitud incluyen User-Agent: ChatGPT-User/1.0, y la IP se identificó como Microsoft Azure Cloud (Des Moines, Iowa)

Verificación de seguridad: posible riesgo de filtración de datos

  • Se realizaron pruebas para verificar si container.download podría convertirse en una vulnerabilidad de exfiltración de datos
    • Al invocar URLs con cadenas de consulta apareció el error “url not viewed in conversation before
    • Esto actúa como una protección de restricción de acceso a URLs, similar a Web Fetch de Claude, que solo permite acceder a URLs previamente confirmadas mediante entrada del usuario o resultados de búsqueda
  • Fue posible pasar algunas cadenas de consulta mediante web.run, pero las cadenas largas que incluían historial previo de la conversación fueron bloqueadas por filtros
  • Con base en las pruebas hechas hasta ahora, el riesgo de filtración de datos parece bajo, aunque se menciona la necesidad de más investigación de seguridad

Ejecución de Bash y de múltiples lenguajes

  • Con el soporte para ejecutar Bash, ChatGPT ahora puede realizar comandos a nivel de sistema
    • Ejemplo: puede ejecutar npm install y revisar el resultado
  • Es posible verificar si el comando realmente se ejecutó mediante los logs de ejecución del panel Activity (consola en blanco y negro)
  • Las pruebas de ejecución de “Hello World” en varios lenguajes fueron exitosas, confirmando un entorno de ejecución multilenguaje

Mecanismo de instalación de paquetes con pip y npm

  • Incluso con la red externa bloqueada, el contenedor puede instalar paquetes a través del proxy interno de OpenAI (applied-caas-gateway1.internal.api.openai.org)
    • Variables de entorno como PIP_INDEX_URL y NPM_CONFIG_REGISTRY apuntan a ese proxy
  • Administradores de paquetes clave como pip, uv y npm funcionan mediante este proxy
  • Las variables de entorno incluyen varias rutas de registro con el prefijo CAAS_ARTIFACTORY_*
    • Existen múltiples rutas de repositorios internos para PyPI, npm, Go, Maven, Gradle, Cargo, Docker y otros
  • Rust y Docker todavía no están instalados, pero esto sugiere una posible expansión futura

Uso integrado y tareas pendientes

  • ChatGPT ahora puede instalar paquetes de Python y Node.js, y aplicarlos a archivos subidos o descargados
  • Ya cuenta con funciones al nivel de un entorno de desarrollo completo, desde escritura y ejecución de código hasta procesamiento de datos y entrada/salida de archivos
  • La mayor carencia es la ausencia de documentación oficial, por lo que hace falta publicar notas de lanzamiento y detalles sobre las limitaciones
  • OpenAI debería asignar un nombre apropiado a este conjunto de funciones; por ahora se lo denomina temporalmente “ChatGPT Containers

Resumen de la lista completa de herramientas de ChatGPT

  • Se publicó la lista de herramientas disponibles en el entorno GPT-5.2
    • Incluye python.exec, web.run, container.exec, container.download, image_gen.text2im y otras
  • Cada herramienta tiene una descripción (description) y una firma (signature) claras
  • container.exec ejecuta comandos, container.feed_chars recibe entrada para sesiones interactivas y container.open_image ofrece visualización de imágenes
  • También incluye funciones personalizadas para el usuario, como bio.update, personal_context.search y user_settings.set_setting
  • En conjunto, ChatGPT evoluciona hacia un entorno de IA integral que integra ejecución de código, acceso web, manejo de archivos y gestión del contexto del usuario

1 comentarios

 
GN⁺ 2026-01-28
Opiniones de Hacker News
  • Trabajo en soporte técnico y estoy familiarizado con Python, pero no soy desarrollador
    Aun así, en las últimas semanas Gemini y Claude me preguntaron: “¿puedes usar una computadora?”
    Yo les respondí: “¿Qué computadora? ¿La mía? ¿O una que ustedes tienen?”
    Como uso la versión gratuita en el navegador, no pensé que pudieran usar directamente mi computadora, pero resultó que estaban ejecutando scripts de Python en su propio entorno
    Me dio curiosidad quién fue el primero en pensar la idea de darle una computadora real a un LLM para resolver problemas de cálculo
    Además, cuando usé Nano Banana en un prompt, Gemini se refirió al generador de imágenes en tercera persona, y me dio una sensación de “tortugas sobre tortugas”

  • En nuestra experiencia, darle un entorno Linux a un agente trae beneficios complejos
    Puede resolver por sí mismo situaciones raras que serían difíciles de manejar con herramientas generales
    Por ejemplo, si un archivo llamado .png en realidad es un jpeg, lee los magic bytes y lo procesa correctamente

    • Yo también tuve una experiencia parecida en un flujo de trabajo de print-on-demand
      Intenté usar un modelo de visión para verificar perfiles ICC o densidad de tinta, pero seguido decía tonterías
      Al final le di al agente acceso a ImageMagick para que lo analizara directamente, y fue la única forma confiable
      De lo contrario, yo terminaba absorbiendo el costo de las impresiones fallidas
    • En realidad, leer magic bytes es una función simple
      La mayoría de los visores o editores de imágenes en Linux ya determinan el formato del archivo por los magic bytes en vez de la extensión
      Creo que el diseño dependiente de extensiones de Microsoft es lo que causó este problema
    • No sé si esto sea tan especial como para que lo tenga que hacer un LLM
      Una persona lo haría en segundos con herramientas Unix comunes
  • El ChatGPT básico ahora también puede ejecutar código en Node.js, Ruby, Perl, PHP, Go, Java, Swift, Kotlin, C, C++ y más
    No aparece en las notas oficiales de lanzamiento, pero también se confirmó en cuentas gratuitas

    • Yo pude instalar el compilador DMD del lenguaje D proporcionando un archivo .deb
      Enlace compartido
    • Lástima que C# no esté en la lista
  • Me sorprendió ver elementos como “gmail (read-only)”
    La app de ChatGPT para Android dice que no tiene ese permiso, así que me pregunto en qué contexto sería posible el acceso de lectura a Gmail

  • Últimamente parece que todas las empresas están compitiendo por encerrar la función de tool calling dentro de sus propias plataformas
    Al final, cuando el modelo pueda hacer casi cualquier tarea en un entorno local, la discusión sobre sandboxes también perderá relevancia
    Me pregunto cuándo ofrecerán un entorno virtual de desarrollo persistente

    • Estoy trabajando en el proyecto vibebin,
      y sigo pensando que intentar operar herramientas de coding con IA o agentes en entornos aislados todavía vale la pena
      Probablemente la mayoría de los desarrolladores use este tipo de herramientas de coding especializadas en lugar de la UI web normal de GPT
    • Claude Code for the web ya es una especie de entorno virtual de desarrollo persistente
      Inicias una sesión, trabajas, y si vuelves un día después, el estado del sistema de archivos sigue intacto
      Supongo que probablemente usan object storage para bajar costos
      Como referencia, también está interesante este post de diseño de Sprites.dev de Fly
    • Creo que por esta tendencia Anthropic adquirió Bun
    • Muchas empresas van en esa dirección
      En vez de hardware local, dejan solo clientes ligeros y delegan las cargas reales de trabajo a lugares como Microsoft
      Personalmente, no tener un entorno de desarrollo local me parece un infierno, pero da la impresión de que hacia allá va la época
  • Esta función parece que ahorrará muchísimo tiempo o, por el contrario, provocará una caída educativa (outage)

    • Si un agente puede actualizar por sí mismo el modelo, eso solo sería educativo para el modelo
  • Qué buena la observación casi detectivesca de Simon
    Este tipo de “posts de descubrimiento” son mucho más interesantes que los anuncios oficiales

    • Sí, cuando la gente descubre cosas por su cuenta y las comparte surge una energía creativa
      Inspira mucho más que un simple comunicado de prensa
  • Siento que pronto llegará una era en la que ChatGPT cree apps de un solo uso (single-use app) al vuelo
    Sería algo así como generar una app sandbox en la nube dentro del navegador para cumplir un objetivo y, al terminar, desecharla de inmediato

    • Ya hay casos donde se implementó algo así
    • Por ejemplo, existen alternativas como exe.dev o sprites.dev