- El entorno de ejecución de contenedores de ChatGPT se amplió a gran escala, y ahora permite ejecutar comandos de Bash, instalar paquetes con pip/npm y descargar archivos
- Al entorno previo, centrado en Python, se sumaron más de 10 lenguajes, como Node.js, Ruby, Go, Java, Swift, Kotlin, C y C++, con soporte para ejecución de código multilenguaje
- El acceso a redes externas sigue restringido, pero se configuró para que
pip install y npm install funcionen a través de un proxy interno de OpenAI
- La nueva herramienta
container.download puede obtener archivos desde URLs públicas y guardarlos dentro del contenedor, pasando por un proceso de validación de seguridad
- Esta mejora amplía de forma importante las capacidades de ejecución de código y procesamiento de datos de ChatGPT, y subraya la necesidad de documentación oficial
Principales ampliaciones de los contenedores de ChatGPT
- ChatGPT ahora puede ejecutar comandos de Bash directamente; antes solo podía ejecutar código Python
- Esto deja atrás la ejecución indirecta mediante el módulo
subprocess de Python y permite control a nivel de línea de comandos
- Se añadió un entorno de Node.js, lo que permite ejecutar JavaScript; también se probó con éxito Ruby, Perl, PHP, Go, Java, Swift, Kotlin, C y C++
- Rust todavía no es compatible
- El contenedor aún no puede hacer solicitudes directas a redes externas, pero
pip install y npm install funcionan mediante un proxy
- Con la herramienta
container.download es posible descargar archivos de la web a una ruta específica
- ChatGPT puede identificar la URL, guardar ese archivo en el entorno sandbox y luego procesarlo
Función de container.download
container.download es una herramienta que obtiene archivos desde URLs de acceso público y los guarda en el sistema de archivos del contenedor
- Los archivos descargados pueden recibir posprocesamiento dentro del contenedor, como descompresión, parsing o conversión
- Según las pruebas, los encabezados de la solicitud incluyen
User-Agent: ChatGPT-User/1.0, y la IP se identificó como Microsoft Azure Cloud (Des Moines, Iowa)
Verificación de seguridad: posible riesgo de filtración de datos
- Se realizaron pruebas para verificar si
container.download podría convertirse en una vulnerabilidad de exfiltración de datos
- Al invocar URLs con cadenas de consulta apareció el error “url not viewed in conversation before”
- Esto actúa como una protección de restricción de acceso a URLs, similar a Web Fetch de Claude, que solo permite acceder a URLs previamente confirmadas mediante entrada del usuario o resultados de búsqueda
- Fue posible pasar algunas cadenas de consulta mediante
web.run, pero las cadenas largas que incluían historial previo de la conversación fueron bloqueadas por filtros
- Con base en las pruebas hechas hasta ahora, el riesgo de filtración de datos parece bajo, aunque se menciona la necesidad de más investigación de seguridad
Ejecución de Bash y de múltiples lenguajes
- Con el soporte para ejecutar Bash, ChatGPT ahora puede realizar comandos a nivel de sistema
- Ejemplo: puede ejecutar
npm install y revisar el resultado
- Es posible verificar si el comando realmente se ejecutó mediante los logs de ejecución del panel Activity (consola en blanco y negro)
- Las pruebas de ejecución de “Hello World” en varios lenguajes fueron exitosas, confirmando un entorno de ejecución multilenguaje
Mecanismo de instalación de paquetes con pip y npm
- Incluso con la red externa bloqueada, el contenedor puede instalar paquetes a través del proxy interno de OpenAI (
applied-caas-gateway1.internal.api.openai.org)
- Variables de entorno como
PIP_INDEX_URL y NPM_CONFIG_REGISTRY apuntan a ese proxy
- Administradores de paquetes clave como
pip, uv y npm funcionan mediante este proxy
- Las variables de entorno incluyen varias rutas de registro con el prefijo CAAS_ARTIFACTORY_*
- Existen múltiples rutas de repositorios internos para PyPI, npm, Go, Maven, Gradle, Cargo, Docker y otros
- Rust y Docker todavía no están instalados, pero esto sugiere una posible expansión futura
Uso integrado y tareas pendientes
- ChatGPT ahora puede instalar paquetes de Python y Node.js, y aplicarlos a archivos subidos o descargados
- Ya cuenta con funciones al nivel de un entorno de desarrollo completo, desde escritura y ejecución de código hasta procesamiento de datos y entrada/salida de archivos
- La mayor carencia es la ausencia de documentación oficial, por lo que hace falta publicar notas de lanzamiento y detalles sobre las limitaciones
- OpenAI debería asignar un nombre apropiado a este conjunto de funciones; por ahora se lo denomina temporalmente “ChatGPT Containers”
Resumen de la lista completa de herramientas de ChatGPT
- Se publicó la lista de herramientas disponibles en el entorno GPT-5.2
- Incluye python.exec, web.run, container.exec, container.download, image_gen.text2im y otras
- Cada herramienta tiene una descripción (description) y una firma (signature) claras
container.exec ejecuta comandos, container.feed_chars recibe entrada para sesiones interactivas y container.open_image ofrece visualización de imágenes
- También incluye funciones personalizadas para el usuario, como
bio.update, personal_context.search y user_settings.set_setting
- En conjunto, ChatGPT evoluciona hacia un entorno de IA integral que integra ejecución de código, acceso web, manejo de archivos y gestión del contexto del usuario
1 comentarios
Opiniones de Hacker News
Trabajo en soporte técnico y estoy familiarizado con Python, pero no soy desarrollador
Aun así, en las últimas semanas Gemini y Claude me preguntaron: “¿puedes usar una computadora?”
Yo les respondí: “¿Qué computadora? ¿La mía? ¿O una que ustedes tienen?”
Como uso la versión gratuita en el navegador, no pensé que pudieran usar directamente mi computadora, pero resultó que estaban ejecutando scripts de Python en su propio entorno
Me dio curiosidad quién fue el primero en pensar la idea de darle una computadora real a un LLM para resolver problemas de cálculo
Además, cuando usé Nano Banana en un prompt, Gemini se refirió al generador de imágenes en tercera persona, y me dio una sensación de “tortugas sobre tortugas”
En nuestra experiencia, darle un entorno Linux a un agente trae beneficios complejos
Puede resolver por sí mismo situaciones raras que serían difíciles de manejar con herramientas generales
Por ejemplo, si un archivo llamado .png en realidad es un jpeg, lee los magic bytes y lo procesa correctamente
Intenté usar un modelo de visión para verificar perfiles ICC o densidad de tinta, pero seguido decía tonterías
Al final le di al agente acceso a ImageMagick para que lo analizara directamente, y fue la única forma confiable
De lo contrario, yo terminaba absorbiendo el costo de las impresiones fallidas
La mayoría de los visores o editores de imágenes en Linux ya determinan el formato del archivo por los magic bytes en vez de la extensión
Creo que el diseño dependiente de extensiones de Microsoft es lo que causó este problema
Una persona lo haría en segundos con herramientas Unix comunes
El ChatGPT básico ahora también puede ejecutar código en Node.js, Ruby, Perl, PHP, Go, Java, Swift, Kotlin, C, C++ y más
No aparece en las notas oficiales de lanzamiento, pero también se confirmó en cuentas gratuitas
Enlace compartido
Me sorprendió ver elementos como “gmail (read-only)”
La app de ChatGPT para Android dice que no tiene ese permiso, así que me pregunto en qué contexto sería posible el acceso de lectura a Gmail
En la app de iPhone también aparecían las funciones gmail. y gcal.
Ejemplo compartido
Probablemente sea la función mencionada en este artículo de Mashable
Parece que solo se activa si el usuario hace opt-in manualmente
Últimamente parece que todas las empresas están compitiendo por encerrar la función de tool calling dentro de sus propias plataformas
Al final, cuando el modelo pueda hacer casi cualquier tarea en un entorno local, la discusión sobre sandboxes también perderá relevancia
Me pregunto cuándo ofrecerán un entorno virtual de desarrollo persistente
y sigo pensando que intentar operar herramientas de coding con IA o agentes en entornos aislados todavía vale la pena
Probablemente la mayoría de los desarrolladores use este tipo de herramientas de coding especializadas en lugar de la UI web normal de GPT
Inicias una sesión, trabajas, y si vuelves un día después, el estado del sistema de archivos sigue intacto
Supongo que probablemente usan object storage para bajar costos
Como referencia, también está interesante este post de diseño de Sprites.dev de Fly
En vez de hardware local, dejan solo clientes ligeros y delegan las cargas reales de trabajo a lugares como Microsoft
Personalmente, no tener un entorno de desarrollo local me parece un infierno, pero da la impresión de que hacia allá va la época
Esta función parece que ahorrará muchísimo tiempo o, por el contrario, provocará una caída educativa (outage)
Qué buena la observación casi detectivesca de Simon
Este tipo de “posts de descubrimiento” son mucho más interesantes que los anuncios oficiales
Inspira mucho más que un simple comunicado de prensa
Siento que pronto llegará una era en la que ChatGPT cree apps de un solo uso (single-use app) al vuelo
Sería algo así como generar una app sandbox en la nube dentro del navegador para cumplir un objetivo y, al terminar, desecharla de inmediato