7 puntos por GN⁺ 2025-09-10 | Aún no hay comentarios. | Compartir por WhatsApp
  • Reseña basada en el uso real de la función “Upgraded file creation and analysis” de Anthropic, examinando su naturaleza como herramienta de análisis con ejecución de código, por Simon Willison
  • Esta nueva función permite ejecutar código Python y Node.js en un contenedor del lado del servidor y crear/editar archivos, con una implementación totalmente distinta a la anterior “Analysis tool” basada en JS dentro del navegador
  • El contenedor ofrece Ubuntu 24.04.2, Python 3.12.3, Node v18.19.1, alrededor de 9GB de RAM / 5GB de disco, y se caracteriza por una lista blanca de red basada en proxy Envoy y permiso para instalar paquetes de PyPI
  • En pruebas reales se realizaron la generación de un PDF con diagrama de esquema de SQLite y la reproducción de una gráfica sobre adopción de IA de Apollo, mostrando que la calidad del resultado puede mejorarse mediante diseño de prompts y ajuste de visualizaciones
  • El acceso parcial a internet implica riesgos de prompt injection y filtración de datos, por lo que se requiere monitoreo por parte del usuario; al mismo tiempo, el fracaso en el nombramiento y explicación de la función sigue siendo un reto para toda la industria

Resumen de la función

  • Anthropic anunció que Claude ahora admite funciones de creación y edición de archivos
    • Puede generar hojas de cálculo de Excel, documentos de Word, diapositivas de PowerPoint y PDF en Claude.ai y en la app de escritorio
    • Los usuarios pueden obtener archivos listos para usar subiendo datos o describiendo sus necesidades
  • Está en vista previa para usuarios de los planes Max, Team y Enterprise; el plan Pro será compatible en unas semanas
  • Funciones principales:
    • Análisis de datos: limpia datos en bruto y ofrece análisis estadístico, gráficas e insights clave
    • Creación de hojas de cálculo: genera modelos financieros, rastreadores de proyectos, plantillas de presupuesto y más con fórmulas incluidas
    • Trabajo entre formatos: convierte PDF a PowerPoint, organiza notas de reuniones en documentos, etc.
  • El autor Simon Willison lo define como una función equivalente a ChatGPT Code Interpreter y considera que el nombre oficial “Upgraded file creation and analysis” es una mala elección de naming
  • Diferencias con la función anterior
    • Analysis tool de octubre de 2024: era una herramienta ligera de análisis que ejecutaba JS en el navegador del usuario
    • Nueva función de septiembre de 2025: es un verdadero code interpreter que ejecuta comandos de shell, Python y Node.js en un contenedor del lado del servidor, y realiza lectura y creación de archivos
    • Se parece al Code execution tool de la API de la misma empresa, pero esta es la primera vez que un usuario final puede ejecutar código arbitrario en un contenedor del servidor

Características del nuevo Code Interpreter

  • El Code Interpreter de Claude es similar a ChatGPT Code Interpreter
  • Puede instalar paquetes de Python desde PyPI (por ejemplo, pip install sqlite-utils)
    • Node.js v18.19.1 viene preinstalado y se pueden usar paquetes globales de npm
  • Detalles del entorno:
    • SO: Ubuntu 24.04.2 LTS, kernel Linux 4.4.0
    • Arquitectura: x86_64, shell: GNU Bash 5.2.21
    • Python: 3.12.3, pip: 24.0
    • Disco: 4.9GB (4.6GB disponibles), RAM: 9.0GB
  • Restricciones: límite de 30MB para subir/bajar archivos, una capacidad más limitada frente a los 512MB de ChatGPT
    • Acceso a internet: se aplica una lista blanca estricta detrás de un proxy Envoy
    • Un curl a sitios comunes (por ejemplo, google.com) devuelve error 403 Forbidden
    • Dominios permitidos: api.anthropic.com, github.com, registry.npmjs.org / npmjs.com, pypi.org / files.pythonhosted.org, entre otros; es una lista blanca centrada en paquetes y gestión de versiones
    • Es posible instalar paquetes de PyPI como pip install sqlite-utils, y el runtime de Node también puede usarse de inmediato
    • Los contenedores web_fetch y web_search permiten acceso limitado a contenido web

Configuración y uso

  • Activación: habilitar el toggle de Upgraded file creation and analysis en claude.ai/settings/features
    • No puede activarse al mismo tiempo que Analysis Tool, para evitar confusión
  • Tarea simple: SQLite → PDF de diagrama de joins

    • Entrada: subir la base de datos SQLite del sitio TIL (≈21.9MB) y pedir la generación de un PDF con el diagrama de joins entre tablas
    • Resultado: logró generar PDF/PNG; la legibilidad de las conexiones fue algo deficiente, pero se confirmó que puede mejorar con mejoras en el prompt
    • Significado: el flujo de trabajo estándar de Code Interpreter para analizar con Python una base de datos subida y generar imágenes/PDF funciona sin problemas
  • Tarea compleja: reproducir una gráfica de adopción de IA

    • Tarea: usando una captura de pantalla + XLSX como entrada, se le pidió reproducir una gráfica de líneas temporal similar al original
    • Proceso:
      • El primer resultado mostró líneas rectas y etiquetas superpuestas, con cierta tosquedad visual
      • Al indicarle aplicar una media móvil de 6 rondas de encuesta, la línea de tendencia mejoró
      • Al especificar “interpolación curva en lugar de líneas rectas”, renderizó curvas suaves; la superposición del título se corrigió con instrucciones adicionales
    • Implicación: al combinar prompts amigables para el modelo con ajuste de parámetros de visualización, se puede lograr una productividad similar a la de ChatGPT

Seguridad y riesgo de inyección de prompts

  • El acceso a internet implica riesgo de ataques de prompt injection
    • Es posible insertar instrucciones maliciosas a través de archivos o sitios web
    • Ejemplos: ejecución de código no confiable, filtración de datos sensibles
  • Anthropic realizó red teaming y pruebas de seguridad, y recomienda monitoreo por parte del usuario
    • El permiso para GitHub aumenta la preocupación por vectores de filtración de datos
  • Recomendaciones: tener cuidado al usar datos sensibles y detener el proceso de inmediato si se detecta acceso inesperado a datos

Evaluación de usabilidad y calidad

  • El Code Interpreter de Claude ofrece funciones que superan a ChatGPT Code Interpreter
  • Ventajas
    • La combinación de instalación desde PyPI + soporte para Node ofrece una excelente capacidad de expansión del ecosistema de herramientas
    • Puede realizar de una sola vez un pipeline conversacional que incluye creación, conversión y visualización de archivos
  • Limitaciones
    • El límite de 30MB por archivo restringe la carga de datasets grandes y bases de datos
    • En ciertas visualizaciones, puede requerirse iterar con prompts adicionales para lograr ajustes finos
  • Valor: Code Interpreter es una de las funciones más útiles de los LLM, y esta mejora de Claude eleva las expectativas

El problema del naming y la comunicación

  • Anthropic: tras el nombre anterior Analysis tool, adoptó el todavía más confuso “Upgraded file creation and analysis”, dejando escondida la capacidad de ejecutar código en la documentación de lanzamiento
  • OpenAI: también ha mostrado inestabilidad de naming entre Code Interpreter ↔ Advanced Data Analysis, y la visibilidad de su landing page oficial también es baja
  • Conclusión: la industria está fallando de forma consistente en comunicar el valor central de la creación y análisis de archivos con ejecución de código, y necesita mejorar la terminología y las guías para favorecer la comprensión y la confianza de los usuarios

Aún no hay comentarios.

Aún no hay comentarios.