Beta pública de Claude Science
(claude.com)- Claude Science es una app en beta pública diseñada para que investigadores de ciencias de la vida puedan continuar en un solo banco de trabajo desde la ejecución de análisis y la búsqueda en bases de datos hasta el preprocesamiento de datos y la redacción de resultados
- Las figuras, tablas y notebooks conservan el código generado, el entorno de ejecución y el historial de conversación, para que luego puedan reproducirse, modificarse y verificarse
- Se ejecuta en notebooks locales, equipos Linux, nodos de login de HPC y VM en la nube, y admite el envío y la gestión de trabajos mediante SSH, Slurm y Modal
- Está orientado a genómica, single-cell, proteómica, biología estructural y quimioinformática, y puede conectarse con más de 60 bases de datos científicas y herramientas de NVIDIA BioNeMo
- Está disponible en macOS y Linux con los planes Pro, Max, Team y Enterprise, pero al ser una app beta requiere revisar la documentación y configurar los ajustes de administrador antes de desplegarla en una organización
Banco de trabajo Claude para investigación científica
- Claude Science no es un modelo nuevo, sino una app en beta pública, y usa los modelos Claude existentes incluidos en el plan del usuario
- Lo nuevo es el conjunto de herramientas científicas, conexiones a bases de datos e integraciones de cómputo alrededor de Claude, lo que permite ejecutar análisis completos en la infraestructura del usuario
- Está disponible para macOS y Linux, y la página indica las descargas para cada sistema operativo
- El objetivo es reunir bases de datos científicas, herramientas de investigación, ELN, modelos de proteínas y estructuras, y HPC en un único banco de trabajo de investigación
Resultados reproducibles y flujo de revisión
- Claude Science permite ver proteínas, estructuras, moléculas y otros elementos de forma nativa, y rastrear los resultados hasta el código que los generó
- Las figuras, tablas y notebooks guardan la siguiente información
- El código exacto que produjo el resultado
- El entorno de ejecución
- La conversación que produjo el resultado
- Los resultados guardados pueden reproducirse, editarse y defenderse incluso meses después
- Proteínas, alineamientos, pistas genómicas, estructuras químicas y PDF pueden revisarse en formatos nativos sin instalaciones adicionales
- El revisor en segundo plano marca citas incorrectas, cifras imposibles de rastrear y figuras que no coinciden con el código subyacente
- El usuario puede anotar una figura para pedir correcciones o hacer preguntas, y el agente lee el código que la creó y la modifica directamente
- La redacción de los resultados del análisis puede hacerse viendo vistas previas de Markdown renderizado y LaTeX
Cómputo y entornos de ejecución
- Gestiona el entorno de ejecución necesario para cada análisis, que puede ejecutarse en una notebook, un equipo Linux o un nodo de login de HPC
- Después de escribir scripts batch, permite enviarlos y gestionarlos por SSH en la máquina del usuario o en un clúster HPC, o ejecutar trabajos con una cuenta de Modal
- La ubicación de instalación puede ajustarse al lugar donde están los datos
- Notebook
- Equipo Linux del laboratorio
- Nodo de login de HPC
- VM en la nube
- Puede usarse conectándose desde el navegador
- Los trabajos se ejecutan en kernels locales, clústeres Slurm mediante SSH o una cuenta de Modal
- Variables, dataframes y modelos cargados se mantienen en memoria durante todo el análisis, lo que acelera las tareas iterativas
Trabajo por dominios de ciencias de la vida
- Claude Science admite genómica, single-cell, proteómica, biología estructural, quimioinformática y más, y puede leer literatura y consultar más de 60 bases de datos científicas
- Algunos ejemplos de uso principales son los siguientes
- Análisis de single-cell RNA-seq: agrupar y anotar millones de células en tejidos completos, encontrar genes marcadores de superficie y rastrear cada figura hasta el código que la generó
- Análisis filogenético y evolutivo: realizar alineamiento de ortólogos, inferencia de árboles de máxima verosimilitud y mapeo filogenético de residuos funcionales en una sola sesión reproducible
- Trabajo con estructuras de proteínas y modelos de lenguaje: importar estructuras predichas, superponer dominios y variantes clínicas, y explorarlas interactivamente en 3D
- Quimioinformática y diseño molecular: buscar datos de bioactividad, calcular propiedades y similitud, y dibujar o refinar estructuras en un sketcher 2D
- Los pipelines pueden guardarse como skills reutilizables, y las herramientas preferidas del laboratorio pueden conectarse como connectors para usarlas automáticamente en sesiones posteriores
- Proporciona indication dossiers con fuentes completas y está ampliando el conjunto de skills que conforman la evidencia de cada programa
Conexión con el stack existente del laboratorio
- Los connectors incorporan API internas, ELN y pipelines personalizados al flujo de trabajo, para que Claude Science funcione junto con las herramientas existentes del laboratorio
- Los flujos de trabajo existentes en Python, R y shell pueden leerse, ejecutarse y ampliarse sin necesidad de recrearlos desde cero
- Las herramientas científicas, plataformas y modelos abiertos especializados por dominio pueden integrarse como skills o connectors
- Más que reemplazar una herramienta específica, Claude Science actúa como un banco de trabajo integrado donde las herramientas especializadas funcionan juntas
Conexiones con modelos, herramientas y datos
- Más allá de que un asistente de IA general pueda hablar de biología, Claude Science admite la ejecución de pipelines, la exploración de bases de datos científicas, la orquestación de trabajos en clústeres y el seguimiento del historial de sesiones anteriores
- La app incluye especialistas de análisis para genómica, single-cell, proteómica, biología estructural, quimioinformática y más
- Puede conectarse de forma nativa con modelos abiertos especializados por dominio y con más de 60 bases de datos científicas
- Usa la skill BioNeMo Agent Toolkit de NVIDIA para conectarse con los modelos y bibliotecas de ciencias de la vida de BioNeMo
- Algunos ejemplos incluidos son Evo 2, Boltz-2 y OpenFold3
Ubicación de los datos y verificación
- La app Claude Science se ejecuta en la infraestructura del usuario, y los datasets sin procesar y el cómputo permanecen en local
- El contenido incluido en prompts y respuestas del modelo se trata según las políticas estándar de retención de Anthropic
- Los requisitos específicos por equipo pueden discutirse mediante una consulta con ventas
- Todos los entregables incluyen la siguiente información
- El código exacto usado para la generación
- El entorno de ejecución
- Una descripción en lenguaje natural de las tareas realizadas
- La conversación que llevó al resultado
- El revisor en segundo plano marca afirmaciones que no pueden rastrearse hasta evidencia antes de que se muestren los resultados
Planes, descuentos para laboratorios y despliegue empresarial
- Claude Science es una app beta disponible en macOS y Linux con los planes Pro, Max, Team y Enterprise
- Los usuarios de Team y Enterprise necesitan que un administrador la active primero
- El descuento para laboratorios Claude Team plan for research labs incluye acceso a la app Claude Science
- Está dirigido a laboratorios de investigación científica activos en instituciones académicas y organizaciones de investigación sin fines de lucro
- Tienen prioridad los laboratorios de investigación biomédica y de ciencias básicas, así como hard sciences como química, matemáticas, ciencias de la computación y física
- La elegibilidad se verifica a través del responsable del laboratorio
- Las empresas con fines de lucro, organizaciones de investigación por contrato y equipos de I+D industrial deben consultar los planes Team y Enterprise
- El plan Enterprise ofrece SSO, aprovisionamiento SCIM, roles personalizados y análisis de uso
- Dado que está en beta, los administradores deben revisar la documentación antes del despliegue
- La documentación cubre la instalación, la conexión de herramientas y cómputo, y la configuración de administradores de Team y Enterprise
1 comentarios
Opiniones en Hacker News
Creé Biomni HPC, una de las herramientas conectadas incluidas en este lanzamiento, y llevo bastante tiempo dándole vueltas a este problema. También trabajé en Anthropic, pero no estuve a cargo de este producto.
Como mencionan otros comentarios, esto es para ciencia de datos, pero puede hacer mucho más que crear gráficos y escribir papers. Se integra con varias bases de datos y herramientas de cómputo, incluidos los clústeres institucionales de los investigadores.
Eso por sí solo ya tiene mucho valor. Sufrí con este problema en una startup de biotecnología y luego fundé una startup; integrar este tipo de herramientas y bases de datos es difícil y consume mucho tiempo. Incluso si el único resultado de este producto fuera construir una gran API para LLMs, tendría un impacto positivo enorme. Muchas bases de datos usadas en genómica computacional todavía solo son accesibles por FTP.
Los LLMs encajan especialmente bien para explorar estas herramientas y bases de datos. Hay muchas tareas simples que son muy especializadas, pero que se manejan bien con habilidades aprendidas en contexto. Ver a bioinformáticos que habían sido clientes míos empezar a resolver este problema con LLMs fue lo que me llevó a unirme a Anthropic en 2024.
Además, este patrón no está atado por naturaleza solo a la ciencia de datos. En algunas áreas científicas también puede integrarse con laboratorios húmedos o CROs, y ahora estoy dedicando tiempo a eso.
Esta forma de hacer ciencia no lo resolverá todo, pero es útil en ciertos ámbitos. Por ejemplo, mucha investigación sobre enfermedades raras avanza lentamente no tanto por falta de avances fundamentales, sino por un cuello de botella en la atención de los investigadores.
https://x.com/phylo_bio/article/2029233694775624096
En comparación, Prism, el producto científico de OpenAI, era en la práctica más bien un editor de LaTeX obtenido mediante la adquisición de Crixet.
Hay que cumplir políticas institucionales, leyes aplicables y requisitos de acceso y almacenamiento de datos, como los de los repositorios de datos del NIH, y también puede hacer falta un acuerdo legal entre la institución y el proveedor de IA. Al menos por ahora, parece difícil de abordar.
Si te interesa, podemos hablar.
Lo más interesante aquí es que Claude Science ejecuta un servidor local y una UI web que se conecta a ese servidor desde el navegador.
Es bastante distinto de una estructura como Claude Code o Cowork, donde la UI está más fuertemente acoplada a la máquina host y eso habilita funciones como el uso de la computadora.
Creo que se puede intuir la estrategia. La mayoría de los entornos farmacéuticos conectados a datos interesantes están fuertemente bloqueados, así que no puedes simplemente conectar una MacBook a los datos fuente.
Del mismo modo, el acceso a grandes conjuntos de datos de biobancos genómicos como UK Biobank o NIH All of Us solo se permite a través de plataformas remotas de análisis de datos llamadas Trusted Research Environment (TRE), y normalmente el acceso a internet también está restringido. Ejecutar una app de escritorio no es fácil, pero estos entornos por lo general sí permiten ejecutar JupyterLab o VS Code y tunelizar la UI hasta el usuario final. Antes lideré el equipo que creó el TRE de All of Us.
Claude Science se imagina más fácilmente no como una megaapp de Claude que lo hace todo, sino como algo que levanta un servidor dentro de estos entornos de datos restringidos y solo proxyea la UI al navegador del usuario. Eso será importante para su adopción en entornos de I+D farmacéutica.
Dicho eso, para científicos computacionales de nivel intermedio que usan RStudio, JupyterLab y VS Code todos los días, Claude Science puede ser un tipo de producto bastante extraño. Me pregunto si reemplazará las herramientas existentes de banco de trabajo para ciencia de datos, si se usará junto con ellas o si al final terminará envolviéndolas.
Trabajo como analista de datos en una empresa petrolera, con datos interesantes de sensores, y cuando necesito un análisis o una visualización rápidos, Claude escribe en minutos código que a mí me tomaría alrededor de una hora ordenar. El hecho de que conozca lo suficiente las bibliotecas relevantes como para leer y verificar el código es una diferencia importante frente a usar ciegamente una IA de caja negra.
Sin embargo, ahora mismo Claude Code y Jupyter en VS Code no encajan bien. Cada vez que Claude hace una modificación, provoca que todo el notebook se ejecute de nuevo desde el principio. Así que me estoy alejando un poco de los notebooks, dejando que Claude escriba scripts independientes, y luego invierto tiempo en recombinarlos en un notebook bonito.
Si no puedes conectarte desde una Mac, es muy probable que tampoco permitan que un agente envíe solicitudes desde el servidor.
Probé cómo funciona en mi área, diseño computacional de biopesticidas basados en RNAi.
Le pedí que generara de una sola vez un diseño dirigido al transcriptoma DvSnf7 del gusano de la raíz del maíz occidental, y el enfoque fue bastante ingenuo. Era el tipo de método que usaría alguien en su primer año de doctorado, pero hizo el trabajo
También señaló limitaciones como que usó reglas de diseño para mamíferos o que la revisión de off-targets era limitada. No es terrible, pero tampoco excelente. Al señalarle las fallas, juzgué que la IA sí sabía más y podía abordarlo mejor. Después de eso, el sistema de seguridad de Opus 4.8 marcó la sesión
Recomiendo juntar los 10 artículos clave sobre este tema y 10 libros de texto generales del área, convertirlos a texto plano mediante OCR o extracción de texto, y luego intentar la misma tarea con un arnés de agentes mejor, como omp.sh
/goal set create biopesticide targeting the DvSnf7 transcript of western corn rootwormNo cometer errores
Cuando dijeron “Science”, no pensé que se refirieran a ciencia de datos, pero una UI llena de código pandas y gráficos da esa impresión
Incluso si se enfoca en áreas científicas, considerando que parece Jupyter Notebook 2.0, quizá sea una de las partes menos valiosas del anuncio
Los casos de uso de entender visualizaciones de datos como imágenes han sido ignorados durante mucho tiempo, y los LLM modernos también son cada vez mejores en análisis exploratorio de datos serio. Aun así, quizá tenga que actualizar mi currículum
Por lo que he visto, elegiría sin dudarlo el código generado por Claude antes que el código escrito por gente de matemáticas, física, biología o lingüística. También he visto a Claude cometer errores enormes durante análisis de datos, pero probablemente ya sea más confiable que la mayoría de los académicos que programan
Qué ciencia es lo determina el contenido que se trata, no la cadena de herramientas
Antes de los LLM, los grupos técnicos que seguía debatían activamente qué temas usar, cuándo y para qué, y creo que esas discusiones dieron lugar a muchos frameworks y herramientas del tipo “parece una idea razonable, así que no perdemos nada implementándola”
Lamentablemente, hoy todo gira alrededor de los LLM, y solo se habla de cómo hacer que los LLM funcionen de una u otra forma. Casi no se tratan los temas para los que esos grupos fueron creados originalmente
Me preocupa que a la ciencia le pase pronto lo mismo. En lugar de los temas que realmente deberían discutirse, la conversación sobre LLM podría ocupar ese espacio
Si no se logra aprovechar de alguna manera los activos existentes, el retorno sobre el capital invertido no va a verse bien
No es un argumento a favor; solo significa que, al final, la dirección tiene que responder ante accionistas que miran esas métricas de retorno
Parece que este anuncio habilitó Claude Desktop para Linux: https://code.claude.com/docs/en/desktop-linux
He usado herramientas parecidas y, aunque son impresionantes, con demasiada frecuencia el LLM genera datos falsos pero plausibles y finge que son reales
Incluso incluye manipulaciones bastante profundas, como configurar conectores de bases de datos simulados para que parezca que obtiene datos del lugar correcto, cuando en realidad usa datos sintéticos
Me pregunto cómo evita eso este producto
En el lado de las biociencias, ¿no era esta la empresa que hacía que los LLM se comportaran como modelos corruptos?
Me pregunto si es algo como Claude Cowork para ciencia, es decir, un producto para usuarios menos técnicos
Un científico con experiencia en programación probablemente preferiría usar Claude Code de forma general e integrarlo con el stack que elija, aunque la comodidad y usabilidad de Claude Science podrían terminar ganando
Puedo imaginar perfectamente a un equipo de laboratorio nacional anterior integrándolo en sus sistemas y abandonando por completo el uso de Claude Code
Creo que deberían llamarlo Claude-bio-big-bucks
¿Qué pasa con ciencias de la Tierra, física e ingeniería? Todos los conectores y tecnologías parecen estar solo del lado de biología y farmacéutica
Antes de Trump, el presupuesto anual de la NSF era de unos 6.000 a 8.000 millones de dólares, y el presupuesto anual de los NIH era de unos 50.000 millones de dólares. Esa es la diferencia