Beta pública de Claude Science

(claude.com)

1 puntos por GN⁺ 4 시간 전 | 1 comentarios | Compartir por WhatsApp

Claude Science es una app en beta pública diseñada para que investigadores de ciencias de la vida puedan continuar en un solo banco de trabajo desde la ejecución de análisis y la búsqueda en bases de datos hasta el preprocesamiento de datos y la redacción de resultados
Las figuras, tablas y notebooks conservan el código generado, el entorno de ejecución y el historial de conversación, para que luego puedan reproducirse, modificarse y verificarse
Se ejecuta en notebooks locales, equipos Linux, nodos de login de HPC y VM en la nube, y admite el envío y la gestión de trabajos mediante SSH, Slurm y Modal
Está orientado a genómica, single-cell, proteómica, biología estructural y quimioinformática, y puede conectarse con más de 60 bases de datos científicas y herramientas de NVIDIA BioNeMo
Está disponible en macOS y Linux con los planes Pro, Max, Team y Enterprise, pero al ser una app beta requiere revisar la documentación y configurar los ajustes de administrador antes de desplegarla en una organización

Banco de trabajo Claude para investigación científica

Claude Science no es un modelo nuevo, sino una app en beta pública, y usa los modelos Claude existentes incluidos en el plan del usuario
Lo nuevo es el conjunto de herramientas científicas, conexiones a bases de datos e integraciones de cómputo alrededor de Claude, lo que permite ejecutar análisis completos en la infraestructura del usuario
Está disponible para macOS y Linux, y la página indica las descargas para cada sistema operativo
El objetivo es reunir bases de datos científicas, herramientas de investigación, ELN, modelos de proteínas y estructuras, y HPC en un único banco de trabajo de investigación

Resultados reproducibles y flujo de revisión

Claude Science permite ver proteínas, estructuras, moléculas y otros elementos de forma nativa, y rastrear los resultados hasta el código que los generó
Las figuras, tablas y notebooks guardan la siguiente información
- El código exacto que produjo el resultado
- El entorno de ejecución
- La conversación que produjo el resultado
Los resultados guardados pueden reproducirse, editarse y defenderse incluso meses después
Proteínas, alineamientos, pistas genómicas, estructuras químicas y PDF pueden revisarse en formatos nativos sin instalaciones adicionales
El revisor en segundo plano marca citas incorrectas, cifras imposibles de rastrear y figuras que no coinciden con el código subyacente
El usuario puede anotar una figura para pedir correcciones o hacer preguntas, y el agente lee el código que la creó y la modifica directamente
La redacción de los resultados del análisis puede hacerse viendo vistas previas de Markdown renderizado y LaTeX

Cómputo y entornos de ejecución

Gestiona el entorno de ejecución necesario para cada análisis, que puede ejecutarse en una notebook, un equipo Linux o un nodo de login de HPC
Después de escribir scripts batch, permite enviarlos y gestionarlos por SSH en la máquina del usuario o en un clúster HPC, o ejecutar trabajos con una cuenta de Modal
La ubicación de instalación puede ajustarse al lugar donde están los datos
- Notebook
- Equipo Linux del laboratorio
- Nodo de login de HPC
- VM en la nube
Puede usarse conectándose desde el navegador
Los trabajos se ejecutan en kernels locales, clústeres Slurm mediante SSH o una cuenta de Modal
Variables, dataframes y modelos cargados se mantienen en memoria durante todo el análisis, lo que acelera las tareas iterativas

Trabajo por dominios de ciencias de la vida

Claude Science admite genómica, single-cell, proteómica, biología estructural, quimioinformática y más, y puede leer literatura y consultar más de 60 bases de datos científicas
Algunos ejemplos de uso principales son los siguientes
- Análisis de single-cell RNA-seq: agrupar y anotar millones de células en tejidos completos, encontrar genes marcadores de superficie y rastrear cada figura hasta el código que la generó
- Análisis filogenético y evolutivo: realizar alineamiento de ortólogos, inferencia de árboles de máxima verosimilitud y mapeo filogenético de residuos funcionales en una sola sesión reproducible
- Trabajo con estructuras de proteínas y modelos de lenguaje: importar estructuras predichas, superponer dominios y variantes clínicas, y explorarlas interactivamente en 3D
- Quimioinformática y diseño molecular: buscar datos de bioactividad, calcular propiedades y similitud, y dibujar o refinar estructuras en un sketcher 2D
Los pipelines pueden guardarse como skills reutilizables, y las herramientas preferidas del laboratorio pueden conectarse como connectors para usarlas automáticamente en sesiones posteriores
Proporciona indication dossiers con fuentes completas y está ampliando el conjunto de skills que conforman la evidencia de cada programa

Conexión con el stack existente del laboratorio

Los connectors incorporan API internas, ELN y pipelines personalizados al flujo de trabajo, para que Claude Science funcione junto con las herramientas existentes del laboratorio
Los flujos de trabajo existentes en Python, R y shell pueden leerse, ejecutarse y ampliarse sin necesidad de recrearlos desde cero
Las herramientas científicas, plataformas y modelos abiertos especializados por dominio pueden integrarse como skills o connectors
Más que reemplazar una herramienta específica, Claude Science actúa como un banco de trabajo integrado donde las herramientas especializadas funcionan juntas

Conexiones con modelos, herramientas y datos

Más allá de que un asistente de IA general pueda hablar de biología, Claude Science admite la ejecución de pipelines, la exploración de bases de datos científicas, la orquestación de trabajos en clústeres y el seguimiento del historial de sesiones anteriores
La app incluye especialistas de análisis para genómica, single-cell, proteómica, biología estructural, quimioinformática y más
Puede conectarse de forma nativa con modelos abiertos especializados por dominio y con más de 60 bases de datos científicas
Usa la skill BioNeMo Agent Toolkit de NVIDIA para conectarse con los modelos y bibliotecas de ciencias de la vida de BioNeMo
- Algunos ejemplos incluidos son Evo 2, Boltz-2 y OpenFold3

Ubicación de los datos y verificación

La app Claude Science se ejecuta en la infraestructura del usuario, y los datasets sin procesar y el cómputo permanecen en local
El contenido incluido en prompts y respuestas del modelo se trata según las políticas estándar de retención de Anthropic
Los requisitos específicos por equipo pueden discutirse mediante una consulta con ventas
Todos los entregables incluyen la siguiente información
- El código exacto usado para la generación
- El entorno de ejecución
- Una descripción en lenguaje natural de las tareas realizadas
- La conversación que llevó al resultado
El revisor en segundo plano marca afirmaciones que no pueden rastrearse hasta evidencia antes de que se muestren los resultados

Planes, descuentos para laboratorios y despliegue empresarial

Claude Science es una app beta disponible en macOS y Linux con los planes Pro, Max, Team y Enterprise
Los usuarios de Team y Enterprise necesitan que un administrador la active primero
El descuento para laboratorios Claude Team plan for research labs incluye acceso a la app Claude Science
- Está dirigido a laboratorios de investigación científica activos en instituciones académicas y organizaciones de investigación sin fines de lucro
- Tienen prioridad los laboratorios de investigación biomédica y de ciencias básicas, así como hard sciences como química, matemáticas, ciencias de la computación y física
- La elegibilidad se verifica a través del responsable del laboratorio
Las empresas con fines de lucro, organizaciones de investigación por contrato y equipos de I+D industrial deben consultar los planes Team y Enterprise
El plan Enterprise ofrece SSO, aprovisionamiento SCIM, roles personalizados y análisis de uso
Dado que está en beta, los administradores deben revisar la documentación antes del despliegue
La documentación cubre la instalación, la conexión de herramientas y cómputo, y la configuración de administradores de Team y Enterprise

1 comentarios

GN⁺ 4 시간 전

Opiniones en Hacker News

Creé Biomni HPC, una de las herramientas conectadas incluidas en este lanzamiento, y llevo bastante tiempo dándole vueltas a este problema. También trabajé en Anthropic, pero no estuve a cargo de este producto.
Como mencionan otros comentarios, esto es para ciencia de datos, pero puede hacer mucho más que crear gráficos y escribir papers. Se integra con varias bases de datos y herramientas de cómputo, incluidos los clústeres institucionales de los investigadores.
Eso por sí solo ya tiene mucho valor. Sufrí con este problema en una startup de biotecnología y luego fundé una startup; integrar este tipo de herramientas y bases de datos es difícil y consume mucho tiempo. Incluso si el único resultado de este producto fuera construir una gran API para LLMs, tendría un impacto positivo enorme. Muchas bases de datos usadas en genómica computacional todavía solo son accesibles por FTP.
Los LLMs encajan especialmente bien para explorar estas herramientas y bases de datos. Hay muchas tareas simples que son muy especializadas, pero que se manejan bien con habilidades aprendidas en contexto. Ver a bioinformáticos que habían sido clientes míos empezar a resolver este problema con LLMs fue lo que me llevó a unirme a Anthropic en 2024.
Además, este patrón no está atado por naturaleza solo a la ciencia de datos. En algunas áreas científicas también puede integrarse con laboratorios húmedos o CROs, y ahora estoy dedicando tiempo a eso.
Esta forma de hacer ciencia no lo resolverá todo, pero es útil en ciertos ámbitos. Por ejemplo, mucha investigación sobre enfermedades raras avanza lentamente no tanto por falta de avances fundamentales, sino por un cuello de botella en la atención de los investigadores.
https://x.com/phylo_bio/article/2029233694775624096
En comparación, Prism, el producto científico de OpenAI, era en la práctica más bien un editor de LaTeX obtenido mediante la adquisición de Crixet.
- Me pregunto en qué se diferencia esto de incluir o configurar varias tecnologías de agentes. O si el núcleo del producto es combinar muchos valores predeterminados útiles.
- Conectar la IA directamente a fuentes de datos puede volverse mucho más complejo que recibir código para ejecutarlo localmente.
  Hay que cumplir políticas institucionales, leyes aplicables y requisitos de acceso y almacenamiento de datos, como los de los repositorios de datos del NIH, y también puede hacer falta un acuerdo legal entre la institución y el proveedor de IA. Al menos por ahora, parece difícil de abordar.
- Me pregunto cómo validan los resultados para filtrar las alucinaciones de los LLMs en este tipo de trabajo.
- Algún día me gustaría ver visualizaciones mucho mejores en Claude Science. Más allá de gráficos simples o estructuras de proteínas y químicas, estaría bueno tener escenas con threejs y shaders con una sensación más educativa. Sería genial que muchos papers en una revisión bibliográfica tuvieran esta función.
- Antes integré Biomni en un espacio de trabajo inteligente: https://blog.codesolvent.com/2025/07/ai-assistant-with-biome...
  Si te interesa, podemos hablar.
Lo más interesante aquí es que Claude Science ejecuta un servidor local y una UI web que se conecta a ese servidor desde el navegador.
Es bastante distinto de una estructura como Claude Code o Cowork, donde la UI está más fuertemente acoplada a la máquina host y eso habilita funciones como el uso de la computadora.
Creo que se puede intuir la estrategia. La mayoría de los entornos farmacéuticos conectados a datos interesantes están fuertemente bloqueados, así que no puedes simplemente conectar una MacBook a los datos fuente.
Del mismo modo, el acceso a grandes conjuntos de datos de biobancos genómicos como UK Biobank o NIH All of Us solo se permite a través de plataformas remotas de análisis de datos llamadas Trusted Research Environment (TRE), y normalmente el acceso a internet también está restringido. Ejecutar una app de escritorio no es fácil, pero estos entornos por lo general sí permiten ejecutar JupyterLab o VS Code y tunelizar la UI hasta el usuario final. Antes lideré el equipo que creó el TRE de All of Us.
Claude Science se imagina más fácilmente no como una megaapp de Claude que lo hace todo, sino como algo que levanta un servidor dentro de estos entornos de datos restringidos y solo proxyea la UI al navegador del usuario. Eso será importante para su adopción en entornos de I+D farmacéutica.
Dicho eso, para científicos computacionales de nivel intermedio que usan RStudio, JupyterLab y VS Code todos los días, Claude Science puede ser un tipo de producto bastante extraño. Me pregunto si reemplazará las herramientas existentes de banco de trabajo para ciencia de datos, si se usará junto con ellas o si al final terminará envolviéndolas.
- Desde mi experiencia haciendo bastante trabajo de tipo científico-computacional, combinar Claude Code con las bibliotecas estándar de datos en Python ha sido muy potente y aceleró mucho mi flujo de trabajo.
  Trabajo como analista de datos en una empresa petrolera, con datos interesantes de sensores, y cuando necesito un análisis o una visualización rápidos, Claude escribe en minutos código que a mí me tomaría alrededor de una hora ordenar. El hecho de que conozca lo suficiente las bibliotecas relevantes como para leer y verificar el código es una diferencia importante frente a usar ciegamente una IA de caja negra.
  Sin embargo, ahora mismo Claude Code y Jupyter en VS Code no encajan bien. Cada vez que Claude hace una modificación, provoca que todo el notebook se ejecute de nuevo desde el principio. Así que me estoy alejando un poco de los notebooks, dejando que Claude escriba scripts independientes, y luego invierto tiempo en recombinarlos en un notebook bonito.
- Estoy de acuerdo en que es una arquitectura interesante, pero no tengo claro cómo funcionará en servidores fuertemente controlados.
  Si no puedes conectarte desde una Mac, es muy probable que tampoco permitan que un agente envíe solicitudes desde el servidor.
Probé cómo funciona en mi área, diseño computacional de biopesticidas basados en RNAi.
Le pedí que generara de una sola vez un diseño dirigido al transcriptoma DvSnf7 del gusano de la raíz del maíz occidental, y el enfoque fue bastante ingenuo. Era el tipo de método que usaría alguien en su primer año de doctorado, pero hizo el trabajo
También señaló limitaciones como que usó reglas de diseño para mamíferos o que la revisión de off-targets era limitada. No es terrible, pero tampoco excelente. Al señalarle las fallas, juzgué que la IA sí sabía más y podía abordarlo mejor. Después de eso, el sistema de seguridad de Opus 4.8 marcó la sesión
- Si crees que esto podría usarse realmente para un impacto positivo, convendría que tú, tu institución o tu empresa postulen a los programas bio de OpenAI y Anthropic
- Hoy en día los chistes se hacen solos
  Recomiendo juntar los 10 artículos clave sobre este tema y 10 libros de texto generales del área, convertirlos a texto plano mediante OCR o extracción de texto, y luego intentar la misma tarea con un arnés de agentes mejor, como omp.sh
  /goal set create biopesticide targeting the DvSnf7 transcript of western corn rootworm
  No cometer errores
Cuando dijeron “Science”, no pensé que se refirieran a ciencia de datos, pero una UI llena de código pandas y gráficos da esa impresión
Incluso si se enfoca en áreas científicas, considerando que parece Jupyter Notebook 2.0, quizá sea una de las partes menos valiosas del anuncio
Los casos de uso de entender visualizaciones de datos como imágenes han sido ignorados durante mucho tiempo, y los LLM modernos también son cada vez mejores en análisis exploratorio de datos serio. Aun así, quizá tenga que actualizar mi currículum
- Muchas áreas de las ciencias naturales y sociales usan código matplotlib endeble para generar resultados y visualizaciones, pero no necesariamente lo llaman ciencia de datos
  Por lo que he visto, elegiría sin dudarlo el código generado por Claude antes que el código escrito por gente de matemáticas, física, biología o lingüística. También he visto a Claude cometer errores enormes durante análisis de datos, pero probablemente ya sea más confiable que la mayoría de los académicos que programan
- Por el video, parece que tenían más en mente la bioinformática. Según la definición, puede caer bajo el paraguas de la ciencia de datos, pero en general no se le llama así
  Qué ciencia es lo determina el contenido que se trata, no la cadena de herramientas
- También mencionan cosas como visualización de proteínas y estructuras químicas
- Todos estos productos nuevos empiezan a parecer propaganda del programa espacial soviético. No sé si de verdad hay algo nuevo
Antes de los LLM, los grupos técnicos que seguía debatían activamente qué temas usar, cuándo y para qué, y creo que esas discusiones dieron lugar a muchos frameworks y herramientas del tipo “parece una idea razonable, así que no perdemos nada implementándola”
Lamentablemente, hoy todo gira alrededor de los LLM, y solo se habla de cómo hacer que los LLM funcionen de una u otra forma. Casi no se tratan los temas para los que esos grupos fueron creados originalmente
Me preocupa que a la ciencia le pase pronto lo mismo. En lugar de los temas que realmente deberían discutirse, la conversación sobre LLM podría ocupar ese espacio
- Ya se han invertido cientos de miles de millones de dólares en LLM
  Si no se logra aprovechar de alguna manera los activos existentes, el retorno sobre el capital invertido no va a verse bien
  No es un argumento a favor; solo significa que, al final, la dirección tiene que responder ante accionistas que miran esas métricas de retorno
- Los LLM en general no son muy útiles, y la gente se está dando cuenta
Parece que este anuncio habilitó Claude Desktop para Linux: https://code.claude.com/docs/en/desktop-linux
- Lamentablemente, no soporta distribuciones basadas en Arch. Me pregunto por qué no lo empaquetaron como Flatpak
He usado herramientas parecidas y, aunque son impresionantes, con demasiada frecuencia el LLM genera datos falsos pero plausibles y finge que son reales
Incluso incluye manipulaciones bastante profundas, como configurar conectores de bases de datos simulados para que parezca que obtiene datos del lugar correcto, cuando en realidad usa datos sintéticos
Me pregunto cómo evita eso este producto
En el lado de las biociencias, ¿no era esta la empresa que hacía que los LLM se comportaran como modelos corruptos?
Me pregunto si es algo como Claude Cowork para ciencia, es decir, un producto para usuarios menos técnicos
Un científico con experiencia en programación probablemente preferiría usar Claude Code de forma general e integrarlo con el stack que elija, aunque la comodidad y usabilidad de Claude Science podrían terminar ganando
- Como respondió lebovic, esto no es simplemente Claude Cowork; tiene conexiones y funciones especialmente relacionadas con clústeres HPC
  Puedo imaginar perfectamente a un equipo de laboratorio nacional anterior integrándolo en sus sistemas y abandonando por completo el uso de Claude Code
Creo que deberían llamarlo Claude-bio-big-bucks
¿Qué pasa con ciencias de la Tierra, física e ingeniería? Todos los conectores y tecnologías parecen estar solo del lado de biología y farmacéutica
- Si quieren que las empresas enfocadas en ganar dinero no apunten solo a las ciencias de la vida, basta con financiar todos los demás campos a una escala similar a la cantidad de dinero que se vierte en ciencias de la vida
  Antes de Trump, el presupuesto anual de la NSF era de unos 6.000 a 8.000 millones de dólares, y el presupuesto anual de los NIH era de unos 50.000 millones de dólares. Esa es la diferencia

Beta pública de Claude Science

Banco de trabajo Claude para investigación científica

Resultados reproducibles y flujo de revisión

Cómputo y entornos de ejecución

Trabajo por dominios de ciencias de la vida

Conexión con el stack existente del laboratorio

Conexiones con modelos, herramientas y datos

Ubicación de los datos y verificación

Planes, descuentos para laboratorios y despliegue empresarial

Lecturas relacionadas

1 comentarios

Opiniones en Hacker News