1 puntos por GN⁺ 2024-09-12 | 1 comentarios | Compartir por WhatsApp

Introducción a Chai-1: descifrando las interacciones de las biomoléculas

  • Lanzamiento de Chai-1
    • Chai-1 es un nuevo modelo nativo multimodal que ofrece rendimiento de vanguardia en diversas tareas relacionadas con el descubrimiento de fármacos
    • Puede predecir de forma integrada proteínas, moléculas pequeñas, DNA, RNA y modificaciones covalentes, entre otros
    • Está disponible gratis a través de una interfaz web y también puede usarse con fines comerciales
    • Para uso no comercial, se ofrecen los pesos del modelo y el código de inferencia como biblioteca de software

Un modelo de vanguardia para interacciones biomoleculares

  • Evaluación de rendimiento
    • Alcanzó una tasa de éxito del 77% en el benchmark PoseBusters (AlphaFold3 logró 76%)
    • Alcanzó un Cα LDDT de 0.849 en el conjunto de predicción de estructura de monómeros proteicos CASP15 (ESM3-98B obtuvo 0.801)
    • No requiere alineamiento múltiple de secuencias (MSA) y mantiene un alto rendimiento incluso en modo de secuencia única
    • En predicción de estructuras multiméricas, muestra una tasa de acierto más alta que el modelo AlphaFold-Multimer (69.8% vs. 67.7%)
    • Puede predecir estructuras multiméricas solo con una secuencia única, con una calidad comparable a la de AlphaFold-Multimer

Un modelo nativo multimodal

  • Uso de datos adicionales
    • Es posible mejorar el rendimiento con nuevos datos, como restricciones derivadas del laboratorio
    • Se exploran varias funciones, como el condicionamiento por epítopo, que duplica la precisión en la predicción de estructuras anticuerpo-antígeno

Publicación del modelo

  • Interfaz web gratuita
    • También puede usarse con fines comerciales
    • Para uso no comercial, el código se publica como biblioteca de software
    • A través de la colaboración con las comunidades de investigación e industria, aporta beneficios a todo el ecosistema

Próximos pasos

  • Antecedentes del equipo
    • Integrado por personas provenientes de empresas líderes de investigación y aplicación de IA como OpenAI, Meta FAIR, Stripe y Google X
    • Desempeña un papel importante en el avance de la investigación biológica con IA
    • Chai-1 es el resultado de varios meses de trabajo intensivo, y esto apenas comienza
    • El objetivo es transformar la biología de ciencia en ingeniería
    • Planean seguir desarrollando modelos basados en IA para predecir y reprogramar las interacciones entre moléculas bioquímicas

Resumen de GN⁺

  • Chai-1 es una herramienta importante para el descubrimiento de fármacos y la investigación en ciencias de la vida, con rendimiento de vanguardia en la predicción de estructuras de proteínas, moléculas pequeñas, DNA y RNA
  • Mantiene un alto rendimiento incluso sin alineamiento múltiple de secuencias, y también muestra un desempeño sobresaliente en la predicción de estructuras multiméricas
  • A través de la colaboración con las comunidades de investigación e industria, aporta beneficios a todo el ecosistema, y ofrece una interfaz web gratuita junto con una biblioteca de software para uso no comercial
  • Con el objetivo de convertir la biología en una disciplina de ingeniería, planea desarrollar más modelos de IA para predecir y reprogramar las interacciones entre moléculas bioquímicas

1 comentarios

 
GN⁺ 2024-09-12
Comentarios de Hacker News
  • Después del incidente de Reflection, surgió entusiasmo por las pruebas independientes
  • Se espera que no se acepten las evaluaciones SOTA tal cual
  • Se descubrió que Chai copió y usó funciones de cuaterniones de pytorch3d
  • El conocimiento de la estructura de las proteínas no es el factor limitante en el desarrollo de fármacos
    • Es interesante estimar el impacto de los resultados en el pipeline de desarrollo de fármacos
  • Los términos "foundation" y "multi-modal" solo aparecen en el resumen del paper
    • Copia el método de AlphaFold y añade embeddings de lenguaje y otras restricciones
    • Faltan datos sobre la mejora del rendimiento
  • El margen de error es muy grande
  • Existe riesgo al hacerlo público
    • Podría usarse indebidamente para desarrollar nuevas armas biológicas
  • Da curiosidad qué tan difícil sería para un biohacker desarrollar nuevas proteínas
  • El título en HN es inexacto
    • Obtener una puntuación 1% más alta no significa haber vencido al modelo anterior
  • Si hubiera una línea de apuestas, sería posible retirarse temprano
  • Es el autor de AutoDock Vina
    • El software de docking necesita generalizar para encontrar nuevos ligandos
    • El enfoque de evaluación no prueba el rendimiento con moléculas nuevas
    • El lanzamiento de Chai-1 ayudará a evaluar métodos