- Comprender y generar proteínas, los componentes básicos de todas las enfermedades, puede conducir a nuevos fármacos y tratamientos
- Actualmente, el proceso de diseñar proteínas en el laboratorio requiere mucho cómputo y recursos, incluyendo la generación de estructuras de proteínas y secuencias de aminoácidos
- EvoDiff simplifica este proceso al generar proteínas diversas y de alta calidad a partir de una secuencia de proteína dada, sin necesidad de información estructural sobre la proteína objetivo
- EvoDiff, de código abierto, puede usarse para generar nuevas terapias, métodos de administración de fármacos y enzimas para reacciones químicas industriales
- Funciona bajo el principio de que “la secuencia de proteínas lo es todo”, diseñando nuevas proteínas al alejarse del paradigma estructura-función en la ingeniería de proteínas
- El framework EvoDiff se basa en un modelo de 640 millones de parámetros entrenado con datos de diversas especies y clases de funciones proteicas obtenidos de OpenFold Dataset y UniRef50
- Como los modelos modernos de generación de imágenes, es un modelo de difusión que aprende a eliminar gradualmente el ruido de una proteína inicial compuesta casi por completo de ruido y a acercarse a una secuencia de proteína
- Genera nuevas proteínas, llena vacíos en diseños de proteínas existentes y cumple objetivos funcionales específicos
- Al diseñar proteínas en el espacio de secuencias y no en el de estructuras, permite sintetizar proteínas desordenadas que desempeñan un papel importante en la biología y las enfermedades
- La investigación aún no ha sido revisada por pares, y se necesita más trabajo de escalado antes de que el framework pueda usarse comercialmente
- El equipo de EvoDiff planea probar en laboratorio las proteínas generadas por el modelo para determinar su viabilidad y, si tiene éxito, comenzará el trabajo de la siguiente generación del framework
Aún no hay comentarios.