Evo 2, el ‘ChatGPT’ de la genética, ya escribe el código de la vida desde cero

Hace no tanto tiempo, el método científico se basaba casi exclusivamente en la observación, el ensayo y el error. Pero ese tiempo pasó. Hoy, la Inteligencia Artificial se ha convertido en la herramienta definitiva, el ‘microscopio del siglo XXI’ que permite a los investigadores ver donde antes no era posible. No es una exageración: la IA ya no solo nos ayuda a escribir correos o generar imágenes, sino que está descifrando los secretos mejor guardados de la naturaleza.Lo hemos visto con AlphaFold , de Google DeepMind, que resolvió en pocos años el problema del plegamiento de proteínas , un enigma que traía de cabeza a los biólogos desde hace medio siglo. Lo vemos en la astronomía , donde algoritmos de aprendizaje profundo analizan millones de señales de radio en busca de exoplanetas o ráfagas rápidas de radio que el ojo humano tardaría décadas en procesar. Y lo vemos en la ciencia de materiales , donde la IA ha predicho la existencia de millones de cristales nuevos para baterías más eficientes. Ahora, sin embargo, hemos dado un paso más allá, y hemos pasado de predecir las formas que puede tener una proteína a comprender el lenguaje mismo de la existencia: el ADN.El modelo que «lee» la evoluciónUn equipo de científicos del Arc Institute, en efecto, en colaboración con la tecnológica NVIDIA y universidades como Stanford y Berkeley, acaba de publicar en ‘Nature’ los detalles de Evo 2, el modelo de biología más grande y potente jamás creado. Si ChatGPT fue entrenado con casi todo el texto disponible en internet para aprender a hablar como un humano, Evo 2 ha sido entrenado con el genoma completo de 128.000 especies de todas las ramas del árbol de la vida.Noticia relacionada No No Google presenta la primera IA capaz de ganar una medalla en la Olimpiada Internacional de Matemáticas José Manuel NievesSe trata de cifras mareantes: 9,3 billones de nucleótidos (las ‘letras’ A, C, G y T que componen el ADN). Para hacerse una idea, baste decir que si pensamos en el genoma humano como un libro, entonces Evo 2 se ha ‘leído’ una biblioteca entera de más de cien mil ‘libros’ similares, que abarcan desde las bacterias más simples hasta las plantas, los animales y, por supuesto, nosotros.Gracias a la arquitectura StripedHyena 2, la IA puede analizar un millón de letras de ADN de una sola vez, detectando patrones que a un científico le costaría años descubrir«Nuestro desarrollo de Evo 1 y Evo 2 -afirma Patrick Hsu, cofundador del Arc Institute y uno de los autores principales de la investigación- representa un momento clave en el campo emergente de la biología generativa, ya que los modelos han permitido que las máquinas lean, escriban y piensen en el lenguaje de los nucleótidos. Evo 2 tiene una comprensión generalista del árbol de la vida que es útil para multitud de tareas, desde predecir mutaciones causantes de enfermedades hasta diseñar código potencial para vida artificial».Así funciona el ‘traductor de genes’El ADN es mucho más que una simple lista de instrucciones. Es un lenguaje complejo, con su propia gramática y sintaxis. A veces, una pequeña variación en una parte del genoma afecta a algo que sucede a miles de letras (A, C, G, T) de distancia. Y los modelos anteriores se ‘perdían’ sin remedio en las secuencias largas, del mismo modo en que alguien olvida el principio de una frase antes de llegar al final.Pero no es el caso de Evo 2, que utiliza una arquitectura revolucionaria llamada StripedHyena 2, que le permite procesar hasta un millón de nucleótidos a la vez. Es decir, ocho veces más de lo que lograba su predecesor, Evo 1. Así, y gracias a la potencia de más de 2.000 GPUs NVIDIA H100, el modelo ha aprendido que la evolución es el experimento más largo de la historia, uno que lleva 4.000 millones de años en marcha.Evo 2 no solo lee el código de la vida; es capaz de escribirlo, generando secuencias de ADN funcionales que la naturaleza ha tardado millones de años en perfeccionar«Al igual que el mundo ha dejado su huella en el lenguaje de Internet utilizado para entrenar grandes modelos lingüísticos -explica Brian Hie, de la universidad de Stanford y coautor del estudio-, la evolución ha dejado su huella en las secuencias biológicas. Esos patrones, refinados durante millones de años, contienen señales sobre cómo funcionan e interactúan las moléculas».De la teoría a la prácticaUno de los resultados más impactantes de Evo 2 ha podido verse ya en oncología, un campo en que los médicos se encuentran a menudo con lo que llaman ‘variantes de significado incierto’ (VUS). Imaginemos que a una paciente se le detecta una mutación en el gen BRCA1 (vinculado al riesgo de cáncer de mama y ovario), pero esa mutación específica no figura en ninguna base de datos clínica. El médico no puede decir si es peligrosa o inofensiva.Pero Evo 2, sí. De hecho, en las pruebas realizadas la IA alcanzó una precisión superior al 90% a la hora de predecir qué mutaciones de BRCA1 son benignas y cuáles no. Algo que podría ahorrar años enteros de experimentos en laboratorio y, lo más importante, salvar vidas al acelerar diagnósticos críticos.El modelo ha sido entrenado con 9,3 billones de nucleótidos, una biblioteca genética que abarca desde bacterias primitivas hasta la complejidad del genoma humanoPero Evo 2 no solo sirve para diagnosticar, sino también para crear. De hecho, los investigadores ya han utilizado el modelo para diseñar fagos sintéticos (virus que atacan bacterias) para combatir la creciente amenaza de las bacterias resistentes a los antibióticos, y nuevos sistemas CRISPR (las famosas ‘tijeras genéticas’) diseñados desde cero por la propia máquina.Medicina ‘a la carta’El potencial, desde luego, es inmenso. Por ejemplo, uno de los grandes problemas actuales es que, al introducir un tratamiento genético, es muy posible que este se ‘active’ en el lugar equivocado, provocando efectos secundarios nocivos. Pero Evo 2 podría diseñar elementos genéticos que solo se activen en células específicas, como neuronas o células del hígado.«Si tienes una terapia génica que quieres que se active sólo en las neuronas para evitar efectos secundarios -señala por su parte Hani Goodarzi, coautor y biólogo computacional en la Universidad de California, San Francisco- podrías diseñar un elemento genético que solo sea accesible en esas células específicas. Este control preciso podría ayudar a desarrollar tratamientos más específicos y con menos efectos secundarios».Las cuestiones éticasPor supuesto, y como ocurre con cualquier tecnología disruptiva, el uso masivo de esta IA suscita dudas y no está exento de sombras. Porque si una IA es tan potente que puede diseñar genomas, ¿no podría alguien malintencionado usarla para crear patógenos peligrosos ? Los científicos de Arc y NVIDIA son conscientes de ese riesgo desde el primer día y, para evitarlo, han excluido deliberadamente del conjunto de entrenamiento los genomas de patógenos que infectan a humanos y otros organismos complejos. Además, han sometido al modelo a pruebas de ‘red-teaming’ (ataques simulados) para asegurar que la IA no responda a consultas sobre cómo crear virus peligrosos. Cuando se le pide algo así, el modelo simplemente falla o da respuestas aleatorias.Los investigadores han ‘capado’ el acceso de la IA a patógenos humanos para evitar que la herramienta se utilice para crear virus peligrososAun así, la decisión de mayor impacto del Arc Institute ha sido hacer que Evo 2 sea totalmente código abierto (open source). Es decir, que cualquier investigador del mundo, ya esté en una gran farmacéutica o en una modesta universidad, puede acceder al modelo y a su código. «Queremos que otros nos sorprendan con lo que hacen con él», dicen los autores en su artículo.MÁS INFORMACIÓN noticia Si Como en la película de Kubrick: experimentos con chimpancés revelan por qué nos fascinan los cristales noticia Si Así conquistó América nuestro ancestro más antiguoEstamos, sin duda, ante una nueva era. Una en que la IA ya no es solo una mera curiosidad digital, sino la llave que está abriendo las puertas mismas de nuestra propia biología. En palabras de Dave Burke, CTO de Arc: «Puedes pensar en el modelo casi como el núcleo de un sistema operativo, donde puedes tener múltiples aplicaciones diferentes construidas encima». Todo apunta, pues, a que el futuro de la medicina no se escribirá solo en tubos de ensayo, sino en líneas de un código que, por fin, somos capaces de entender. Hace no tanto tiempo, el método científico se basaba casi exclusivamente en la observación, el ensayo y el error. Pero ese tiempo pasó. Hoy, la Inteligencia Artificial se ha convertido en la herramienta definitiva, el ‘microscopio del siglo XXI’ que permite a los investigadores ver donde antes no era posible. No es una exageración: la IA ya no solo nos ayuda a escribir correos o generar imágenes, sino que está descifrando los secretos mejor guardados de la naturaleza.Lo hemos visto con AlphaFold , de Google DeepMind, que resolvió en pocos años el problema del plegamiento de proteínas , un enigma que traía de cabeza a los biólogos desde hace medio siglo. Lo vemos en la astronomía , donde algoritmos de aprendizaje profundo analizan millones de señales de radio en busca de exoplanetas o ráfagas rápidas de radio que el ojo humano tardaría décadas en procesar. Y lo vemos en la ciencia de materiales , donde la IA ha predicho la existencia de millones de cristales nuevos para baterías más eficientes. Ahora, sin embargo, hemos dado un paso más allá, y hemos pasado de predecir las formas que puede tener una proteína a comprender el lenguaje mismo de la existencia: el ADN.El modelo que «lee» la evoluciónUn equipo de científicos del Arc Institute, en efecto, en colaboración con la tecnológica NVIDIA y universidades como Stanford y Berkeley, acaba de publicar en ‘Nature’ los detalles de Evo 2, el modelo de biología más grande y potente jamás creado. Si ChatGPT fue entrenado con casi todo el texto disponible en internet para aprender a hablar como un humano, Evo 2 ha sido entrenado con el genoma completo de 128.000 especies de todas las ramas del árbol de la vida.Noticia relacionada No No Google presenta la primera IA capaz de ganar una medalla en la Olimpiada Internacional de Matemáticas José Manuel NievesSe trata de cifras mareantes: 9,3 billones de nucleótidos (las ‘letras’ A, C, G y T que componen el ADN). Para hacerse una idea, baste decir que si pensamos en el genoma humano como un libro, entonces Evo 2 se ha ‘leído’ una biblioteca entera de más de cien mil ‘libros’ similares, que abarcan desde las bacterias más simples hasta las plantas, los animales y, por supuesto, nosotros.Gracias a la arquitectura StripedHyena 2, la IA puede analizar un millón de letras de ADN de una sola vez, detectando patrones que a un científico le costaría años descubrir«Nuestro desarrollo de Evo 1 y Evo 2 -afirma Patrick Hsu, cofundador del Arc Institute y uno de los autores principales de la investigación- representa un momento clave en el campo emergente de la biología generativa, ya que los modelos han permitido que las máquinas lean, escriban y piensen en el lenguaje de los nucleótidos. Evo 2 tiene una comprensión generalista del árbol de la vida que es útil para multitud de tareas, desde predecir mutaciones causantes de enfermedades hasta diseñar código potencial para vida artificial».Así funciona el ‘traductor de genes’El ADN es mucho más que una simple lista de instrucciones. Es un lenguaje complejo, con su propia gramática y sintaxis. A veces, una pequeña variación en una parte del genoma afecta a algo que sucede a miles de letras (A, C, G, T) de distancia. Y los modelos anteriores se ‘perdían’ sin remedio en las secuencias largas, del mismo modo en que alguien olvida el principio de una frase antes de llegar al final.Pero no es el caso de Evo 2, que utiliza una arquitectura revolucionaria llamada StripedHyena 2, que le permite procesar hasta un millón de nucleótidos a la vez. Es decir, ocho veces más de lo que lograba su predecesor, Evo 1. Así, y gracias a la potencia de más de 2.000 GPUs NVIDIA H100, el modelo ha aprendido que la evolución es el experimento más largo de la historia, uno que lleva 4.000 millones de años en marcha.Evo 2 no solo lee el código de la vida; es capaz de escribirlo, generando secuencias de ADN funcionales que la naturaleza ha tardado millones de años en perfeccionar«Al igual que el mundo ha dejado su huella en el lenguaje de Internet utilizado para entrenar grandes modelos lingüísticos -explica Brian Hie, de la universidad de Stanford y coautor del estudio-, la evolución ha dejado su huella en las secuencias biológicas. Esos patrones, refinados durante millones de años, contienen señales sobre cómo funcionan e interactúan las moléculas».De la teoría a la prácticaUno de los resultados más impactantes de Evo 2 ha podido verse ya en oncología, un campo en que los médicos se encuentran a menudo con lo que llaman ‘variantes de significado incierto’ (VUS). Imaginemos que a una paciente se le detecta una mutación en el gen BRCA1 (vinculado al riesgo de cáncer de mama y ovario), pero esa mutación específica no figura en ninguna base de datos clínica. El médico no puede decir si es peligrosa o inofensiva.Pero Evo 2, sí. De hecho, en las pruebas realizadas la IA alcanzó una precisión superior al 90% a la hora de predecir qué mutaciones de BRCA1 son benignas y cuáles no. Algo que podría ahorrar años enteros de experimentos en laboratorio y, lo más importante, salvar vidas al acelerar diagnósticos críticos.El modelo ha sido entrenado con 9,3 billones de nucleótidos, una biblioteca genética que abarca desde bacterias primitivas hasta la complejidad del genoma humanoPero Evo 2 no solo sirve para diagnosticar, sino también para crear. De hecho, los investigadores ya han utilizado el modelo para diseñar fagos sintéticos (virus que atacan bacterias) para combatir la creciente amenaza de las bacterias resistentes a los antibióticos, y nuevos sistemas CRISPR (las famosas ‘tijeras genéticas’) diseñados desde cero por la propia máquina.Medicina ‘a la carta’El potencial, desde luego, es inmenso. Por ejemplo, uno de los grandes problemas actuales es que, al introducir un tratamiento genético, es muy posible que este se ‘active’ en el lugar equivocado, provocando efectos secundarios nocivos. Pero Evo 2 podría diseñar elementos genéticos que solo se activen en células específicas, como neuronas o células del hígado.«Si tienes una terapia génica que quieres que se active sólo en las neuronas para evitar efectos secundarios -señala por su parte Hani Goodarzi, coautor y biólogo computacional en la Universidad de California, San Francisco- podrías diseñar un elemento genético que solo sea accesible en esas células específicas. Este control preciso podría ayudar a desarrollar tratamientos más específicos y con menos efectos secundarios».Las cuestiones éticasPor supuesto, y como ocurre con cualquier tecnología disruptiva, el uso masivo de esta IA suscita dudas y no está exento de sombras. Porque si una IA es tan potente que puede diseñar genomas, ¿no podría alguien malintencionado usarla para crear patógenos peligrosos ? Los científicos de Arc y NVIDIA son conscientes de ese riesgo desde el primer día y, para evitarlo, han excluido deliberadamente del conjunto de entrenamiento los genomas de patógenos que infectan a humanos y otros organismos complejos. Además, han sometido al modelo a pruebas de ‘red-teaming’ (ataques simulados) para asegurar que la IA no responda a consultas sobre cómo crear virus peligrosos. Cuando se le pide algo así, el modelo simplemente falla o da respuestas aleatorias.Los investigadores han ‘capado’ el acceso de la IA a patógenos humanos para evitar que la herramienta se utilice para crear virus peligrososAun así, la decisión de mayor impacto del Arc Institute ha sido hacer que Evo 2 sea totalmente código abierto (open source). Es decir, que cualquier investigador del mundo, ya esté en una gran farmacéutica o en una modesta universidad, puede acceder al modelo y a su código. «Queremos que otros nos sorprendan con lo que hacen con él», dicen los autores en su artículo.MÁS INFORMACIÓN noticia Si Como en la película de Kubrick: experimentos con chimpancés revelan por qué nos fascinan los cristales noticia Si Así conquistó América nuestro ancestro más antiguoEstamos, sin duda, ante una nueva era. Una en que la IA ya no es solo una mera curiosidad digital, sino la llave que está abriendo las puertas mismas de nuestra propia biología. En palabras de Dave Burke, CTO de Arc: «Puedes pensar en el modelo casi como el núcleo de un sistema operativo, donde puedes tener múltiples aplicaciones diferentes construidas encima». Todo apunta, pues, a que el futuro de la medicina no se escribirá solo en tubos de ensayo, sino en líneas de un código que, por fin, somos capaces de entender.  

Hace no tanto tiempo, el método científico se basaba casi exclusivamente en la observación, el ensayo y el error. Pero ese tiempo pasó. Hoy, la Inteligencia Artificial se ha convertido en la herramienta definitiva, el ‘microscopio del siglo XXI’ que permite a los investigadores ver … donde antes no era posible. No es una exageración: la IA ya no solo nos ayuda a escribir correos o generar imágenes, sino que está descifrando los secretos mejor guardados de la naturaleza.

 RSS de noticias de ciencia

Noticias Similares