La identificación de pequeñas variaciones en el ADN que pueden marcar la diferencia entre la salud y la enfermedad ha sido durante décadas uno de los grandes retos de la biomedicina. Hoy, ese objetivo parece más cercano gracias a AlphaGenome, la herramienta de inteligencia artificial desarrollada por DeepMind, la división de investigación en IA de Google, capaz de interpretar el genoma humano con un nivel de precisión sin precedentes y de ayudar en el diagnóstico de enfermedades raras y complejas.
El alcance de este avance ha sido tal que la revista Nature le dedica su portada y un artículo central, presentándolo como un hito en la ingeniería genética asistida por inteligencia artificial. Para entender su relevancia, conviene recordar que el genoma funciona como un vasto manual de instrucciones: en sus secuencias de letras —las bases del ADN— se codifica cómo crece un organismo, cómo se reproduce, cómo envejece y qué ocurre cuando algo falla. Descifrar ese lenguaje, especialmente cuando una mínima variación altera el funcionamiento normal de las células, es clave para detectar y tratar miles de enfermedades, desde patologías raras hasta distintos tipos de cáncer.
En los últimos años, la inteligencia artificial ha impulsado grandes avances en la lectura de secuencias largas de ADN y en la predicción de procesos moleculares. DeepMind ya había dado pasos importantes con modelos como Enformer en 2021 y AlphaMissense en 2023. Sin embargo, AlphaGenome supone un salto cualitativo. Según explicaron sus desarrolladores Natasha Latysheva y Pushmeet Kohli en una rueda de prensa organizada por Nature, el nuevo modelo se entrenó utilizando una de las mayores bases de datos genómicas jamás empleadas en aprendizaje automático, procedente de consorcios públicos como ENCODE, GTEx, 4D Nucleome y FANTOM5, y analizando tanto el genoma humano como el del ratón.
La principal diferencia de AlphaGenome frente a sus predecesores está en su resolución y su capacidad de integración. El modelo puede analizar secuencias de ADN de hasta un millón de letras o pares de bases y hacer predicciones con resolución de letra individual. Esto le permite capturar once procesos biológicos distintos con un nivel de detalle extremadamente fino. En la práctica, la herramienta es capaz de predecir en apenas un segundo si una variante genética aumentará o disminuirá la expresión de un gen o si alterará su patrón de empalme, un proceso fundamental en la producción de proteínas.
Además de su precisión, AlphaGenome destaca por funcionar como un modelo unificador. Latysheva explicó que el equipo logró sintetizar en una sola herramienta las mejores ideas existentes en la inteligencia artificial genómica, de modo que AlphaGenome puede realizar tareas que antes requerían hasta cinco modelos distintos. Esta integración facilita el análisis del impacto de variantes genéticas en múltiples niveles y de forma simultánea.
Los resultados avalan su rendimiento. En pruebas con secuencias de ADN únicas, AlphaGenome superó a otros modelos en 22 de 24 evaluaciones, y en la predicción del efecto regulador de variantes genéticas igualó o superó a sus competidores en 24 de 26 casos. Su utilidad es especialmente relevante para el estudio de enfermedades genéticas raras, como la atrofia muscular espinal o algunas formas de fibrosis quística, que pueden estar causadas por errores en el empalme del ARN. El modelo logra representar con precisión la localización y el nivel de expresión de estas uniones, ofreciendo información clave sobre cómo una variante genética concreta puede desencadenar la enfermedad.
La comunidad científica ha recibido el avance con entusiasmo. Lluís Montoliu, investigador del Centro Nacional de Biotecnología del CSIC, señaló que AlphaGenome es capaz de inspeccionar y deducir el funcionamiento de prácticamente todos los elementos reguladores del genoma de manera simultánea y sobre segmentos enormes de ADN, algo que hasta ahora no era posible. En una línea similar, Robert Goldstone, director de Genómica del Instituto Francis Crick de Londres, subrayó que no se trata de una solución mágica para todos los problemas biológicos, pero sí de una herramienta fundamental que convierte el código estático del genoma en un lenguaje comprensible para el descubrimiento científico. En tareas regidas por reglas “gramaticales” rígidas del ADN, como la predicción de sitios de empalme, el modelo ya está listo para reemplazar herramientas tradicionales.
Otro aspecto clave es su disponibilidad. AlphaGenome se ha liberado en abierto para uso no comercial, lo que permite a investigadores de todo el mundo adaptarlo a sus propios conjuntos de datos. Según sus desarrolladores, más de tres mil científicos ya están utilizando el modelo. Esto abre la puerta a una aceleración sin precedentes en la investigación genómica, el diagnóstico de enfermedades raras y el desarrollo de nuevas terapias, consolidando a la inteligencia artificial como una aliada central en la medicina del futuro.
