Proyecto europeo de Inteligencia Artificial para el descubrimiento de fármacos
El descubrimiento de fármacos es una fase temprana de la investigación biomédica caracterizada por tiempos prolongados, costos elevados y una alta tasa de fracaso. La identificación de interacciones ligando-proteína —esencial para encontrar “hits” y leads químicos— sigue dependiendo en gran medida de ensayos de cribado experimentales. LIGAND-AI es un proyecto europeo de colaboración público-privada que busca transformar este paradigma mediante el desarrollo de modelos de inteligencia artificial (IA) entrenados con datos experimentales a gran escala para predecir interacciones moleculares de forma precisa y eficiente, reduciendo tanto el coste como el tiempo del proceso de inicio del descubrimiento de fármacos.
Contexto científico del desafío
La etapa de identificación de hits en el descubrimiento de fármacos consiste en detectar pequeñas moléculas que se unan con afinidad suficiente a una diana proteica para justificar una optimización posterior. Tradicionalmente, esto se realiza mediante cribados experimentales de compuestos en bibliotecas químicas extensas, lo que conlleva:
◦ Elevados volúmenes de ensayos con técnicas de alta complejidad instrumental
◦ Selección empírica de compuestos basada en afinidades medibles
◦ Limitaciones para explorar interacciones poco estudiadas dentro del proteoma humano
Esto ha dejado una gran parte de las proteínas humanas sin moduladores químicos conocidos, dificultando el estudio de su función biológica y su potencial como objetivos terapéuticos.
Arquitectura y objetivos de LIGAND-AI
LIGAND-AI es financiado por la Innovative Health Initiative (IHI) con un presupuesto superior a 60 millones de euros para un periodo de cinco años. El consorcio incluye 18 miembros de nueve países, con participación de universidades, instituciones de investigación, empresas farmacéuticas y tecnológicas. Entre ellos figuran el Structural Genomics Consortium (SGC), Pfizer, Goethe University Frankfurt, University College London, Abcam, y otras organizaciones con experiencia en biología estructural, química medicinal e IA aplicada.
Generación de datos experimentales a gran escala
El proyecto parte de la premisa de que los modelos de IA sólo pueden alcanzar alto rendimiento si se entrenan con datos experimentales de alta calidad, estandarizados y accesibles. Por ello, uno de los objetivos centrales de LIGAND-AI es generar un conjunto de datos sin precedentes de interacciones proteína-ligando mediante cribados experimentales masivos:
◦ Miles de proteínas representativas del proteoma humano, incluidas aquellas asociadas a enfermedades raras, neurológicas u oncológicas
◦ Evaluación de interacciones con bibliotecas químicas de millones de compuestos
◦ Producción de datos cuantitativos a escala masiva, con más de 2 billones de puntos de datos previstos, que describen afinidad, cinética y perfiles de unión de ligandos a proteínas
◦ Uso de tecnologías complementarias de cribado para asegurar densidad, redundancia y calidad de datos
◦ Todos los datos se harán públicos bajo principios FAIR (encontrables, accesibles, interoperables y reutilizables), facilitando que la comunidad científica global entrene y evalúe algoritmos predictivos.
Desarrollo y benchmarking de modelos de IA
Con estos conjuntos de datos, LIGAND-AI apoyará la creación y evaluación de modelos de IA capaces de:
Predecir la probabilidad de unión de una molécula específica a una diana proteica
Clasificar compuestos según afinidad estimada
Identificar propiedades químicas y estructurales relevantes para la interacción
Proponer nuevas estructuras candidatas optimizadas para objetivos dados
Los modelos se entrenarán y se confrontarán con resultados experimentales mediante desafíos abiertos y campañas de benchmarking, promoviendo la mejora continua de métodos en la comunidad científica.
Infraestructura abierta y ecosistema colaborativo
LIGAND-AI no es meramente un proyecto interno de datos y algoritmos cerrados; el enfoque de ciencia abierta permitirá:
◦ Que investigadores externos accedan a la base de datos generada
◦ Que se ejecuten benchmarks comparativos entre modelos de IA generados por distintos grupos
◦ Que se compartan herramientas computacionales, métricas y protocolos experimentales
◦ Que se entrene a una nueva generación de científicos interdisciplinarios familiarizados con IA, biología estructural y química medicinal
◦ Que se aporte al objetivo más amplio de Target 2035, que pretende desarrollar moduladores químicos para todas las proteínas humanas conocidas.
Aspectos técnicos relevantes para la biomedicina
Desde un punto de vista biomédico y de ingeniería de datos, LIGAND-AI integra metodologías de frontera:
◦ Cribado adaptativo con robots y ensayos de alta densidad, generando datos de interacción con precisión cuantitativa
◦ Representaciones moleculares avanzadas, como vectores embedding de moléculas y proteínas que capturan tanto características estructurales como contextuales
◦ Modelos de aprendizaje profundo y aprendizaje por transferencia, que pueden generalizar conocimientos a blancos con pocos datos experimentales disponibles
◦ Evaluación integral de las predicciones, comparándolas contra mediciones físicas y bioquímicas reales, y no únicamente contra métricas in silico, para validar su utilidad farmacológica
Estos elementos combinados apuntan a mejorar las etapas de identificación de “hits” y optimización inicial de ligandos, acelerando el paso de conceptos a candidatos que puedan avanzar a fases preclínicas.
Implicaciones para la investigación biomédica
Si tiene éxito, LIGAND-AI podría cambiar varios aspectos del descubrimiento temprano de fármacos:
◦ Reducción del tiempo y coste de cribado experimental, desplazando parte de la carga hacia predicciones robustas de IA
◦ Exploración de proteínas poco estudiadas, acelerando la comprensión de su función biológica
◦ Facilitación de enfoques basados en datos para enfermedades con necesidades insatisfechas
◦ Fomento de un ecosistema colaborativo de datos y modelos, contrarrestando la fragmentación tradicional entre sectores académico e industrial
Además, al momento de escribir estas líneas, el proyecto materializa un modelo de IA en open-source orientada a la biomedicina, lo cual tiene un impacto sociocientífico sobre la democratización de la investigación y la formación de talento experto en IA aplicada a la salud.
Conclusión
LIGAND-AI representa un esfuerzo coordinado para ir más allá de los métodos clásicos de descubrimiento de fármacos mediante la infraestructuración de datos experimentales de alta calidad y el entrenamiento de modelos predictivos de IA que puedan generalizar a nuevas dianas y compuestos. Su enfoque en ciencia abierta, la colaboración multilateral y el desarrollo de infraestructura de datos y modelos promete influir significativamente en el ritmo y alcance de la innovación terapéutica en los próximos años.
Quiza te interese leer :








Deja un comentario