Las redes neuronales confunden la física con la memoria al buscar nuevos fármacos.

Los sistemas de IA modernos usados para diseñar medicamentos a menudo resultan no ser tan «inteligentes» como parecen. Un nuevo estudio de la Universidad de Basilea, publicado en la revista Nature Communications, mostró que incluso los algoritmos más avanzados no comprenden la física de la interacción entre proteínas y moléculas, sino que solo memorizan patrones de los datos de entrenamiento.
Las proteínas desempeñan un papel clave en la biología y la medicina. Pueden actuar como principios activos —por ejemplo, enzimas o anticuerpos—, o bien ser dianas para fármacos. Por eso, el primer paso al crear nuevos medicamentos suele ser determinar la estructura tridimensional de la proteína.
Hasta hace poco, eso llevaba años de experimentos de laboratorio. La situación cambió cuando el aprendizaje automático irrumpió en la biología estructural. Modelos como AlphaFold y RosettaFold aprendieron a calcular cómo una cadena de aminoácidos se pliega en una proteína. En 2024, sus desarrolladores recibieron el Premio Nobel de Química.
Las versiones más recientes de estos programas fueron más allá: intentan predecir cómo una proteína interactúa con otra molécula, llamada ligando. Esa capacidad tiene una gran importancia para el desarrollo de fármacos, ya que de la precisión del «encaje» depende si el medicamento podrá actuar.
Sin embargo, los resultados parecían sospechosamente exitosos. El profesor Markus Lill y sus colegas de Basilea decidieron comprobar si realmente los modelos aprenden las leyes de la física y la química o simplemente ajustan las respuestas a patrones conocidos. Para entrenar esos sistemas se utiliza aproximadamente 100.000 estructuras conocidas de proteínas con ligandos: muy pocas para los estándares de la IA.
Los científicos modificaron la secuencia de aminoácidos de cientos de proteínas, alterando o bloqueando por completo las zonas donde deberían unirse las moléculas. Pero los modelos siguieron prediciendo los complejos anteriores, como si la interacción aún fuera posible. Resultados similares se observaron también al modificar los propios ligandos: los algoritmos «no notaban» los cambios.
En más de la mitad de los casos, la IA produjo estructuras idénticas. Según los investigadores, esto demuestra que incluso los modelos más avanzados no comprenden por qué un medicamento se une a una proteína: simplemente reconocen patrones familiares.
Las mayores dificultades surgieron al trabajar con proteínas que no se parecían a las del conjunto de entrenamiento. Precisamente esas proteínas son de especial interés para los farmacólogos, pues abren la puerta a medicamentos totalmente nuevos.
Los autores enfatizan: las predicciones de la IA no deben aceptarse a ciegas; deben verificarse experimentalmente o mediante simulaciones que tengan en cuenta las propiedades físico-químicas reales.
Según los investigadores, el futuro pertenece a los modelos híbridos que integren el aprendizaje automático con las leyes de la física. Esos sistemas podrán ofrecer resultados más precisos y significativos, ayudando a crear fármacos dirigidos a aquellas estructuras proteicas que hasta ahora habían sido una «zona oscura» de la farmacéutica.