NVIDIA ayuda a crear medicamentos que aún no existen, pero ya funcionan

NVIDIA ayuda a crear medicamentos que aún no existen, pero ya funcionan

Ahora se puede predecir un fármaco sin necesidad de laboratorios: suena peligroso e inspirador.

image

La empresa SandboxAQ, fundada por ex empleados de Google y respaldada por NVIDIA, ha presentado un nuevo conjunto de datos de acceso abierto que podría transformar radicalmente el proceso de desarrollo farmacológico en sus primeras etapas. Se trata de la base de datos masiva SAIR (Structurally Augmented IC50 Repository), que incluye más de 5,2 millones de pares “molécula–proteína” en forma de estructuras tridimensionales sintéticas, vinculadas a datos reales sobre la eficacia de su interacción.

El objetivo del proyecto es superar uno de los cuellos de botella más costosos en farmacología: determinar si un compuesto realmente se unirá a una proteína específica y tendrá el efecto biológico deseado. Esta etapa es clave antes de los ensayos clínicos y puede representar un coste crítico en el proceso.

Tradicionalmente, este proceso implica obtener la estructura tridimensional de la proteína, seguido del modelado o la prueba de miles de posibles fármacos en el laboratorio. Cada compuesto requiere determinar su orientación espacial y evaluar su actividad bioquímica. Es un trabajo que exige mucho tiempo, potencia computacional y una enorme cantidad de operaciones repetitivas.

El nuevo conjunto de datos de SandboxAQ ofrece una vía de escape. Utilizando modelos de plegamiento molecular y la potencia de cálculo de NVIDIA, se creó una biblioteca única de estructuras sintéticas que no han sido observadas directamente en laboratorio, pero que fueron generadas a partir de datos públicos como ChEMBL y BindingDB. Para cada par proteína–molécula con actividad conocida, los desarrolladores generaron hasta cinco conformaciones tridimensionales diferentes y luego seleccionaron las más fiables.

Cada estructura está vinculada a valores concretos de actividad (IC50), lo que permite no solo predecir cómo se ajustará la molécula a la proteína, sino también con qué eficacia actuará. Esta fusión entre geometría y bioquímica es clave para acelerar la selección de candidatos.

Herramientas como esta son esenciales para entrenar modelos de nueva generación, incluidos AlphaFold 3 y Boltz-2. Aunque los sistemas actuales de IA han avanzado mucho en la predicción de estructuras proteicas, todavía enfrentan dificultades con nuevos compuestos o proteínas atípicas. SAIR ofrece una solución: más datos diversos sin depender de las bases privadas de los gigantes farmacéuticos.

La empresa ha declarado que SAIR estará disponible de forma gratuita para todos los investigadores. Sin embargo, el acceso a los modelos avanzados entrenados con esta base será de pago. De este modo, científicos y farmacéuticas podrán evaluar la eficacia de nuevos fármacos casi de forma instantánea y sin necesidad de síntesis física, ahorrando millones y acortando años de desarrollo.

¿Estás cansado de que Internet sepa todo sobre ti?

¡Únete a nosotros y hazte invisible!