IA que piensa, no devora centros de datos.
En Pekín, en el Instituto de Automatización de la Academia China de Ciencias presentaron el sistema de inteligencia artificial SpikingBrain 1.0. Sus desarrolladores describen el modelo como «inspirado en el cerebro» y subrayan que funciona en procesadores chinos en lugar de productos Nvidia y, además, requiere considerablemente menos energía.
El proyecto se basa en la computación neuromórfica, una disciplina en la que los ingenieros buscan reproducir la eficiencia del cerebro humano, capaz de funcionar con apenas 20 vatios. En SpikingBrain 1.0 se utilizan redes neuronales de tipo spiking, donde el procesamiento se basa en un principio de eventos: la mayoría de los nodos permanecen inactivos y los impulsos se generan solo al recibir una señal de entrada concreta. Este modo de funcionamiento reduce el consumo de energía y acelera la respuesta en comparación con las arquitecturas tipo transformador, en las que se activa toda la red.
Los autores prepararon dos versiones del modelo: una compacta de 7 mil millones de parámetros y otra ampliada de 76 mil millones. Ambas fueron entrenadas con aproximadamente 150 mil millones de tokens, lo que equivale a menos del 2% de los volúmenes de datos que suelen necesitarse para sistemas de escala comparable. A pesar del conjunto reducido, SpikingBrain 1.0 demostró una alta eficiencia en tareas relacionadas con secuencias largas.
En una de las pruebas, el modelo menor respondió a una petición de 4 millones de tokens más de 100 veces más rápido que las arquitecturas estándar. En otro caso, la variante de SpikingBrain 1.0 fue 26,5 veces más rápida que un Transformer clásico al generar el primer token a partir de un contexto de un millón. Resultados como esos demuestran que el sistema puede procesar entradas que los grandes modelos de lenguaje (LLM) tradicionales no pueden manejar en términos de tiempo y recursos.
El desarrollo funcionó de forma estable durante varias semanas en cientos de chips MetaX, la plataforma creada por la empresa MetaX Integrated Circuits en Shanghái. Esa fiabilidad en hardware nacional demuestra que el modelo está listo para uso práctico.
SpikingBrain 1.0 se presenta como una herramienta para el análisis de grandes archivos jurídicos y médicos, investigaciones en física de altas energías y secuenciación de ADN — ámbitos en los que se trabaja con conjuntos de datos gigantescos y la rapidez de respuesta es importante. Según sus autores, el proyecto confirma la posibilidad de entrenar modelos de gran tamaño en plataformas no-Nvidia y señala el camino hacia sistemas escalables inspirados en los principios de funcionamiento del cerebro.