DeepSeek vs. ChatGPT: ¿quién se impuso en la batalla de la inteligencia artificial?

La empresa china DeepSeek literalmente en pocos días se transformó de una startup poco conocida en el principal tema de debate de la comunidad tecnológica. Su chatbot se disparó hasta la cima de las listas de Apple App Store y Google Play, obligando a analistas de Wall Street y a expertos tecnológicos a replantearse en serio el futuro del liderazgo estadounidense en la inteligencia artificial.

De algoritmos de trading a avances en IA

La historia de DeepSeek no comienza en las oficinas de una startup tecnológica, sino en el mundo de los fondos de cobertura cuantitativos. La empresa surgió de High-Flyer Capital Management, un fondo de cobertura cuantitativo chino que utiliza algoritmos de inteligencia artificial para tomar decisiones de trading.

El fundador del fondo, Liang Wenfeng, entusiasta de la inteligencia artificial, empezó su trayectoria cuando era estudiante de la Universidad de Zhejiang, donde se inició en el trading. En 2015 cofundó High-Flyer y, para 2019, lanzó un fondo de cobertura centrado en desarrollar e implementar algoritmos de IA.

El punto de inflexión llegó en 2023, cuando High-Flyer creó DeepSeek como un laboratorio de investigación independiente dedicado al estudio de herramientas de inteligencia artificial fuera del negocio financiero. Pronto el laboratorio se convirtió en una empresa autónoma con el mismo nombre: DeepSeek.

Desafíos técnicos y soluciones innovadoras

Desde el principio DeepSeek construyó sus propios clústeres de centros de datos para entrenar modelos. Sin embargo, como otras empresas chinas de IA, DeepSeek se enfrentó a las restricciones de exportación de equipos impuestas por Estados Unidos. Para entrenar uno de sus últimos modelos la empresa tuvo que usar chips Nvidia H800, una versión menos potente que la H100 disponible para empresas estadounidenses.

El equipo técnico de DeepSeek se distingue por su juventud. La empresa recluta agresivamente doctores en IA de las principales universidades chinas. Curiosamente, DeepSeek también contrata especialistas sin formación en ciencias de la computación, lo que ayuda a sus tecnologías a comprender mejor una amplia gama de dominios temáticos.

Evolución de los modelos: de los primeros pasos al reconocimiento mundial

En noviembre de 2023 DeepSeek presentó su primer conjunto de modelos: DeepSeek Coder, DeepSeek LLM y DeepSeek Chat. Sin embargo, el verdadero avance ocurrió en la primavera del año siguiente con el lanzamiento de la familia de modelos de nueva generación DeepSeek-V2.

DeepSeek-V2: un punto de inflexión

DeepSeek-V2 es un sistema versátil de análisis de texto e imágenes que demostró resultados impresionantes en distintos benchmarks de IA. La carta de presentación del modelo fue su eficiencia económica: resultó ser considerablemente más barato de operar en comparación con soluciones similares de la época.

El éxito de DeepSeek-V2 obligó a competidores chinos, incluidos ByteDance y Alibaba, a reducir con urgencia los precios de uso de sus modelos, y algunos servicios llegaron incluso a hacerse gratuitos.

DeepSeek-V3: nuevo nivel de rendimiento

El lanzamiento de DeepSeek-V3 en diciembre de 2024 reforzó aún más la reputación de la empresa. Según pruebas internas de DeepSeek, el modelo V3 supera tanto a modelos de acceso abierto como Meta Llama como a modelos "cerrados" disponibles solo vía API, incluido GPT-4o de OpenAI.

R1: revolución en los modelos de razonamiento

Cabe destacar el modelo DeepSeek R1, lanzado en enero de 2025. Este modelo de razonamiento, según DeepSeek, muestra un rendimiento comparable al del modelo o1 de OpenAI en puntos de referencia clave.

El principio de funcionamiento de los modelos de razonamiento es que verifican eficazmente sus propios hechos, lo que ayuda a evitar muchos errores característicos de los modelos convencionales. Aunque estos modelos funcionan más lento —habitualmente segundos o minutos más— demuestran una fiabilidad significativamente mayor en áreas como física, ciencias y matemáticas.

Limitaciones y aspectos políticos

A pesar de los avances, los modelos de DeepSeek tienen limitaciones importantes. Como desarrollos chinos en el campo de la IA, están sujetos a la supervisión del regulador de internet de China para garantizar el cumplimiento de los "valores socialistas fundamentales". En el chatbot DeepSeek, el modelo R1 se niega a responder preguntas sobre la plaza de Tiananmén o la autonomía de Taiwán.

Impacto en el mercado y modelo de negocio

Para marzo de 2024 DeepSeek superó los 16,5 millones de visitas, situándose en el segundo puesto de popularidad, pese a una disminución del 25% del tráfico respecto a febrero. No obstante, estas cifras palidecen frente a ChatGPT, que superó los 500 millones de usuarios activos semanales.

El modelo de negocio de DeepSeek sigue siendo un misterio. La empresa fija precios de sus productos y servicios muy por debajo del mercado, y muchos los ofrece gratis. Al mismo tiempo, DeepSeek no capta fondos de inversión, a pesar del enorme interés de capitales de riesgo.

La empresa explica su competitividad en precios por avances en eficiencia, aunque algunos expertos cuestionan las cifras proporcionadas.

Reacción de la industria: desde la admiración hasta las prohibiciones

Los desarrolladores usan activamente los modelos de DeepSeek, que, aunque no son completamente abiertos en el sentido tradicional, están disponibles bajo licencias liberales que permiten el uso comercial. Según el director general de Hugging Face, Clement Delangue, los desarrolladores crearon más de 500 modelos derivados basados en R1, que en conjunto se descargaron 2,5 millones de veces.

El éxito de DeepSeek provocó reacciones variadas:

Positivas:

Microsoft incluyó a DeepSeek en su servicio Azure AI Foundry
El director general de Nvidia, Jensen Huang, destacó las "excelentes innovaciones" de DeepSeek

Precavidas:

El precio de las acciones de Nvidia cayó un 18% en enero, en parte debido al éxito de DeepSeek
El director general de OpenAI, Sam Altman, se vio obligado a reaccionar públicamente ante los logros del competidor

Hostiles:

OpenAI calificó a DeepSeek de "subsidiado por el Estado" y "controlado por el Estado"
Corea del Sur prohibió el uso de DeepSeek
El estado de Nueva York prohibió DeepSeek en dispositivos gubernamentales
Microsoft prohibió a sus empleados usar DeepSeek por preocupaciones sobre la seguridad de los datos

Consecuencias globales y futuro

El fenómeno DeepSeek obligó a la industria a revisar las ideas sobre los recursos necesarios para crear modelos de IA competitivos. Si las afirmaciones de la empresa sobre la eficiencia computacional son correctas, esto podría cambiar radicalmente la economía del desarrollo de la inteligencia artificial.

Mark Zuckerberg, al responder preguntas sobre el impacto de DeepSeek en el gasto de Meta en IA, subrayó que las inversiones en infraestructura de IA continuarán siendo "una ventaja estratégica" para la empresa.

Perspectivas de desarrollo

El futuro de DeepSeek sigue siendo incierto. Sin duda se lanzarán modelos mejorados, pero el gobierno estadounidense muestra una creciente cautela respecto a lo que percibe como una influencia extranjera nociva.

En marzo de 2025 The Wall Street Journal informó que es probable que Estados Unidos prohíba DeepSeek en dispositivos gubernamentales. El vicepresidente y presidente de Microsoft, Brad Smith, declaró en el Senado que a los empleados de Microsoft no se les permite usar DeepSeek debido a problemas de seguridad de datos y propaganda.

Conclusión

La historia de DeepSeek demuestra cómo los enfoques innovadores en el desarrollo de la IA pueden cambiar rápidamente el equilibrio de poder en el mercado global. Independientemente de las disputas políticas y económicas en torno a la empresa, sus logros técnicos ya han obligado a la industria a revisar concepciones establecidas sobre el desarrollo y la implementación de la inteligencia artificial.

El laboratorio chino ha demostrado que los avances revolucionarios en IA pueden producirse no solo en Silicon Valley, sino en cualquier lugar del mundo donde haya investigadores talentosos y enfoques innovadores para resolver retos tecnológicos.