DeepSeek: todas las claves de la bomba china que tumba a ChatGPT, NVIDIA y las Big Tech norteamericanas

Por: The Conversation

China es hoy la indiscutible protagonista tecnológica en el mundo. Podría decirse que ha puesto pie en la Luna de la carrera por la IA.

Hace dos años que OpenAI consiguió el efecto Coca-Cola con su producto estrella, ChatGPT. Pero el nuevo bombazo, que en este caso más bien sería el efecto Bruce Lee, lo han dado DeepSeek-R1 y Qwen 2.5, increíblemente baratos en su desarrollo y de código abierto. Ambos, made in China.

La gente común, que no pertenece a la comunidad de expertos en IA –los de verdad, no los del hype–, apenas conoce la existencia de otras IA, y mucho menos si son o no libres, de código abierto. Hace tiempo que existen alternativas a ChatGPT como Gemini, de Alphabet, que también es una corporación privada norteamericana. Y entre las IA de código abierto, la más usada es LLaMA (Large Language Model Meta AI), que ha servido de base al desarrollo de ALIA, la IA española de código abierto que acaba de estrenarse.

Con todo esto, China es hoy la indiscutible protagonista tecnológica en el mundo. Podría decirse que ha puesto pie en la Luna de la carrera por la IA.

DeepSeek ya se puede usar

DeepSeek-R1, con una interfaz gráfica muy similar a ChatGPT, ya se puede utilizar libremente desde su página web. Ahora serán los usuarios quienes decidan si se quedan o no, pero su atractivo parece irresistible: es gratis, y seguirá siendo gratis. ChatGPT no lo es si se usa con todas sus prestaciones, y Gemini dejará de serlo en cuanto pase su periodo de fidelización.

Pero lo más abrumador de la llegada de DeepSeek es que ha tumbado a un gigante. La salida a la calle del modelo chino ha provocado un desplome del precio del todopoderoso fabricante de chips NVIDIA de más del 16 % en el momento de escribir este artículo (cae en picado por minutos). NVIDIA ha perdido 700 000 millones de dólares en menos de 24 horas. Estamos ante la mayor pérdida de capitalización bursátil de la historia.

Por qué los chinos han abaratado tanto el precio

¿Por qué es tan barato DeepSeek? En primer lugar, sus desarrolladores han reducido enormemente el coste de entrenamiento del modelo en relación con su rendimiento.

Según la propia DeepSeek, han empleado 5,57 millones de dólares (5,33 millones de euros). Para que se entiendan estas cifras, este gasto supone menos de una décima parte del gasto del modelo de pago de la empresa irónicamente llamada OpenAI.

El entrenamiento, siempre según DeepSeek, ha durado 55 días, utilizando un conjunto de 2 048 unidades de procesadores gráficos H800 del fabricante de chips estadounidense NVIDIA, con 671 billones de parámetros. También hay versiones destiladas más pequeñas. De hecho se está replicando el entrenamiento completo de DeepSeek-R1 en Github, una plataforma de desarrollo colaborativo, lo que confirma que estamos ante una IA abierta y libre.

Además, este modelo también es diez veces más pequeño que los de OpenIA, lo que le hace mucho más rápido respondiendo a prompts (instrucciones). Pero la cosa no termina aquí.

En abierto

La empresa responsable de DeepSeek ha publicado su modelo con licencia MIT, es decir, en abierto, y un artículo técnico detallando el completo funcionamiento del modelo para que pueda ser replicado. Todo un regalo para la comunidad científica y una bomba en la línea de flotación de las grandes corporaciones o Big Tech americanas y de los fabricantes de chips, que con excepción del modelo LLaMA de Meta, se quedan un paso atrás. Han visto como una startup china es capaz de publicar un modelo libre cuyo rendimiento está a la altura de sus más sofisticados modelos de licencia propietaria.

En esta imagen, perteneciente a un sistema de evaluación de modelos largos de lenguaje público de HuggingFace, con buena reputación dentro de la comunidad, se puede ver el fantástico rendimiento de DeepSeek.

La respuesta de los ciudadanos

La reacción del público ante el nuevo modelo largo de lenguaje de DeepSeek no se ha hecho esperar.

En la primera semana de mandato de Donald Trump, justo cuando Sam Altman, CEO de OpenAI, subía un vídeo a la red social X diciendo que la sociedad debía repensar el contrato social actual para un futuro desarrollo de las inteligencias artificiales, China se asoma colapsando el mercado con una sola muestra del gran desarrollo tecnológico que muchas veces occidente se obstina en ignorar.

Trump también había anunciado el proyecto de IA Stargate, incorporando a las Big Tech en una alianza sin precedentes, con una inversión de capital estatal de 500 000 millones de dólares. Y entonces, una startup china es capaz de elaborar, y liberar, un modelo con una fabulosa implementación y con una idea técnica feliz, extremadamente eficiente.

Incluso Yann LeCun, jefe de IA de Meta, ha felicitado al equipo chino por un logro que ha supuesto un auténtico terremoto para la comunidad mundial experta en inteligencia artificial.

Estamos ante una muestra de que las Big Tech y, en general, la industria tecnológica estadounidense quizá han subestimado al gigante asiático.

Las caídas en bolsa pueden en parte ser explicadas por la fabulosa recepción del pueblo norteamericano ante el nuevo modelo largo de lenguaje. DeepSeek se ha convertido en la aplicación más descargada en la App Store de Apple este fin de semana en Estados Unidos, ¡por delante de ChatGPT!

La innovación tecnológica desplegada por el gigante asiático en multitud de campos está verdaderamente a la altura de Estados Unidos. Como ejemplo de ello se puede citar el prototipo EAST, que ha logrado mantener un sol artificial de plasma de alto confinamiento en estado estable durante 1 066 segundos, lo que supone un hito clave para conseguir energía de fusión, limpia e inagotable.

En lo que a mí respecta, como investigador, aseguro que ya sigo con mucha atención a las empresas chinas, puesto que su potencial innovador es indiscutible.

Compartir

Entradas recientes

Intendentes bonaerenses buscarán derogar la ley que limita las reelecciones en la Provincia

Los jefes comunales de UxP acordaron presentar un proyecto en la Legislatura que no permite…

7 horas hace

Contagiar coraje para frenar el avance fascista

El proyecto de miseria planificada necesita una justificación moral y cultural para que sea soportado…

8 horas hace

La CGT no es convocante de la marcha anti fascista pero dio libertad de acción a sus sindicatos de base

El Consejo Directivo no pudo llegar a un consenso y solo llamó a "acompañar" la…

8 horas hace

Caputo se enojó por los rumores que aseguran que el FMI exige una devaluación

Según el banco estadounidense, el organismo quiere unificación cambiaria y flotación sucia como condición para…

9 horas hace

Unión por la Patria todavía no unifica una posición respecto de la suspensión de las PASO

El bloque tratará de acordar antes de la sesión del próximo miércoles. Cuáles son las…

10 horas hace

La CGT se reunió con Taty Almeida y manifestó su apoyo a los espacios que sostienen las políticas de memoria

La CGT recibió a la Madre de Plaza de Mayo Línea Fundadora, Taty Almeida, y…

11 horas hace

La ESI también (nos)moviliza

Si imaginamos un mundo sin ESI en las escuelas, el panorama no tarda en volverse…

12 horas hace

El Ministerio de Defensa acató la orden de la Justicia y dio de baja a 23 militares condenados por crímenes de lesa humanidad

Según la Cartera de Luis Petri “no se trató de una decisión unilateral” sino el…

13 horas hace

Björk asegura que Spotify es lo peor que le pasó a los músicos

La artista islandesa se explayó en una entrevista con un medio sueco sobre las desventajas…

13 horas hace

A horas de la reunión del PRO, Santilli visitó Casa Rosada en medio de las tensiones de Karina con Macri

El diputado se reunió con Eduardo "Lule" Menem en su despacho de Balcarce 50. Las…

13 horas hace

Madonna se solidarizó con el colectivo LGBTQ+ tras las polémicas medidas de Trump

La cantante criticó al nuevo gobierno estadounidense en sus redes. Además, en un concierto en…

15 horas hace

Denuncian al intendente Guillermo Montenegro por «vulnerar derechos de personas que trabajan y viven en la calle»

El organismo provincial de control asegura que las autoridades comunales están persiguiendo a quienes trabajan,…

16 horas hace