← Volver a noticias

DeepSeek V4: Un Avance Estratégico con Implicaciones para la Carrera Global de IA

Representación abstracta de redes neuronales digitales interconectadas y código binario, con sutiles tonos de azul y verde, evocando la innovación en IA y el hardware chino.

DeepSeek ha desvelado su modelo V4, una actualización significativa que se publica bajo la flexible licencia MIT. Este lanzamiento trae consigo mejoras notables en el procesamiento de código y una arquitectura optimizada para la infraestructura de chips de fabricación china. No obstante, en su propio informe técnico, la compañía ha admitido que su desarrollo se encuentra entre tres y seis meses por detrás de los modelos más avanzados producidos en Occidente.

Este matiz es crucial si consideramos que DeepSeek se posicionó, hace poco más de un año, como un actor capaz de redefinir la narrativa global en el ámbito de la inteligencia artificial. Su irrupción en enero de 2025 generó un impacto considerable en los mercados y alimentó la percepción de que China podía competir al más alto nivel en IA, y además, a un coste significativamente menor.

Un paso adelante, no un salto evolutivo

El modelo V4, si bien no invalida completamente la narrativa que catapultó a DeepSeek, sí introduce una complejidad considerable. El laboratorio, considerado uno de los más importantes de China en el sector de la IA, presenta un modelo que sus propios ingenieros describen como un paso evolutivo más que como un salto disruptivo.

La llegada de V4 se ha visto demorada respecto a las expectativas iniciales. Fuentes del sector, recogidas por el medio 36Kr, apuntan a que DeepSeek experimentó un fallo grave durante la fase de entrenamiento a mediados de 2025. Este incidente ocurrió mientras la compañía intentaba migrar su infraestructura, que dependía de los chips de NVIDIA, hacia la arquitectura Ascend de Huawei.

Adicionalmente, las divergencias internas sobre la dirección técnica del proyecto y las condiciones impuestas por el fundador, Liang Wenfeng, habrían dificultado la ejecución de los planes, resultando en los retrasos mencionados. Como consecuencia, el modelo V4 sigue sin ser multimodal, un objetivo pospuesto debido a limitaciones en la capacidad de cómputo y recursos financieros.

Innovaciones arquitectónicas y dependencia del hardware

Las innovaciones más interesantes de V4 residen en su arquitectura. El modelo introduce TileLang, un lenguaje específico de dominio que permite abstraer el código de bajo nivel de CUDA, el estándar de NVIDIA, para compilarlo eficientemente en diferentes tipos de chips. Asimismo, incorpora MegaMoE, un kernel diseñado para minimizar la latencia en el paralelismo de expertos y que ya opera sobre hardware Ascend.

Sin embargo, es relevante destacar que el entrenamiento del modelo V4 continuó realizándose utilizando GPUs de NVIDIA. Esto sugiere que la ansiada independencia tecnológica es, por el momento, más una aspiración que una realidad plenamente consolidada.

Reconfiguración del mercado chino de IA

Mientras DeepSeek se concentraba en sus desafíos internos, el panorama del mercado de IA en China ha experimentado una reconfiguración significativa. Doubao, de ByteDance, se ha consolidado como el chatbot más descargado en el país. Empresas como MiniMax y Z.ai han dado el salto al mercado bursátil, y Alibaba ha logrado una notable adopción a través de sus aplicaciones verticales.

Es importante notar que DeepSeek nunca tuvo como objetivo principal la construcción de un producto de consumo masivo, y el mercado ha avanzado a un ritmo que no ha esperado a la compañía.

Impacto en la narrativa del open source y futuro incierto

La factura interna también se ha hecho sentir. El laboratorio ha visto cómo talento clave ha migrado hacia competidores como Tencent, ByteDance y Xiaomi. Liang Wenfeng, además, rechazó ceder un 20% de la compañía a un importante inversor no identificado. Por primera vez, DeepSeek ha iniciado una ronda de financiación externa.

El principal perdedor en este escenario parece ser la narrativa del open source chino como una alternativa viable y competitiva a los modelos cerrados occidentales. Un empleado de Qwen ha comentado a 36Kr que "la edad de oro del desarrollo de IA sin ánimo de lucro ha terminado".

La gran interrogante ahora es si DeepSeek podrá recuperar el terreno perdido. El factor determinante en gran medida será el apoyo de Huawei. Si bien su chip Ascend 950 promete una buena escalabilidad con V4, la producción de 750.000 unidades, ajustadas por calidad, apenas equivaldría a una semana de producción estadounidense. La brecha tecnológica se cierra con silicio, no solo con arquitecturas ingeniosas.

Fuente: Ver artículo original