La carrera por la supremacía en inteligencia artificial generativa ha recibido un nuevo y potente contendiente. DeepSeek ha presentado su modelo V4, una propuesta de código abierto que no solo promete desafiar a los modelos fundacionales propietarios de empresas como Anthropic, OpenAI o Google, sino que lo hace con una notable reducción de costes y una flexibilidad de hardware sin precedentes.

Tras 484 días de desarrollo desde su anterior hito, la espera ha culminado con DeepSeek V4, un modelo de pesos abiertos de dimensiones colosales. Este lanzamiento tiene el potencial de reconfigurar el panorama actual de la IA, democratizando el acceso a capacidades de vanguardia.

Arquitectura y Eficiencia: La Clave del Rendimiento

DeepSeek V4 se presenta en dos variantes: Pro y Flash. La versión Pro cuenta con 1.6 billones de parámetros totales, de los cuales 49 mil millones están activos en cada inferencia. La versión Flash, aunque considerablemente más pequeña con 248 mil millones de parámetros totales, mantiene 13 mil millones activos, una cifra aún enorme para un modelo de esta categoría.

Ambas versiones emplean una arquitectura Mixture-of-Experts (MoE). Esta tecnología es fundamental para su eficiencia, ya que permite que solo una fracción de los parámetros del modelo se active durante cada tarea de inferencia. El resultado es una drástica reducción en el coste computacional.

Además, DeepSeek V4 hereda y mejora la capacidad de su predecesor en el manejo de contextos extensos. Las dos versiones soportan ahora una ventana de contexto de hasta un millón de tokens, un salto exponencial desde los 128.000 tokens de v3. En términos de cómputo por token, el modelo V4 es un 73% más eficiente que v3.2, requiriendo solo el 27% de las operaciones y el 10% de la caché KV.

Benchmarks y Comparativas: A la Altura de los Líderes

Las pruebas internas realizadas por DeepSeek sugieren que su modelo V4 Pro-Max, optimizado para el razonamiento, iguala o supera a referentes de la industria como Claude Opus 4.6 Max, GPT-5.4 xHigh, Gemini 3.1 Pro High, Kimi K2.6 y GLM 5.1. Si bien estos resultados carecen de verificación independiente y deben ser tomados con cautela, los números presentados son significativos.

En el benchmark de programación LiveCodeBench, por ejemplo, DeepSeek V4-Pro-Max alcanzó un impresionante 93,5%, superando al 88,8% de Opus 4.6 y al 91,7% de Gemini 3.1 Pro. En otras métricas, la variabilidad existe, pero la promesa es clara: DeepSeek V4 Pro se posiciona como un competidor directo de los modelos más avanzados del mercado.

El Factor Económico: IA de Vanguardia a un Precio Revolucionario

Uno de los aspectos más disruptivos de DeepSeek V4 es su coste. Siguiendo la estela de su versión anterior, los precios oficiales de la variante Pro son de 1,74 dólares por millón de tokens de entrada y 3,48 dólares por millón de tokens de salida. Esto representa hasta siete veces menos que modelos como Opus 4.7 y casi nueve veces menos que GPT-5.5.

La versión Flash de DeepSeek V4 reduce aún más la barrera económica, con costes de 0,14 y 0,28 dólares por millón de tokens de entrada y salida respectivamente. Esto contrasta fuertemente con el coste de modelos como GPT-5.4 Mini, que puede ser hasta 16 veces superior. La conclusión es contundente: si DeepSeek V4 cumple sus promesas, ofrece un valor excepcional en el mercado de la IA.

Hardware y Geopolítica: El Dilema de la Dependencia Tecnológica

Un punto de particular interés es el hardware utilizado para entrenar y operar DeepSeek V4. Aunque DeepSeek no ha revelado los detalles específicos de su infraestructura de entrenamiento, se sabe que el modelo está diseñado para funcionar eficientemente tanto en los chips NVIDIA como en los Ascend de Huawei. La compañía china ha confirmado que sus clústeres Ascend Supernode, basados en los Ascend 950, brindan soporte completo para DeepSeek V4.

Este soporte para hardware chino ha sido objeto de análisis geopolítico. Informes previos sugerían que la adaptación del modelo para los chips de Huawei fue un factor clave en su desarrollo. Para empresas como NVIDIA, la creciente independencia de otros ecosistemas de hardware en el desarrollo de IA avanzada podría ser percibida como una noticia desfavorable, reduciendo la dependencia global de sus propias soluciones.

Sin embargo, el lanzamiento de DeepSeek V4 se produce en un contexto de reestructuración interna. Guo Daya, una figura clave en el desarrollo de las versiones v1 y v3, se ha unido a ByteDance para trabajar en agentes de IA, y Luo Fuli, quien lideró el desarrollo de la versión v3, también ha dejado la compañía. El texto original no detalla las implicaciones completas de estos movimientos en la trayectoria futura de DeepSeek.

Fuente: Ver artículo original