← Volver a noticias

Anthropic Refina Claude con la Versión 4.8 Opus: Mayor Honestidad y Rendimiento Mejorado

Imagen conceptual de un cerebro de IA iluminado con nodos de red interconectados

Anthropic ha presentado Claude 4.8 Opus, la más reciente iteración de su avanzado modelo de inteligencia artificial, marcando un hito notable por su rápida sucesión con la versión 4.7. Esta nueva entrega, lanzada apenas 41 días después de su predecesora, introduce una serie de mejoras que, si bien pueden parecer sutiles a primera vista, incluyen un cambio fundamental en la transparencia del modelo sobre sus propias capacidades.

Opus se posiciona como la línea de modelos de Claude destinada a las tareas más exigentes, especialmente en el ámbito de la programación, y es conocida por su consumo más rápido de límites de uso. En contraste, Anthropic mantiene otras variantes como Sonnet (en su versión 4.6 desde febrero de 2026) para el uso diario y Haiku (en su versión 4.5 desde octubre de 2025) para interacciones sencillas y rápidas.

Una IA con Mayor Integridad y Conciencia

La característica más destacada de Claude 4.8 Opus es su acentuada honestidad. El modelo ahora es significativamente más propenso a admitir cuando no tiene certeza sobre una respuesta o tarea. Las métricas indican que es aproximadamente cuatro veces menos propenso a pasar por alto errores en el código en comparación con su versión anterior, lo cual representa un avance considerable para los desarrolladores que confían en la asistencia de la IA.

Este enfoque en la honestidad también contribuye directamente a la reducción de las alucinaciones, un desafío persistente en los modelos de lenguaje grandes. Al ser más transparente sobre sus limitaciones, Claude 4.8 Opus evita presentar información incorrecta como un hecho.

Avances en Rendimiento y Razonamiento

Más allá de la honestidad, Claude 4.8 Opus muestra mejoras cuantificables en diversas métricas de rendimiento. La puntuación en la creación de código asistido por agentes ha aumentado de un 64.3% a un 69.2%. Asimismo, el razonamiento multidisciplinar que involucra herramientas ha visto una mejora, pasando del 54.7% al 57.9%.

En el banco de pruebas SWE-bench Verified, el rendimiento ha escalado de un 87.6% en Opus 4.7 a un 88.6%. Un salto aún más pronunciado se observa en Terminal-Bench 2.1, donde la puntuación se ha incrementado de 66.1% a 74.6%. Aunque GPT-5.5 aún lidera en flujos de trabajo de terminal y línea de comandos, las mejoras de Claude son notables, y en áreas como la navegación web y la investigación científica a nivel de posgrado, ambos modelos muestran un rendimiento comparable.

Alineamiento y Eficiencia Mejorados

Las evaluaciones de alineamiento en Claude 4.8 Opus revelan nuevos máximos en rasgos prosociales, como el apoyo a la autonomía del usuario y la actuación en su mejor interés. Las tasas de comportamientos desalineados, como el engaño, se han reducido en comparación con Opus 4.7, reforzando el compromiso de Anthropic con un desarrollo de IA ético y beneficioso.

Una mejora significativa para los usuarios es la introducción de un modo rápido que, según Anthropic, es ahora aproximadamente 2.5 veces más rápido que en la versión anterior y tiene un costo hasta tres veces menor. Además, se ha implementado un sistema de “Control de Esfuerzo”, permitiendo a los usuarios seleccionar niveles de procesamiento “extra” o “max” para optimizar los resultados a costa de un mayor consumo de tokens.

Dynamic Workflows y Estructura de Precios

La versión 4.8 Opus también introduce