Anthropic deja a un lado las grandes florituras y basa su nuevo Claude Opus 4.8 en dos mejoras clave: honestidad y rendimiento

Revista Digital – Información de Mercados – Compra Pública Latam.

Ya disponible al mismo precio que su antecesor, este modelo es más fiable, preciso y colaborativo, destacando en pruebas de rendimiento.

La familia Claude no deja de crecer. Anthropic, empresa creadora y propietaria de esta IA, acaba de presentar al nuevo miembro de la rama Opus, Claude Opus 4.8, un modelo que destaca como herramienta colaborativa y que, además, resulta más fiable y preciso a la hora de realizar tareas de agente.

Esta nueva versión, desarrollada tomando como base a su antecesor Claude Opus 4.7, ya se encuentra disponible para los usuarios y usuarias al mismo precio que la versión 4.7, siendo este de 5$ por millón de tokens de entrada y 25$ por millón de tokens de salida.

Qué mejoras trae consigo Claude Opus 4.8

Anthropic ha afirmado que «los usuarios encontrarán en Opus 4.8 una mejora modesta pero tangible con respecto a su predecesor». Desde esta redacción agradecemos esta pizca de honestidad, ya que no todos los nuevos modelos de una IA pueden ser “la revolución del momento”.

Y es que, si bien Claude Opus 4.8 no incluye ninguna funcionalidad nunca antes vista, sí integra mejoras en su rendimiento y capacidades. La evolución progresiva es destacable, aunque a veces se nos olvide en este nuevo paradigma de desarrollo tecnológico frenético.

Claude Opus 4.8 ha obtenido resultados destacados en diversas pruebas de codificación, razonamiento, habilidades agénticas y tareas prácticas de conocimiento. Como puedes apreciar en la siguiente tabla compartida por Anthropic, su rendimiento es superior en estos campos a su predecesor Opus 4.7 y también a modelos de la competencia como GPT-5.5 o Gemini 3.1 Pro. Siendo únicamente superado por GPT-5.5 en las pruebas de codificación agéntica desde la terminal.

tabla comparativa del rendimiento de varios modelos de IA en distintas áreas. En ella se ve que Claude Opus 4.7 destaca en la mayoría de campos frente a otras IAs relevantes.
Fuente: Anthropic

Desde la compañía, destacan la honestidad de este nuevo modelo de IA, que, según indican, muestra cuatro veces menos probabilidades de incluir fallos en el código que su predecesor. «Un problema común con los modelos de IA es que a veces sacan conclusiones precipitadas, afirmando con seguridad haber avanzado en su trabajo a pesar de la escasa evidencia. Los primeros usuarios informan que Opus 4.8 es más propenso a señalar las incertidumbres sobre su funcionamiento y menos propenso a hacer afirmaciones sin fundamento».

Así mismo, Claude Opus 4.8 presenta tasas de comportamiento desalineado (engañar o permitir un mal uso) sustancialmente inferiores a las de Opus 4.7. Un dato relevante, teniendo en cuenta que sabemos que Claude Opus 4.7 tiene prohibido “suponer”.

En lo que respecta a las opiniones de quienes ya lo han probado, estas son muy favorables. Tom Pritchard, ingeniero de plantilla de Shopify, afirma: «Claude Opus 4.8 demuestra una capacidad de juicio notablemente superior. En Claude Code, formula las preguntas adecuadas, detecta sus propios errores, cuestiona cuando un plan no es sólido y genera confianza en exploraciones complejas de múltiples servicios antes de realizar cambios importantes. Es un modelo excelente para desarrollar».

Foto: Anthropic

Fuente: www.marketing4ecommerce.cl