Anthropic lanza Claude Sonnet 4.5, el mejor modelo de codificación del mundo

Anthropic ha presentado hoy Claude Sonnet 4.5, una evolución de su modelo de lenguaje que promete ser el mejor del mundo en tareas de programación. Este nuevo lanzamiento se suma a su popularidad entre los desarrolladores, junto con otro modelo destacado, Opus.

Mejoras en el modelo

Claude Sonnet 4.5 se caracteriza por su capacidad mejorada para seguir instrucciones y refactorizar código existente. Según los datos de SWE-Bench Verified, un benchmark que evalúa cómo los modelos se desempeñan en pull requests reales de GitHub, Sonnet 4.5 logró un impresionante 77.2% de éxito, y hasta un 82% con computación paralela.

Anthropic destaca que, en algunas áreas específicas, Claude Sonnet 4.5 supera a su modelo insignia anterior, Opus 4.1, especialmente en la resolución de problemas dentro de la industria de servicios financieros. Desde su lanzamiento, Claude Sonnet 4.5 ha alcanzado el primer lugar en el benchmark OSWorld, con una tasa de éxito del 61.4%. Esto supone un notable avance respecto a Sonnet 4, que tenía una tasa de éxito del 43.9%, y también supera el 44% de Opus 4.1.

Mayor autonomía

Una de las características destacadas de Sonnet 4.5 es su capacidad para realizar tareas complejas durante un período de 30 horas de forma autónoma, en comparación con las 7 horas alcanzadas por Opus 4. Anthropic asegura que el nuevo modelo mantiene su enfoque y rendimiento a lo largo de este tiempo, aunque se necesitará más prueba para confirmar esta eficacia en escenarios del mundo real.

Lee también

Jensen Huang de NVIDIA admite error sobre computación cuántica en 2025

Nvidia planea invertir $500 millones en la startup de auto autónomos Wayve

En la mayoría de los benchmarks de programación, Claude Sonnet 4.5 ha demostrado su superioridad frente a competidores como GPT-5 de OpenAI y Gemini 2.5 Pro de Google. Sin embargo, en tareas de razonamiento visual, los modelos de Anthropic han enfrentado mayores desafíos.

Nuevas funcionalidades

Anthropic ha integrado en Sonnet 4.5 varias características novedosas, similares a las que utiliza su agente de programación, Claude Code. Entre estas novedades se incluyen el acceso a máquinas virtuales, gestión de memoria, mejor manejo de contexto y soporte para múltiples agentes.

Un aspecto significativo del lanzamiento es que Sonnet 4.5 es el primero en poder reconstruir la aplicación web Claude.ai, una tarea que tomó alrededor de cinco horas y media y requirió más de 3,000 usos de herramientas.

Michael Truell, CEO de Cursor, comentó sobre el rendimiento del nuevo modelo: “Estamos viendo un desempeño de codificación de última generación en Claude Sonnet 4.5, con mejoras significativas en tareas de largo plazo. Esto refuerza la razón por la cual muchos desarrolladores que utilizan Cursor eligen Claude para resolver sus problemas más complejos”.

Precios y novedades en Claude Code

El precio de Claude Sonnet 4.5 se mantendrá en $3/$15 por millón de tokens de entrada/salida, igual al cobro anterior por Sonnet 4. En relación a Claude Code, el agente de programación de la compañía, este también contará con acceso al nuevo modelo, además de una serie de características adicionales. Claude Code ha generado más de $500 millones en ingresos anuales, con un aumento de más de 10 veces en su uso durante los últimos tres meses.

Una de las incorporaciones más relevantes es la extensión nativa para Visual Studio Code, que permite a los desarrolladores observar en tiempo real los cambios realizados por Claude Code, con diferencias en línea. También se han realizado mejoras en la visibilidad del estado y el historial de prompts en la terminal, que ahora se puede buscar, facilitando la reutilización de comandos de programación.

Otra novedad incluye la implementación de checkpoints, que simplifican el retroceso del código en caso de que Claude Code se desvíe del camino previsto. Anteriormente, este proceso debía hacerse manualmente, lo que complicaba el flujo de trabajo del desarrollador.

SDK de Claude Agent

Para los desarrolladores que desean crear agentes basados en la misma infraestructura de Claude Code, Anthropic lanza el Claude Agent SDK. Este nuevo kit permite construir cualquier agente, incorporando elementos como orquestación de agentes, gestión de memoria, manejo de contexto, y administración de permisos, entre otros.

Además, en el ámbito de la API, se ofrece una herramienta de memoria que ayuda a los agentes a mantener el contexto en tareas de larga duración, junto con una función de gestión automática del contexto, que permitirá a Claude ajustar la ventana de contexto y eliminar datos obsoletos según corresponda.

Experimento "Imagine with Claude"

Por otro lado, Anthropic ha anunciado un experimento denominado "Imagine with Claude", que explora la generación de software y interfaces de usuario en tiempo real. La compañía aclara que “ninguna funcionalidad está predeterminada; ningún código está preescrito. Lo que se observa es a Claude creando en tiempo real, respondiendo y adaptándose a las solicitudes mientras interactúas”.

Aún no se han brindado detalles específicos sobre el funcionamiento interno de este sistema mientras Claude desarrolla aplicaciones, pero el experimento ha sido descrito como una demostración de las capacidades del modelo sonoro 4.5, que podrían definir hacia dónde se dirige la industria de la programación en el futuro cercano.

Aunque "Imagine with Claude" está disponible por tiempo limitado únicamente para suscriptores del plan Claude Max durante los próximos cinco días, señala el potencial para la creación instantánea de software cuando sea necesario, un área que ha sido objeto de interés en el entorno de la inteligencia artificial.

Con el lanzamiento de Claude Sonnet 4.5, Anthropic ha marcado otro hito en el campo de la inteligencia artificial y la programación. Con una serie de mejoras y nueva funcionalidad, este modelo promete revolucionar la forma en que los desarrolladores abordan sus proyectos. Para más actualizaciones en el mundo tecnológico y de la inteligencia artificial, continúe leyendo más noticias en Liven.

Mejoras en el modelo

Lee también

Anthropic lanza la función de memoria para usuarios de Claude Team y Enterprise

Claude: la inteligencia artificial que rivaliza con ChatGPT y sus ventajas

Mayor autonomía

Lee también

Jensen Huang de NVIDIA admite error sobre computación cuántica en 2025

Nvidia planea invertir $500 millones en la startup de auto autónomos Wayve

Nuevas funcionalidades

Precios y novedades en Claude Code

SDK de Claude Agent

Experimento "Imagine with Claude"

¿Te gustó esta noticia?