Tecnología7 min lecturaPublicado el 2026-04-07

Claude Mythos Preview: qué significa para las empresas que usan Claude

Anthropic ha desarrollado Mythos Preview, su modelo más potente. Todavía no está disponible al público. Esto es lo que puede hacer, qué cambia para quienes usan Claude hoy y qué significa para las empresas.

En resumen

Mythos Preview es el modelo de frontera de Anthropic, accesible solo para socios seleccionados. Supera a Opus 4.6 en todos los benchmarks de coding y seguridad. Para las empresas que usan Claude hoy, es una señal clara sobre hacia dónde va la tecnología.

Un modelo que Anthropic no quiere vender

SWE-bench Verified es la prueba que mide la capacidad de un modelo para resolver bugs reales en repositorios públicos de GitHub. Claude Opus 4.6 — el mejor modelo disponible hoy — obtiene 80,8 %. Mythos Preview obtiene 93,9 %.

No es un salto marginal. Es la diferencia entre un ingeniero senior y un equipo entero.

Anthropic ha desarrollado Mythos Preview pero ha elegido conscientemente no hacerlo disponible al público. No por limitaciones técnicas, sino por razones de seguridad: las capacidades del modelo en ámbitos críticos como la ciberseguridad y la explotación de software son tan elevadas que requieren un control de acceso mucho más riguroso del que una API pública puede garantizar.

Lo que Mythos Preview puede hacer y Opus 4.6 no consigue

Los números en los benchmarks estándar ya son sorprendentes. Pero la parte más interesante tiene que ver con las capacidades en el ámbito de la seguridad informática.

En Firefox 147 Exploitation — una prueba que mide la capacidad de aprovechar vulnerabilidades reales en un navegador moderno — Opus 4.6 obtiene 15,2 %. Mythos Preview obtiene 84 %. Una brecha que no se mide en puntos porcentuales: se mide en órdenes de magnitud.

Mythos Preview encontró de forma autónoma un bug en OpenBSD que había permanecido oculto durante 27 años, una vulnerabilidad en FFmpeg que había escapado a cinco millones de pruebas automáticas, y vulnerabilidades en el kernel Linux. Estos no son benchmarks construidos a medida: son sistemas reales, en producción, que miles de millones de personas usan cada día.

El salto en las capacidades de coding y razonamiento

En SWE-bench Pro — una variante más difícil con tareas de ingeniería de software reales — Opus 4.6 se queda en 53,4 %. Mythos Preview sube a 77,8 %.

Traducido a la práctica: Mythos Preview es capaz de tomar una codebase compleja, entender la arquitectura, identificar el problema y proponer una solución funcional con una tasa de éxito que supera la de muchos equipos de desarrollo humanos en tareas de dificultad media.

También en CyberGym Vulnerability Reproduction — la reproducción de vulnerabilidades conocidas en entornos controlados — la brecha es clara: 83,1 % frente al 66,6 % de Opus 4.6. Para quienes construyen herramientas de seguridad o trabajan en el ámbito defensivo, esto significa acceso a capacidades de análisis y detección que hoy no existen en ningún otro lugar.

¿Quiere aprovechar al máximo Claude en su empresa?

30 minutos para discutir tu caso específico.

Reservar una llamada

Qué significa para las organizaciones que adoptan Claude hoy

La primera reacción ante noticias como esta suele ser: entonces espero. ¿Tiene sentido esperar a Mythos?

La respuesta es no, y vale la pena entender por qué.

Mythos Preview no es una evolución de Opus 4.6 que estará disponible pronto. Es un modelo de investigación con capacidades que requieren un control de acceso específico. Su lanzamiento público, si alguna vez ocurre, estará condicionado a la securización de esas mismas capacidades que lo hacen poderoso.

Mientras tanto, cada semana que pasa sin implementar Claude en la empresa es una semana de ventaja regalada a los competidores que ya se están moviendo. El ecosistema Claude — desde los modelos accesibles hoy hasta las herramientas de desarrollo, desde MCP hasta los agentes — ya es extraordinariamente capaz.

El modelo al que tiene acceso hoy ya es extraordinario

Claude Opus 4.6 resuelve el 80,8 % de los bugs reales en SWE-bench Verified. Hace pocos meses era un número que parecía ciencia ficción.

Claude Sonnet — el modelo más extendido para las implementaciones enterprise — gestiona context windows de 200.000 tokens, razona sobre documentos complejos, produce código production-grade, soporta workflows empresariales de extremo a extremo. Todo ello con una gobernanza de datos adecuada para contextos enterprise europeos.

Mythos nos dice hacia dónde vamos. Pero lo que existe hoy ya es más que suficiente para transformar procesos reales, reducir costes reales, liberar tiempo real a las personas. No es necesario esperar al próximo salto para empezar a obtener resultados.

Cómo aprovechar al máximo Claude en su empresa

La ventaja de quien empieza hoy no es tener acceso a Mythos Preview. Es tener seis meses, un año de experiencia práctica en el uso de Claude cuando Mythos — o cualquier sucesor — se vuelva accesible.

Entender cómo estructurar los prompts, cómo diseñar workflows agénticos, cómo integrar Claude en los sistemas existentes, cómo formar a los equipos para el uso cotidiano: estas competencias se construyen con el tiempo y con la práctica. No se improvisan cuando llega el siguiente modelo.

Maverick AI trabaja con empresas que quieren construir estas competencias de forma estructurada. Desde la identificación de los casos de uso de alto impacto hasta la puesta en producción, desde la formación de equipos hasta la medición del ROI. Si quiere entender por dónde empezar, hablemos.

¿Quiere aprovechar al máximo Claude en su empresa?

Maverick AI es el partner de referencia de Anthropic en Italia. Ayudamos a las empresas a construir soluciones con Claude: de la estrategia a la producción. Hablemos.

Hablemos de tu estrategia de IA

Domande Frequenti

Mythos Preview es el modelo de inteligencia artificial más avanzado desarrollado por Anthropic. No está disponible al público: Anthropic ha elegido limitar el acceso a socios seleccionados en el marco del Project Glasswing porque sus capacidades en materia de ciberseguridad y explotación de software son tan elevadas que requieren un control de acceso mucho más riguroso del que permite una API pública.
La brecha es significativa en todos los principales benchmarks. En SWE-bench Verified — resolución de bugs reales en repositorios de GitHub — Mythos obtiene 93,9 % frente al 80,8 % de Opus 4.6. En Firefox 147 Exploitation la brecha es aún más marcada: 84 % frente a 15,2 %. En SWE-bench Pro obtiene 77,8 % frente a 53,4 %. No se trata de mejoras marginales: en algunos ámbitos las capacidades son un orden de magnitud superiores.
No se conoce una fecha de lanzamiento público. Anthropic ha explicado que Mythos no se pondrá a disposición hasta que se resuelvan las preocupaciones de seguridad relacionadas con sus capacidades avanzadas en el ámbito cibernético. Para las empresas, el consejo práctico es empezar a trabajar con Claude Opus 4.6 o Sonnet hoy.
Absolutamente. Con el 80,8 % en SWE-bench Verified y capacidades de razonamiento sobre documentos de 200.000 tokens, Opus 4.6 ya es el modelo de IA más potente disponible para uso enterprise. Esperar a Mythos significa regalar meses de ventaja competitiva a los competidores que ya se están moviendo.
El punto de partida es identificar dos o tres procesos de alto impacto donde Claude pueda reducir el tiempo de trabajo manual o mejorar la calidad de los outputs. Maverick AI acompaña a las empresas desde la evaluación inicial hasta la puesta en producción. Si quiere entender qué es realista para su organización, escríbanos.

¿Quiere saber más?

Contáctenos para descubrir cómo podemos ayudar a su empresa con soluciones de IA a medida.

Partner de implementación de Anthropic en Italia. Trabajamos con empresas de PE, pharma, moda, manufactura y consultoría.

Mantente informado sobre IA para empresas

Recibe actualizaciones sobre Claude AI, casos de uso empresariales y estrategias de implementación. Sin spam, solo contenido útil.

Artículos relacionados

Noticias

Project Glasswing: Anthropic y los gigantes tecnológicos unen fuerzas por la seguridad del software

Anthropic ha lanzado Project Glasswing con AWS, Google, Microsoft, Apple, Nvidia y otros gigantes tech para proteger el software crítico mundial con IA. Qué es, cuánto se está invirtiendo y por qué importa para las empresas.

Gobernanza IA

Por qué Anthropic no publica su modelo más potente (y lo que enseña a las empresas)

Anthropic ha desarrollado Mythos Preview, el modelo de IA más potente existente, y ha elegido no ponerlo a disposición. RSP 3.0, comportamientos emergentes en los tests y adopción segura: qué significa para quienes deben gestionar la IA en la empresa.

Gobernanza IA

Cuando la IA escapa del sandbox: lo que la adopción segura enseña a las empresas

Claude Mythos Preview superó los límites de red y envió un correo electrónico a un investigador. Qué significa esto para las empresas que adoptan IA avanzada y cómo construir una gobernanza sólida.

News & Aggiornamenti

Claude Mythos: el próximo gran modelo de Anthropic ya es una realidad — lo que sabemos

Mythos es el próximo modelo frontier de Anthropic: autocorrección recursiva, coding avanzado y razonamiento a largo plazo. Todo lo que sabemos sobre fecha de lanzamiento e impacto enterprise.

Técnico

Cómo la IA encuentra vulnerabilidades zero-day: el método técnico de Claude Mythos Preview

Claude Mythos Preview alcanza el 84 % de éxito en la explotación de Firefox 147. Un análisis técnico del método: desde buffer overflow hasta ROP chain, hasta el reverse engineering a partir de stripped binaries.

Contáctenos
Claude Mythos Preview: Capacidades, Benchmarks e Impacto para las Empresas | Maverick AI