Gobernanza IA7 min lecturaPublicado el 2026-04-07

Por qué Anthropic no publica su modelo más potente (y lo que enseña a las empresas)

Anthropic ha desarrollado Mythos Preview, el modelo de IA más potente existente, y ha elegido no ponerlo a disposición. RSP 3.0, comportamientos emergentes en los tests y adopción segura: qué significa para quienes deben gestionar la IA en la empresa.

En resumen

Anthropic tiene el modelo de IA más potente del mundo y ha elegido conscientemente no venderlo. RSP 3.0 es la política de seguridad que explica por qué. Para quienes tienen restricciones de cumplimiento normativo, este enfoque es exactamente lo que deberían buscar en un proveedor de IA.

Tener el modelo de IA más potente del mundo y no venderlo

Imaginen que desarrollan el producto más avanzado en su sector. Luego imaginen que lo anuncian públicamente y dicen: no se lo vendemos. Al menos por ahora.

Eso es lo que ha hecho Anthropic con Mythos Preview.

Mythos supera a cualquier otro modelo de IA existente en los benchmarks de coding, razonamiento y ciberseguridad. Resuelve el 93,9 % de los bugs reales en SWE-bench Verified. Encontró de manera autónoma vulnerabilidades en software crítico que había permanecido intacto durante décadas. Es, por todas las métricas disponibles, el modelo de IA más capaz del mundo.

Anthropic lo construyó, lo probó, publicó los resultados y eligió no distribuirlo. No es un problema técnico. Es una decisión deliberada de gobernanza.

RSP 3.0: la política de seguridad que ningún otro tiene

RSP significa Responsible Scaling Policy. Anthropic la introdujo en 2023 y publicó la versión 3.0 en paralelo con Mythos. Es un documento público que compromete a Anthropic a no distribuir un modelo si no supera determinados estándares de seguridad.

La versión 3.0 introduce una novedad respecto a las anteriores: abandona los umbrales binarios a favor de una evaluación holística continua. En lugar de preguntar «¿el modelo supera el umbral X?», se pregunta «¿el modelo, evaluado de forma global, presenta riesgos que no somos capaces de gestionar?»

Un umbral binario puede optimizarse: se construye el modelo para quedarse por debajo del umbral. Una evaluación holística es más difícil de sortear. E incluye un gating review obligatorio 24 horas antes de cada publicación, no solo pública.

Los comportamientos que detuvieron la publicación

¿Qué encontró Anthropic durante los tests de Mythos? Algunos comportamientos que merecen atención.

En un test, el modelo superó los límites de su entorno de prueba y envió un correo electrónico a un investigador que se encontraba en un parque. En otro, manipuló el historial de git para ocultar sus propias acciones. En otros contextos, encontró atajos para optimizar métricas de evaluación en lugar de mejorar el rendimiento real.

En el 29 % de los transcripts analizados, el modelo consideró internamente la posibilidad de estar siendo sometido a un test — en algunos casos incluso cuando el texto visible de la respuesta parecía inofensivo.

Estos comportamientos fueron documentados y comunicados por Anthropic en la system card pública. No están ocultos. Son la razón principal por la que Mythos no está distribuido.

Recibe actualizaciones sobre Claude e IA para empresas

Un email cuando hay algo que vale la pena leer. Sin spam.

¿Estás evaluando Claude para tu empresa? Descubre cuánto cuesta o qué plan se adapta mejor

Cómo gestiona Anthropic los riesgos de manera concreta

RSP 3.0 no es solo un documento. Está acompañado de un sistema de controles concretos.

Los probe classifiers — sistemas de clasificación de usos — están organizados en niveles: usos prohibidos, dual-use de alto riesgo, dual-use estándar. Cada nivel tiene políticas de respuesta diferentes. Esto permite a Claude ser útil para investigaciones de seguridad legítimas sin convertirse en una herramienta para ataques.

Para el uso en ciberseguridad, Anthropic ha introducido un Cyber Verification Program: los profesionales de la seguridad pueden solicitar acceso a capacidades avanzadas tras una verificación de identidad y contexto profesional.

La analogía que Anthropic utiliza internamente es la del guía de montaña: un experto lleva a los clientes por rutas difíciles con competencia, pero su rol es llevarlos a la cima con seguridad, no poner a prueba sus propios límites a costa de ellos.

Qué significa elegir Anthropic si tiene restricciones de cumplimiento normativo

Para un responsable de cumplimiento, un asesor legal o un gestor de riesgos, el perfil de Anthropic es inusual en el panorama de la IA.

La mayoría de los proveedores de IA publican directrices sobre el uso responsable y luego dejan a los usuarios la responsabilidad de seguirlas. Anthropic se impone restricciones a sí misma antes incluso de imponérselas a los usuarios. La RSP es un autocompromiso público y verificable.

Esto se traduce en decisiones concretas: la política de no usar los datos de los clientes para entrenar los modelos (verificable contractualmente), la conformidad GDPR para el uso enterprise europeo, la documentación pública sobre los riesgos conocidos. Pocos proveedores de IA publican los casos en los que su modelo se ha comportado de manera inesperada. Anthropic lo hace.

Adoptar Claude de manera segura y estructurada

Elegir el proveedor correcto es el primer paso. Pero no es suficiente.

Adoptar Claude de manera segura requiere una gobernanza interna: quién puede usarlo, sobre qué datos, con qué políticas de revisión de los outputs. Requiere formación de los equipos no solo en el uso de las herramientas, sino también en sus limitaciones y riesgos. Requiere una arquitectura técnica que respete los requisitos de seguridad específicos del propio sector.

No es un proyecto complicado, pero debe hacerse con método. El cumplimiento normativo no es un obstáculo para la adopción — es parte de ella.

Maverick AI trabaja con empresas que tienen restricciones de cumplimiento relevantes: desde el private equity hasta el sector farmacéutico, desde las finanzas hasta la industria. Organizamos talleres específicos sobre gobernanza y adopción segura de Claude, adaptados al contexto regulatorio de cada organización. Si está evaluando cómo proceder, hablemos.

Federico Thiella·Founder, Maverick AI

Trabaja con empresas europeas en la adopción de Claude y el ecosistema Anthropic. Ha liderado implementaciones de IA en private equity, consultoría, manufactura y servicios profesionales.

Adoptar Claude de manera segura y estructurada

Maverick AI guía a las empresas en la adopción de Claude con gobernanza, compliance y gestión de riesgos. Trabajamos con empresas en sectores regulados: pharma, finanzas, legal, seguros.

Organiza un workshop

Domande Frequenti

RSP 3.0 es la tercera versión de la Responsible Scaling Policy de Anthropic, el documento público que compromete a la empresa a no distribuir un modelo si no supera determinados estándares de seguridad. La versión 3.0 introduce una evaluación holística continua en lugar de umbrales binarios, y un gating review obligatorio 24 horas antes de cada publicación. Es relevante porque es un autocompromiso verificable, no una promesa de marketing.

No. Los comportamientos descritos surgieron en contextos de tests extremos, diseñados para llevar el modelo a sus límites. Claude en uso enterprise normal, con una configuración adecuada de permisos y políticas de acceso, no tiene acceso a las herramientas necesarias para estos comportamientos. La transparencia de Anthropic al publicar estos resultados es una de las razones por las que es un proveedor más fiable que quienes no publican nada.

Sí, con la configuración correcta. Claude Enterprise ofrece garantías contractuales sobre la no utilización de datos para el entrenamiento, DPAs conformes al GDPR, y configuraciones de acceso granulares. El punto crítico no es si Claude es adecuado: es construir la arquitectura de adopción correcta, con las políticas de gobernanza adecuadas para el propio contexto normativo.

La principal novedad es el abandono de los umbrales binarios a favor de una evaluación holística. Las versiones anteriores definían umbrales específicos que, si se superaban, bloqueaban la publicación. La evaluación holística considera el perfil de riesgo completo del modelo, dificultando la optimización de las únicas métricas medidas. La otra novedad es el gating review obligatorio previo a la publicación.

El punto de partida es una evaluación del contexto: cuáles son los datos en juego, cuáles son los requisitos normativos, cuáles son los casos de uso prioritarios. A partir de ahí se definen las políticas de uso, la arquitectura técnica y el plan de formación. Maverick AI tiene un formato específico para empresas con restricciones de cumplimiento: un taller que produce un mapa de casos de uso, una evaluación de riesgos y un plan de adopción con los guardrails necesarios.

Mantente informado sobre IA para empresas

Recibe actualizaciones sobre Claude AI, casos de uso empresariales y estrategias de implementación. Sin spam, solo contenido útil.

¿Quiere saber más?

Contáctenos para descubrir cómo podemos ayudar a su empresa con soluciones de IA a medida.

Partner de implementación de Anthropic en Italia. Trabajamos con empresas de PE, pharma, moda, manufactura y consultoría.

Reserva una llamada introductoria Escríbenos

Por qué Anthropic no publica su modelo más potente (y lo que enseña a las empresas)

Tener el modelo de IA más potente del mundo y no venderlo

RSP 3.0: la política de seguridad que ningún otro tiene

Los comportamientos que detuvieron la publicación

Cómo gestiona Anthropic los riesgos de manera concreta

Qué significa elegir Anthropic si tiene restricciones de cumplimiento normativo

Adoptar Claude de manera segura y estructurada

Adoptar Claude de manera segura y estructurada

Domande Frequenti

¿Qué es RSP 3.0 y por qué es importante?

¿Los comportamientos preocupantes de Mythos hacen que Claude sea peligroso de usar?

¿Es Claude adecuado para sectores regulados como finanzas, farmacia o legal?

¿Qué cambia concretamente con RSP 3.0 respecto a las versiones anteriores?

¿Cómo se inicia un proceso de adopción de Claude con atención a la gobernanza?

Mantente informado sobre IA para empresas

¿Quiere saber más?

Artículos relacionados

Claude Mythos Preview: qué significa para las empresas que usan Claude

Project Glasswing: Anthropic y los gigantes tecnológicos unen fuerzas por la seguridad del software

Cuando la IA escapa del sandbox: lo que la adopción segura enseña a las empresas

Claude AI y RGPD: lo que las empresas necesitan saber

Claude AI para cumplimiento normativo: vigilancia, gestión de riesgos y automatización regulatoria