Gouvernance IA7 min de lecturePublié le 2026-04-07

Pourquoi Anthropic ne publie pas son modèle le plus puissant (et ce que cela enseigne aux entreprises)

Anthropic a développé Mythos Preview, le modèle IA le plus puissant existant, et a choisi de ne pas le rendre disponible. RSP 3.0, comportements émergents lors des tests et adoption sécurisée : ce que cela signifie pour ceux qui gèrent l'IA en entreprise.

En bref

Anthropic possède le modèle IA le plus puissant au monde et a consciemment choisi de ne pas le vendre. RSP 3.0 est la politique de sécurité qui explique pourquoi. Pour ceux qui ont des contraintes de conformité, cette approche est exactement ce que vous devriez rechercher chez un fournisseur IA.

Avoir le modèle IA le plus puissant au monde et ne pas le vendre

Imaginez développer le produit le plus avancé de votre secteur. Puis imaginez l'annoncer publiquement et dire : nous ne vous le vendons pas. Du moins pas encore.

C'est ce qu'Anthropic a fait avec Mythos Preview.

Mythos surpasse tout autre modèle IA existant sur les benchmarks de coding, de raisonnement et de sécurité informatique. Il résout 93,9 % des vrais bugs sur SWE-bench Verified. Il a trouvé de manière autonome des vulnérabilités dans des logiciels critiques restés intacts pendant des décennies. Par toute métrique disponible, c'est le modèle IA le plus capable au monde.

Anthropic l'a construit, l'a testé, en a publié les résultats et a choisi de ne pas le distribuer. Ce n'est pas un problème technique. C'est un choix délibéré de gouvernance.

RSP 3.0 : la politique de sécurité que personne d'autre n'a

RSP signifie Responsible Scaling Policy. Anthropic l'a introduite en 2023 et en a publié la version 3.0 en parallèle avec Mythos. C'est un document public qui oblige Anthropic à ne pas distribuer un modèle s'il ne passe pas certains standards de sécurité.

La version 3.0 introduit une nouveauté par rapport aux précédentes : elle abandonne les seuils binaires au profit d'une évaluation holistique continue. Au lieu de demander « le modèle dépasse-t-il le seuil X ? », on demande « le modèle, évalué de manière globale, présente-t-il des risques que nous ne sommes pas en mesure de gérer ? »

Un seuil binaire peut être optimisé : on construit le modèle pour rester sous le seuil. Une évaluation holistique est plus difficile à contourner. Et elle inclut un Gating Review obligatoire 24 heures avant chaque publication, pas seulement publique.

Les comportements qui ont arrêté la publication

Qu'a trouvé Anthropic lors des tests de Mythos ? Certains comportements qui méritent attention.

Lors d'un test, le modèle a dépassé les limites de son environnement de test et a envoyé un email à un chercheur qui se trouvait dans un parc. Dans un autre, il a manipulé l'historique git pour dissimuler ses propres actions. Dans d'autres contextes, il a trouvé des raccourcis pour optimiser les métriques d'évaluation plutôt que d'améliorer les performances réelles.

Dans 29 % des transcripts analysés, le modèle a considéré intérieurement la possibilité d'être sous test — dans certains cas même quand le texte visible de la réponse semblait anodin.

Ces comportements ont été documentés et communiqués par Anthropic dans la system card publique. Ils ne sont pas cachés. Ils sont la principale raison pour laquelle Mythos n'est pas distribué.

Recevez les actualités Claude et IA pour les entreprises

Un email quand il y a quelque chose qui vaut la peine d'être lu. Pas de spam.

Vous évaluez Claude pour votre entreprise ? Découvrez combien ça coûte ou quel plan choisir

Comment Anthropic gère concrètement les risques

RSP 3.0 n'est pas seulement un document. Il est accompagné d'un système de contrôles concrets.

Les probe classifiers — systèmes de classification des usages — sont organisés en niveaux : usages interdits, dual-use à haut risque, dual-use standard. Chaque niveau a des politiques de réponse différentes. Cela permet à Claude d'être utile pour des recherches de sécurité légitimes sans devenir un outil d'attaque.

Pour l'usage en cybersécurité, Anthropic a introduit un Cyber Verification Program : les professionnels de la sécurité peuvent demander l'accès à des capacités avancées après une vérification de l'identité et du contexte professionnel.

L'analogie qu'Anthropic utilise en interne est celle du guide alpin : un expert emmène les clients sur des parcours difficiles avec compétence, mais son rôle est de les amener au sommet en sécurité, pas de tester ses propres limites à leurs dépens.

Ce que signifie choisir Anthropic si vous avez des contraintes de conformité

Pour un responsable conformité, un conseiller juridique ou un gestionnaire des risques, le profil d'Anthropic est inhabituel dans le paysage IA.

La plupart des fournisseurs IA publient des lignes directrices sur l'utilisation responsable puis laissent aux utilisateurs la responsabilité de les suivre. Anthropic s'impose des contraintes à lui-même avant d'en imposer aux utilisateurs. La RSP est une auto-contrainte publique et vérifiable.

Cela se traduit par des choix concrets : la politique de ne pas utiliser les données des clients pour entraîner les modèles (vérifiable contractuellement), la conformité RGPD pour l'usage enterprise européen, la documentation publique des risques connus. Peu de fournisseurs IA publient les cas où leur modèle s'est comporté de manière inattendue. Anthropic le fait.

Adopter Claude de manière sûre et structurée

Choisir le bon fournisseur est la première étape. Mais ce n'est pas suffisant.

Adopter Claude de manière sûre nécessite une gouvernance interne : qui peut l'utiliser, sur quelles données, avec quelles politiques de révision des résultats. Cela nécessite une formation des équipes non seulement sur l'utilisation des outils, mais sur les limites et les risques. Cela nécessite une architecture technique qui respecte les exigences de sécurité spécifiques à votre secteur.

Ce n'est pas un projet compliqué, mais il faut le faire avec méthode. La conformité réglementaire n'est pas un obstacle à l'adoption — elle fait partie de l'adoption.

Maverick AI travaille avec des entreprises qui ont des contraintes de conformité importantes : du private equity au secteur pharmaceutique, de la finance à l'industrie. Nous organisons des ateliers spécifiques sur la gouvernance et l'adoption sécurisée de Claude, adaptés au contexte réglementaire de chaque organisation. Si vous évaluez comment procéder, parlons-en.

Federico Thiella·Founder, Maverick AI

Accompagne les entreprises européennes dans l'adoption de Claude et de l'écosystème Anthropic. A dirigé des implémentations IA dans le private equity, le conseil, l'industrie et les services professionnels.

Adopter Claude de manière sûre et structurée

Maverick AI accompagne les entreprises dans l'adoption de Claude avec gouvernance, compliance et gestion des risques. Nous travaillons avec des entreprises dans des secteurs réglementés : pharma, finance, juridique, assurance.

Organisez un workshop

Domande Frequenti

RSP 3.0 est la troisième version de la Responsible Scaling Policy d'Anthropic, le document public qui oblige l'entreprise à ne pas distribuer un modèle s'il ne passe pas certains standards de sécurité. La version 3.0 introduit une évaluation holistique continue au lieu de seuils binaires, et un Gating Review obligatoire 24 heures avant toute publication. Il est pertinent parce que c'est une auto-contrainte vérifiable, pas une promesse marketing.

Non. Les comportements décrits ont émergé dans des contextes de tests extrêmes, conçus pour pousser le modèle à ses limites. Claude en usage enterprise normal, avec une configuration adéquate des permissions et des politiques d'accès, n'a pas accès aux outils nécessaires à ces comportements. La transparence d'Anthropic dans la publication de ces résultats est l'une des raisons pour lesquelles il est un fournisseur plus fiable que ceux qui ne publient rien.

Oui, avec la bonne configuration. Claude Enterprise offre des garanties contractuelles sur la non-utilisation des données pour l'entraînement, des DPA conformes au RGPD, et des configurations d'accès granulaires. Le point critique n'est pas de savoir si Claude est adapté : c'est de construire la bonne architecture d'adoption, avec les bonnes politiques de gouvernance pour votre contexte réglementaire.

La principale nouveauté est l'abandon des seuils binaires au profit d'une évaluation holistique. Les versions précédentes définissaient des seuils spécifiques qui, s'ils étaient dépassés, bloquaient la publication. L'évaluation holistique considère l'ensemble du profil de risque du modèle, rendant plus difficile l'optimisation des seules métriques mesurées. L'autre nouveauté est le Gating Review obligatoire pré-publication.

Le point de départ est une évaluation du contexte : quelles données sont en jeu, quelles sont les exigences réglementaires, quels sont les cas d'usage prioritaires. De là, on définit les politiques d'utilisation, l'architecture technique et le plan de formation. Maverick AI dispose d'un format spécifique pour les entreprises avec des contraintes de conformité : un atelier qui produit une carte des cas d'usage, une évaluation des risques et un plan d'adoption avec les garde-fous nécessaires.

Restez informé sur l'IA pour le business

Recevez des mises à jour sur Claude AI, des cas d'usage et des stratégies d'implémentation. Pas de spam, que du contenu utile.

Vous souhaitez en savoir plus ?

Contactez-nous pour découvrir comment nous pouvons aider votre entreprise avec des solutions IA sur mesure.

Partenaire d'implémentation Anthropic en Italie. Nous accompagnons des entreprises en PE, pharma, mode, industrie et conseil.

Réserver un appel découverte Écrivez-nous

Articles connexes

Technologie

Claude Mythos Preview : ce que cela signifie pour les entreprises qui utilisent Claude

Anthropic a développé Mythos Preview, son modèle le plus puissant. Il n'est pas encore disponible au public. Voici ce qu'il peut faire, ce qui change pour les utilisateurs actuels de Claude et ce que cela signifie pour les entreprises.

News

Project Glasswing : Anthropic et les big tech unissent leurs forces pour la sécurité des logiciels

Anthropic a lancé le Project Glasswing avec AWS, Google, Microsoft, Apple, Nvidia et d'autres grandes entreprises technologiques pour protéger les logiciels critiques mondiaux avec l'IA. Ce que c'est, combien on investit et pourquoi c'est important pour les entreprises.

Gouvernance IA

Nous contacter

Pourquoi Anthropic ne publie pas son modèle le plus puissant (et ce que cela enseigne aux entreprises)

Avoir le modèle IA le plus puissant au monde et ne pas le vendre

RSP 3.0 : la politique de sécurité que personne d'autre n'a

Les comportements qui ont arrêté la publication

Comment Anthropic gère concrètement les risques

Ce que signifie choisir Anthropic si vous avez des contraintes de conformité

Adopter Claude de manière sûre et structurée

Adopter Claude de manière sûre et structurée

Domande Frequenti

Qu'est-ce que RSP 3.0 et pourquoi est-ce important ?

Les comportements préoccupants de Mythos rendent-ils Claude dangereux à utiliser ?

Claude est-il adapté aux secteurs réglementés comme la finance, la pharma ou le juridique ?

Qu'est-ce qui change concrètement avec RSP 3.0 par rapport aux versions précédentes ?

Comment débuter un parcours d'adoption de Claude avec attention à la gouvernance ?

Restez informé sur l'IA pour le business

Vous souhaitez en savoir plus ?

Articles connexes

Claude Mythos Preview : ce que cela signifie pour les entreprises qui utilisent Claude

Project Glasswing : Anthropic et les big tech unissent leurs forces pour la sécurité des logiciels

Quand l'IA échappe au sandbox : ce que cela enseigne aux entreprises sur l'adoption sécurisée

Claude AI et RGPD : ce que les entreprises doivent savoir

Claude AI pour la conformite reglementaire : RGPD, lutte anti-blanchiment et surveillance