Le modèle Zero Trust pour les agents d'IA : comment mettre en œuvre le cadre proposé par Anthropic

Le livre blanc d'Anthropic commence par une déclaration qui encadre le passé et le présent de l'IA et de la sécurité des données : "Les défenses de cybersécurité basées sur le périmètre ne peuvent pas suivre le rythme des menaces modernes, et les menaces elles-mêmes s'accélèrent."

La première moitié est vraie depuis des années. L’ingénierie sociale a remplacé les malwares comme méthode d’attaque privilégiée. Les identifiants volés sont un facteur dans 86 % des violations de données, contournant complètement les défenses de cybersécurité basées sur le périmètre.

La seconde partie se confirme maintenant. L’IA accentue les menaces : elle offre aux attaquants davantage d’outils pour intensifier leurs attaques d’ingénierie sociale et révèle toute l’étendue de la zone d’impact, c’est-à-dire le volume total de données auquel une seule identité compromise peut donner accès. Les agents contournent les contrôles applicatifs qui faisaient autrefois barrière entre les identités et les données, en se connectant directement aux bases de données, aux API, et aux dépôts de données, et en accédant aux données à la vitesse machine.

La réponse d’Anthropic est d’appliquer le Zero Trust aux agents.

Les six piliers du cadre Zero Trust d'Anthropic

La philosophie Zero Trust — ne rien croire, tout vérifier, partir du principe qu’une intrusion a déjà eu lieu — est une philosophie de sécurité en vigueur depuis le début des années 1990. C’est un fondement éprouvé. Anthropic soutient que ce principe doit prendre une nouvelle forme pour les systèmes agents : des identités ancrées crypto-graphiquement, des autorisations définies par tâche, une mémoire protégée contre l’empoisonnement, et des opérations défensives s’exécutant à la vitesse des attaquants autonomes.

Ce livre blanc présente un cadre pratique articulé autour de six piliers fondamentaux :

Identité et authentification de l’agent : Passer de l’identité humain/utilisateur à l’identité d’agent enraciné crypto-graphiquement. Chaque agent doit avoir une preuve vérifiable de ce que c’est, de qui l’a déployé et de ce à quoi il est autorisé.
Contrôle d’accès et gestion des privilèges : Remplacer l’accès basé sur les rôles par des permissions attribuées à chaque tâche individuelle. Un agent autorisé à lire une base de données pour une requête ne devrait pas conserver cet accès pour la suivante.
Observabilité et audit : Journalisation complète et surveillance du comportement des agents, des appels aux outils et de l’accès aux données.
Surveillance comportementale et réponse : analyse continue des actions des agents afin de détecter les modèles anormaux, malveillants ou non conformes – à la vitesse de la machine et non à la vitesse de l'homme .
Validation des entrées et contrôles des sorties : Protections contre l’injection de prompt, l’empoisonnement des outils et les fuites de données à chaque limite d’agent.
Intégrité et récupération : protéger la mémoire de l’agent contre l’empoisonnement et garantir que les systèmes puissent se remettre d’une compromission.

Anthropic identifie également les menaces spécifiques qui différencient les agents de l’informatique traditionnelle : injection de prompt, empoisonnement des outils, abus d’identité et de privilège, empoisonnement de la mémoire et attaques de la chaîne d’approvisionnement.

Ce n'est pas théorique. Les modèles d'IA de pointe sont déjà capables d'enchaîner plusieurs failles et de générer des exploits fonctionnels en quelques heures, réduisant ainsi un processus qui prenait auparavant plusieurs mois.

Get started with a free AI Data Risk Assessment.

Get your assessment

Des scénarios d'attaque tels que « Reprompt » sont déjà utilisés pour retourner les systèmes d'IA contre les organisations qui les déploient. Abdiel Santos, spécialiste des attaques par IA chez Varonis, a récemment animé un atelier consacré aux attaques par IA, au cours duquel il a démontré comment le comportement des chatbots et des agents pouvait être détourné pour effectuer des actions non autorisées.

Le cadre d'Anthropic répartit ces six piliers fondamentaux en trois niveaux de maturité — fondation, avancé et optimisé — et décrit un flux de travail d'implémentation en huit phases couvrant l'identité, le contrôle d'accès, le sandboxing, les contrôles d'entrée/sortie et la protection de la mémoire. Il introduit également le concept d'Agentic SOAR : une orchestration, une automatisation et une réponse de sécurité suffisamment rapides pour contrer les attaques accélérées par l'IA.

C’est un point de départ bien organisé et utile pour toute organisation déployant des agents. Nous vous encourageons à le lire.

Le cadre est solide. La mise en œuvre est ce qui compte.

Le cadre Zero Trust for AI Agents d’Anthropic définit le « quoi ». La question suivante que chaque organisation devrait se poser est : « Comment ? » Comment mettre concrètement en œuvre le modèle Zero Trust for AI Agents dans un environnement d’IA vaste et hétérogène ?

Nous partageons la conviction d’Anthropic que la sécurité de l’IA nécessite une approche fondamentalement différente. Comme l’a écrit David Gibson, notre vice-président principal des programmes stratégiques : l’IA ne crée pas de nouveaux risques liés aux données — elle amplifie ceuxexistants. Les autorisations excessives qui sont restées inactives pendant des années deviennent cruciales lorsqu’un agent les hérite. Des données sensibles qui étaient théoriquement accessibles deviennent pratiquement exposées lorsqu’un agent IA peut les trouver, raisonner dessus et agir en quelques secondes.

La première réaction du secteur de la sécurité a consisté à ajouter des contrôles spécifiques à l'IA aux infrastructures existantes : filtres de prompt, analyseurs de modèles et inventaires autonomes. Ces solutions ciblent la couche IA, mais négligent la couche de données. Or, c'est au niveau des données que les problèmes surviennent.

C’est là que Varonis Atlas intervient.

Comment Varonis Atlas applique le Zero Trust pour les agents IA

Varonis Atlas est une plateforme complète de sécurité IA Grâce à Atlas, les organisations disposent des moyens nécessaires pour mettre en œuvre le modèle Zero Trust pour les agents d’IA tout au long du cycle de vie de la sécurité.

Voici en quoi Atlas s'inscrit dans le cadre défini par Anthropic — et en quoi il va plus loin.

Découverte : AI inventory et Shadow AI

On ne peut pas imposer le moindre privilège à des agents dont on ne connaît pas l’existence. Atlas découvre en permanence les systèmes d’IA à travers le cloud, le SaaS, les dépôts de code et les plateformes d’IA, y compris Shadow AI, afin de constituer un inventaire complet et vivant des agents, modèles et de leur accès aux données.

La découverte est fondamentale. L'évaluation ne peut porter sur ce qui n'est pas connu. La surveillance ne peut porter sur ce qui n'est pas visible. La gouvernance ne peut contrôler ce qui n'est pas documenté.

Gestion de la posture de sécurité de l’IA (AI-SPM)

Anthropic appelle à une évaluation continue des configurations, permissions et dépendances des agents. Atlas AI-SPM fait cela à travers les agents, chatbots et modèles — identifiant les vulnérabilités, la mauvaise configuration et l’exposition risquée des données.

La différence réside dans le contexte des données. Savoir qu’un agent peut accéder à SharePoint est une chose. Savoir qu’il peut accéder à des millions de dossiers sensibles en est une autre. Ce contexte transforme la posture en une véritable évaluation des risques.

Appliquer : protection d'exécution IA

La visibilité seule n’est pas une confiance zéro. Atlas applique des garde-fous en temps réel via une passerelle IA dans le chemin des requêtes, inspectant les Prompts, les réponses et les actions des agents avant qu’ils n’atteignent les modèles ou les systèmes en aval. Ces contrôles bloquent les données sensibles exposure et les comportements dangereux — sans nécessiter de modifications des applications sous-jacentes.

Comme Atlas comprend le flux d'exécution et les chaînes d'outils, il va au-delà du filtrage par mots-clés pour empêcher les fuites indirectes et les attaques par enchaînement d'outils, telles que celles décrites dans le cadre conceptuel d'Anthropic.

Gouvernance : conformité en matière d’IA et risques liés aux tiers

Anthropic met l'accent sur la conformité. Atlas la concrétise. Atlas associe les systèmes d'IA à des cadres tels que le règlement européen sur l'IA et le NIST AI RMF, en fournissant des preuves exploitables pour l'audit issues de l'activité en temps réel, des analyses de conformité et des logs.

Le modèle Zero Trust s'étend également au-delà des systèmes internes. Atlas évalue en permanence les fournisseurs tiers d'IA, en combinant des inventaires, des questionnaires et des nomenclatures d'IA afin d'identifier et de gérer les risques externes.

Surveillance : surveillance, détection et réponse aux activités liées à l'IA

Anthropic souligne que l'observabilité est fondamentale. Atlas fournit une visibilité complète sur le comportement de l'IA en production, en capturant les prompts, les réponses, les actions des agents et l'accès aux données.

La solution AI Detection & Response identifie en temps réel les comportements dangereux ou malveillants et prend des mesures telles que l'alerte, le blocage et l'intégration aux workflows SIEM et SOAR afin de permettre une réponse à la vitesse de la machine.

Test : tests d'intrusion IA

Les agents sont dynamiques. Une fois qu'un agent est en circulation, des failles apparaissent, même avec des contrôles bien conçus.

Atlas teste en continu les systèmes d’IA avec des indications adverses et des simulations d’attaques réelles, incluant l’injection de prompts et les jailbreaks. Les résultats alimentent directement la protection et les politiques, fermant la boucle entre les tests et la protection.

Zero Trust pour les agents d'IA nécessite un contexte de données

Il y a un aspect que le cadre d'Anthropic laisse nécessairement à la charge des développeurs : la couche de données. Ce cadre traite du comportement des agents, de leur identité et du contrôle d'accès, mais la sécurité de l'IA sans sécurité des données laisse de côté le principal vecteur de risque.

Un agent peut passer tous les contrôles Zero Trust — authentifiés, autorisés, évalués, surveillés — et accéder discrètement à quatre millions d’enregistrements clients car les données sous-jacentes sont surexposées.

Parce que Atlas est construit sur la plateforme Varonis de sécurité des données, il apporte un contexte de données que les outils de sécurité IA autonomes ne peuvent pas égaler. Évaluation de la posture avec un contexte de données réelles. Garde-fous informés par la classification. Surveillance enrichie par l'identité et la sensibilité. Preuves de conformité qui incluent la lignée des données, pas seulement les métadonnées du système IA.

Le modèle Zero Trust pour les agents d'IA constitue un cadre solide. L'appliquer nécessite de sécuriser à la fois l'IA et les données qui l'alimentent.

Veuillez noter que cet article a été traduit avec l'aide de l'IA et révisé par un traducteur humain.

Que dois-je faire maintenant ?

Vous trouverez ci-dessous trois solutions pour poursuivre vos efforts visant à réduire les risques liés aux données dans votre entreprise:

Planifiez une démonstration avec nous pour voir Varonis en action. Nous personnaliserons la session en fonction des besoins de votre organisation en matière de sécurité des données et répondrons à vos questions.

Consultez un exemple de notre évaluation des risques liés aux données et découvrez les risques qui pourraient subsister dans votre environnement. Cette évaluation est gratuite et vous montre clairement comment procéder à une remédiation automatisée.

Suivez-nous sur LinkedIn, YouTube et X (Twitter) for pour obtenir des informations sur tous les aspects de la sécurité des données, y compris la DSPM, la détection des menaces, la sécurité de l’IA et plus encore.

Nolan Necoechea Nolan Necoechea is a product marketing strategist at Varonis. He has spent more than a decade working with data and AI innovators.