Exploiter l'équité d'un modèle d'apprentissage pour reconstruire les attributs sensibles de son ensemble d'entraînement - Équipe Recherche Opérationnelle, Optimisation Combinatoire et Contraintes Accéder directement au contenu
Communication Dans Un Congrès Année : 2023

Exploiter l'équité d'un modèle d'apprentissage pour reconstruire les attributs sensibles de son ensemble d'entraînement

Résumé

Pour palier les biais non désirés en apprentissage supervisé, de nombreux travaux utilisent des métriques d'équité statistique, définies vis-à-vis de certains attributs sensibles. Bien que ceux-ci ne soient généralement pas utilisés par le modèle appris au moment de l'inférence, ils le sont souvent pendant son entraînement pour contrôler l'équité. Nous montrons ainsi qu'un attaquant disposant d'un accès en boîte noire à un tel modèle peut utiliser le fait qu'il soit équitable pour reconstruire les attributs sensibles de son ensemble d'entraînement. L'approche proposée consiste à corriger une première reconstruction effectuée par un attaquant de la littérature, pour se conformer avec l'information de l'équité. Notre large évaluation expérimentale confirme que ce processus de correction permet d'améliorer les performances de l'attaque de manière significative.
Fichier principal
Vignette du fichier
RJCIA2023_paper_3.pdf (505.95 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04190265 , version 1 (29-08-2023)

Identifiants

  • HAL Id : hal-04190265 , version 1

Citer

Julien Ferry, Ulrich Aïvodji, Sébastien Gambs, Marie-José Huguet, Mohamed Siala. Exploiter l'équité d'un modèle d'apprentissage pour reconstruire les attributs sensibles de son ensemble d'entraînement. Rencontres des Jeunes Chercheurs en Intelligence Artificielle (RJCIA/PFIA 2023), Jul 2023, Strasbourg, France. ⟨hal-04190265⟩
77 Consultations
23 Téléchargements

Partager

Gmail Facebook X LinkedIn More