Exploiter l'équité d'un modèle d'apprentissage pour reconstruire les attributs sensibles de son ensemble d'entraînement

Pour palier les biais non désirés en apprentissage supervisé, de nombreux travaux utilisent des métriques d'équité statistique, définies vis-à-vis de certains attributs sensibles. Bien que ceux-ci ne soient généralement pas utilisés par le modèle appris au moment de l'inférence, ils le sont souvent pendant son entraînement pour contrôler l'équité. Nous montrons ainsi qu'un attaquant disposant d'un accès en boîte noire à un tel modèle peut utiliser le fait qu'il soit équitable pour reconstruire les attributs sensibles de son ensemble d'entraînement. L'approche proposée consiste à corriger une première reconstruction effectuée par un attaquant de la littérature, pour se conformer avec l'information de l'équité. Notre large évaluation expérimentale confirme que ce processus de correction permet d'améliorer les performances de l'attaque de manière significative.

Mots clés

attaque de reconstruction vie privée équité apprentissage programmation linéaire en nombres entiers programmation par contraintes

Domaines

Intelligence artificielle [cs.AI] Apprentissage [cs.LG]

Fichier principal

RJCIA2023_paper_3.pdf (505.95 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Julien Ferry : Connectez-vous pour contacter le contributeur

https://hal.science/hal-04190265

Soumis le : mardi 29 août 2023-14:13:35

Dernière modification le : lundi 20 novembre 2023-11:44:22

Archivage à long terme le : jeudi 30 novembre 2023-19:08:21

Dates et versions

hal-04190265 , version 1 (29-08-2023)

Identifiants

HAL Id : hal-04190265 , version 1

Citer

Julien Ferry, Ulrich Aïvodji, Sébastien Gambs, Marie-José Huguet, Mohamed Siala. Exploiter l'équité d'un modèle d'apprentissage pour reconstruire les attributs sensibles de son ensemble d'entraînement. Rencontres des Jeunes Chercheurs en Intelligence Artificielle (RJCIA/PFIA 2023), Jul 2023, Strasbourg, France. ⟨hal-04190265⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-TLSE2 CNRS INSA-TOULOUSE LAAS LAAS-ROC UT1-CAPITOLE LAAS-DECISION-ET-OPTIMISATION INSA-GROUPE INSA-TOULOUSE-GEI ANR ANITI CIMI-TOULOUSE TOULOUSE-INP UNIV-UT3 UT3-TOULOUSEINP

77 Consultations

23 Téléchargements