Bonnes pratiques pour l'enrichissement des données

Construire une approche responsable de la collecte de données avec un partenariat sur l’intelligence artificielle

Chez DeepMind, notre objectif est de nous assurer que tout ce que nous faisons respecte les normes de sécurité et d’éthique les plus élevées, conformément à nos principes de fonctionnement. L’un des endroits les plus importants où cela commence est la façon dont nous recueillons nos données. Au cours des 12 derniers mois, nous avons collaboré avec le Partenariat sur l’intelligence artificielle (PAI) pour examiner attentivement ces défis, et nous avons également développé des pratiques exemplaires et des processus normalisés pour une collecte responsable de données humaines.

Collecte de données humaines

Il y a plus de trois ans, nous avons créé le Comité d’éthique de la recherche sur le comportement humain (HuBREC), un groupe de gouvernance calqué sur les comités d’examen institutionnels universitaires (IRB), comme ceux que l’on trouve dans les hôpitaux et les universités, dans le but de protéger la dignité, les droits et bien-être des sujets humains impliqués dans nos études. Ce comité supervise la recherche comportementale qui comprend des expériences avec des humains comme sujet d’étude, comme l’étude de la façon dont les humains interagissent avec les systèmes d’intelligence artificielle (IA) dans le processus de prise de décision.

Outre les projets impliquant la recherche comportementale, la communauté de l’IA est de plus en plus impliquée dans des efforts impliquant «l’enrichissement des données» – des tâches que les humains effectuent pour former et valider des modèles d’apprentissage automatique, tels que la classification des données et l’évaluation des modèles. Alors que la recherche comportementale repose souvent sur des participants volontaires à l’étude, l’enrichissement des données implique de payer des personnes pour accomplir des tâches qui améliorent les modèles d’IA.

Ces types de tâches sont généralement effectuées sur des plateformes de crowdsourcing et soulèvent souvent des considérations éthiques concernant la rémunération, le bien-être et l’équité des travailleurs qui peuvent manquer des conseils ou des systèmes de gouvernance nécessaires pour garantir le respect des normes adéquates. Alors que les laboratoires de recherche accélèrent le développement de modèles de plus en plus complexes, le recours aux pratiques d’enrichissement des données est susceptible de croître et, parallèlement, des directives plus strictes sont nécessaires.

Dans le cadre de nos principes de fonctionnement, nous nous engageons à soutenir et à contribuer aux meilleures pratiques dans les domaines de la sécurité et de l’éthique de l’IA, y compris l’équité et la confidentialité, afin d’éviter les conséquences imprévues qui créent des risques de préjudice.

les meilleures pratiques

Suite au récent livre blanc de PAI sur l’approvisionnement responsable des services d’enrichissement de données, nous avons collaboré pour développer nos pratiques et processus d’enrichissement de données. Cela comprenait la création de cinq étapes que les praticiens de l’IA peuvent suivre pour améliorer les conditions de travail des personnes impliquées dans des tâches d’enrichissement de données (pour plus de détails, veuillez consulter les directives sur les ressources d’enrichissement de données de PAI) :

Définir un modèle de paiement approprié et veiller à ce que tous les travailleurs soient payés au-dessus du salaire vital local.
Conception et essai préalable au lancement du projet d’enrichissement des données.
Déterminer les travailleurs appropriés pour la tâche requise.
Fournir des instructions vérifiées et/ou du matériel de formation que les travailleurs doivent suivre.
Établir des mécanismes de communication clairs et réguliers avec les travailleurs.

Ensemble, nous avons créé les politiques et les ressources nécessaires, en recueillant plusieurs séries de commentaires de nos équipes internes de recherche juridique, de données, de sécurité, d’éthique et de processus, avant de les piloter sur un petit nombre de projets de collecte de données et de les diffuser ensuite à l’ensemble de l’organisation. .

Ces documents fournissent plus de clarté sur la meilleure façon de configurer les tâches d’enrichissement des données dans DeepMind, améliorant ainsi la confiance de nos chercheurs dans la conception et la mise en œuvre des études. Non seulement cela a augmenté l’efficacité de nos processus d’approbation et de lancement, mais, plus important encore, cela a amélioré l’expérience des personnes participant aux tâches d’enrichissement des données.

Pour plus d’informations sur les pratiques responsables d’enrichissement des données et sur la manière dont nous les avons intégrées à nos opérations actuelles, consultez l’étude de cas récente de PAI, Mise en œuvre de pratiques responsables d’enrichissement des données chez un développeur d’IA : Exemple DeepMind. PAI fournit également des ressources utiles et du matériel de soutien aux praticiens de l’IA et aux organisations qui cherchent à développer des processus similaires.

avoir hâte de

Bien que ces meilleures pratiques sous-tendent notre travail, nous ne devons pas compter uniquement sur elles pour garantir que nos projets répondent aux normes les plus élevées de bien-être et de sécurité des participants à la recherche ou des travailleurs. Chaque projet chez DeepMind est différent, c’est pourquoi nous avons un processus dédié d’examen des données humaines qui nous permet de nous engager en permanence avec des équipes de recherche pour identifier et atténuer les risques au cas par cas.

Ce travail est destiné à servir de ressource pour d’autres organisations intéressées à améliorer leurs pratiques d’approvisionnement en enrichissement de données, et nous espérons que cela mènera à des conversations intersectorielles qui pourront développer davantage ces directives et ressources pour les équipes et les partenaires. Grâce à cette collaboration, nous espérons également susciter une discussion plus large sur la manière dont la communauté de l’IA peut continuer à faire progresser les normes de collecte de données responsable et à élaborer collectivement de meilleures normes de l’industrie.

‍

En savoir plus sur nos principes de fonctionnement.

Bonnes pratiques pour l'enrichissement des données

Construire une approche responsable de la collecte de données avec un partenariat sur l’intelligence artificielle

Collecte de données humaines

les meilleures pratiques

avoir hâte de

Enregistrer un commentaire

نموذج الاتصال