Aujourd’hui, les entreprises intègrent l’intelligence artificielle dans tous les aspects de leur activité. Cette tendance devrait se poursuivre jusqu’à ce que les modèles d’apprentissage automatique soient intégrés dans la plupart des produits et services avec lesquels nous interagissons quotidiennement.
À mesure que ces modèles prennent une place de plus en plus importante dans nos vies, assurer leur sécurité devient encore plus important. C’est la mission de Verta, une startup issue du laboratoire d’informatique et d’intelligence artificielle du MIT (CSAIL).
La plate-forme Verta aide les entreprises à déployer, surveiller et gérer des modèles d’apprentissage automatique en toute sécurité et à grande échelle. Les scientifiques et les ingénieurs des données peuvent utiliser les outils Verta pour suivre et examiner différentes versions de modèles pour les biais, les tester avant le déploiement et surveiller leurs performances dans le monde réel.
“Tout ce que nous faisons, c’est permettre à davantage de produits d’être construits avec l’IA, et le faire en toute sécurité”, déclare le fondateur et PDG de Verta, Manasi Vartak SM ’14, PhD ’18. “Nous voyons déjà avec ChatGPT comment l’IA peut être utilisée pour créer des données et des artefacts – vous l’appelez – qui semblent corrects mais qui ne le sont pas. Il doit y avoir plus de gouvernance et de contrôle sur la façon dont l’IA est utilisée.Et Surtout pour les organisations qui fournissent des solutions d’IA. “
Verta travaille actuellement avec de grandes sociétés de soins de santé, de finance et d’assurance pour les aider à comprendre et à revoir les recommandations et les projections de leurs modèles. Il travaille également avec un certain nombre d’entreprises technologiques à forte croissance qui cherchent à accélérer le déploiement de nouvelles solutions basées sur l’IA tout en s’assurant que ces solutions sont utilisées de manière appropriée.
Vartak affirme que la société a été en mesure de réduire le temps nécessaire aux clients pour déployer des modèles d’IA par ordre de grandeur tout en s’assurant que ces modèles sont interprétables et équitables – un facteur particulièrement important pour les entreprises des secteurs hautement réglementés.
Les entreprises de soins de santé, par exemple, pourraient utiliser Verta pour améliorer les recommandations de traitement et la surveillance des patients basée sur l’IA. Ces systèmes doivent être soigneusement vérifiés pour détecter les erreurs et les biais avant d’être utilisés chez les patients.
“Qu’il s’agisse de partialité, d’équité ou d’interprétabilité, cela revient à notre philosophie autour du modèle de gouvernance et de gestion”, déclare Vartak. “Nous considérons cela comme une liste de contrôle initiale : avant que l’avion ne décolle, il y a un tas de vérifications que vous devez effectuer avant que votre avion ne décolle du sol. C’est similaire aux modèles d’IA. Vous devez vous assurer de faire le contrôles de biais, vous devez vous assurer qu’il y a un certain niveau d’explicabilité, et vous devez vous assurer que votre modèle est reproductible. Nous aidons avec tout cela.
Du projet au produit
Avant de rejoindre le MIT, Vartak a travaillé comme data scientist pour une entreprise de médias sociaux. Dans un projet, après avoir passé des semaines à affiner les modèles d’apprentissage automatique qui organisaient le contenu à afficher dans les flux des utilisateurs, elle a appris qu’un ancien employé avait déjà fait la même chose. Malheureusement, il n’y avait aucune trace de ce qu’ils ont fait ou comment cela a affecté les modèles.
Pour son doctorat au MIT, Vartak a décidé de créer des outils pour aider les data scientists à développer, tester et itérer des modèles d’apprentissage automatique. Travaillant sur le cluster de bases de données CSAIL, Vartak a recruté une équipe d’étudiants diplômés et de participants au programme d’opportunités de recherche de premier cycle (UROP) du MIT.
“Virta n’existerait pas sans mon travail dans l’écosystème MIT-MIT”, déclare Vartak. “Le MIT rassemble des personnes à la pointe de la technologie et nous aide à créer la prochaine génération d’outils.”
L’équipe a travaillé avec des scientifiques des données du programme CSAIL Alliance pour décider quelles fonctionnalités créer et itérer en fonction des commentaires de ces premiers utilisateurs. Le projet qui en a résulté, appelé ModelDB, a été le premier système de gestion de modèles open source, explique Vartak.
Vartak a également suivi plusieurs cours de commerce à la MIT Sloan School of Management tout en obtenant son doctorat, a travaillé avec des camarades de classe sur des startups qui recommandaient des vêtements et un suivi de la santé, et a passé d’innombrables heures au Martin Trust Entrepreneurship Center du MIT et a participé au Delta V du Centre. Accélérateur d’été.
“Ce que le MIT vous permet de faire, c’est de prendre des risques et d’échouer dans un environnement sûr”, déclare Vartak. “Le MIT m’a permis ces incursions dans l’entrepreneuriat et m’a montré comment commencer à créer des produits et à trouver les premiers clients, donc au moment où la Verta est arrivée, je l’avais fait à plus petite échelle.”
ModelDB a aidé les scientifiques des données à former et à suivre les modèles, mais Vartak a rapidement compris que les enjeux étaient plus importants une fois les modèles déployés à grande échelle. À ce stade, essayer d’améliorer les modèles (ou les casser accidentellement) peut avoir des implications majeures pour les entreprises et la société. Cette idée a conduit Vartak à commencer à construire Virta.
“Chez Verta, nous aidons à gérer les modèles, nous aidons à exécuter les modèles, nous nous assurons qu’ils fonctionnent comme prévu, c’est ce que nous appelons la surveillance des modèles”, explique Vartak. Toutes ces pièces ont leurs racines dans le MIT et mon travail de thèse. Verta a vraiment évolué depuis mon projet de doctorat au MIT.”
La plateforme Verta aide les entreprises à déployer des modèles plus rapidement, à s’assurer qu’ils continuent de fonctionner comme prévu au fil du temps et à gérer les modèles de conformité et de gouvernance. Les scientifiques des données peuvent utiliser Verta pour suivre différentes versions de modèles et comprendre comment ils ont été construits, en répondant à des questions telles que la manière dont les données ont été utilisées et les vérifications d’interprétabilité ou de biais effectuées. Ils peuvent également le vérifier en l’exécutant en publiant des listes de contrôle et des contrôles de sécurité.
“La plate-forme Verta prend un modèle de science des données et y ajoute une demi-douzaine de couches pour en faire quelque chose que vous pouvez utiliser pour exécuter, par exemple, un système de recommandation complet sur votre site Web”, explique Vartak. “Cela inclut les améliorations de performances, la mise à l’échelle, le temps de cycle, c’est-à-dire la rapidité avec laquelle vous pouvez prendre un modèle et le transformer en un produit précieux, ainsi que la gouvernance.”
Soutenir l’intelligence artificielle des vagues
Vartak dit que les grandes entreprises utilisent souvent des milliers de modèles différents qui affectent presque toutes les parties de leurs opérations.
“Une compagnie d’assurance, par exemple, utilisera des modèles pour tout, de la souscription aux réclamations, en passant par le traitement du back-office, le marketing et les ventes”, explique Vartak. “Donc, la variété de modèles est vraiment élevée, il y en a un grand nombre, et le niveau de contrôle et de conformité dont les entreprises ont besoin autour de ces modèles est très élevé. Ils ont besoin de savoir des choses comme : avez-vous utilisé les données que vous étiez censé le faire ? Qui sont les personnes qui l’ont vérifié ? Avez-vous effectué des vérifications d’interprétation ? Avez-vous effectué des vérifications de préjugés ? »
Vartak affirme que les entreprises qui n’adoptent pas l’IA seront laissées pour compte. Entre-temps, les entreprises qui font prospérer l’IA auront besoin de processus bien définis pour gérer leur liste sans cesse croissante de modèles.
“Au cours des 10 prochaines années, chaque appareil avec lequel nous interagissons aura une intelligence intégrée, qu’il s’agisse d’un grille-pain ou d’un logiciel de messagerie, et cela vous facilitera grandement la vie”, déclare Vartak. “Ce qui permettra cette intelligence, ce sont de meilleurs modèles et logiciels, comme Verta, qui vous aideront à intégrer très rapidement l’IA dans toutes ces applications.”
(Tags à traduire) Verta