Photo credits: Getty images

Dans une enquête pour The Conversation, Clément Le Ludec et Maxime Cornet se penchent sur les conditions de travail des travailleurs de la donnée et proposent des pistes pour enrichir les discussions autour de la régulation des systèmes d’Intelligence Artificielle (IA). 

Avec l’hypermédiatisation de ChatGPT, le grand public a pris conscience des progrès réalisés en matière d’IA. Nombreux sont les articles qui ont mis en avant les capacités impressionnantes de ChatGPT à comprendre et à générer du langage naturel. Mais ces modèles cachent des travailleurs précaires, souvent issus des pays du sud.  

Les modèles d’IA ont en effet besoin d’être entraînés, d’être alimentés d’une masse de données extrêmement importante qui forgera leur fonctionnement. Par exemple, un algorithme d’IA dont la tâche est de reconnaitre des chats dans des photographies devra, lors de la phase d’entrainement, être alimenté de photos dont on sait qu’elles représentent des chats et de photos dont on sait qu’elles ne représentent pas des chats. Ainsi, le modèle sera non seulement à même de s’entrainer mais également d’autoévaluer sa performance, et donc d’optimiser le processus de détection. Ces données d’entrainement doivent être collectées, triées, vérifiées et traduites en une forme assimilable par l’IA. Des tâches chronophages et peu valorisées qui sont généralement externalisées via l’économie de plateforme, et notamment via le géant du travail de foule Amazon Mechanical Turk. Récemment, une enquête de Time révélait que les travailleurs chargés de s’assurer que les données d’entrainement de ChatGPT ne comportaient pas de contenu à caractère discriminatoire étaient kényans et payés moins de trois euros de l’heure.  

Intégrés au sein du groupe de recherche Digital Platform Labor, l’étude de Clément Le Ludec et Maxime Cornet de l’Institut Mines-Télécom (IMT) vise à dévoiler les conditions de travail des travailleurs de la donnée auxquels font appels les entreprises françaises de l’IA. L’enquête se base sur des entretiens menés avec 147 travailleurs, managers, et dirigeants de 10 entreprises malgaches, ainsi qu’un questionnaire administré auprès de 296 travailleurs de la donnée situés à Madagascar. En France, le travail des données est dans sa majorité externalisé auprès de prestataires situés à Madagascar, notamment en raison du faible coût du travail qualifié et du nombre élevé d’organisations proposant ces services. Ces travailleurs sont intégrés à un secteur plus large de production de service aux entreprises, allant des centres d’appels à la modération de contenu web en passant par les services de rédaction pour l’optimisation de la visibilité des sites sur les moteurs de recherche.  

Ce sont majoritairement des hommes (68 %), de moins de 34 ans (87 %) ayant effectué un passage dans l’enseignement supérieur (75%). Ils gagnent en majorité entre 96 et 126 euros par mois, avec des écarts de salaires significatifs, jusqu’à 8 à 10 fois plus élevés pour les postes de supervision d’équipe, également occupés par des travailleurs malgaches. Ces travailleurs se situent à l’extrémité d’une longue chaîne d’externalisation, ce qui explique en partie la faiblesse des salaires de ces travailleurs qualifiés, même au regard du contexte malgache. En effet, le business de l’IA implique de nombreux acteurs : les GAFAM qui proposent les services d’hébergement de données et de puissance de calcul, les entreprises françaises qui vendent des modèles d’IA et les entreprises malgaches qui proposent des services d’annotations de données – chaque intermédiaire captant une partie de la valeur produite. En plus du coût du travail, l’industrie de l’externalisation profite de travailleurs bien formés : la plupart sont allés à l’université et parlent couramment le français, appris à l’école, par Internet et à travers le réseau des Alliances françaises.  

Les entreprises de notation malgaches sont très dépendantes de leurs clients français – qui gèrent cette force de travail externalisée de manière quasi directe, avec des postes de management intermédiaire dédiés au sein des start-up parisiennes. L’occupation de ces postes par des étrangers, soit employés par les entreprises clientes en France, soit par des expatriés sur place, représente un frein important aux possibilités d’évolution de carrière offertes aux travailleurs de la donnée, qui restent bloqués dans les échelons inférieurs de la chaîne de valeur. Par ailleurs, la majorité des entreprises malgaches proposant des services numériques est tenue par des Français. En plus de ces entreprises formelles, le secteur s’est développé autour d’un mécanisme de « sous-traitance en cascade », avec, à la fin de la chaîne des entreprises et entrepreneurs individuels informels, moins bien traités que dans les entreprises formelles, et mobilisés en cas de manque de main-d’œuvre par les entreprises du secteur. 

Ainsi, le développement de l’IA ne signifie pas la fin du travail due à l’automation mais plutôt son déplacement dans les pays en voie de développement. « Il nous semble nécessaire de mieux prendre en compte le travail humain indispensable à l’entraînement des modèles », concluent les deux chercheurs. « Rendre visible l’implication de ces travailleurs c’est questionner des chaînes de production mondialisées, bien connues dans l’industrie manufacturière, mais qui existent aussi dans le secteur du numérique. […] C’est aussi rendre visible les conséquences de leur travail sur les modèles. Une partie des biais algorithmiques résident en effet dans le travail des données, pourtant encore largement invisibilisé par les entreprises. Une IA réellement éthique doit donc passer par une éthique du travail de l’IA ».