Données d'étiquetage
Une enquête du magazine TIME a révélé que, pour mettre en place un système de protection contre les contenus toxiques (abus sexuels, violence, racisme, sexisme, etc.), OpenAI a eu recours à des travailleurs kényans sous-traitants payés moins de 2 dollars de l'heure pour étiqueter ces contenus. Ces étiquettes ont ensuite servi à entraîner un modèle capable de détecter de tels contenus. Exposés à des contenus si toxiques et dangereux, ces travailleurs ont qualifié leur expérience de « torture ». Le partenaire d'OpenAI pour la sous-traitance était Sama, une société de données d'entraînement basée à San Francisco, en Californie.
Évasion
ChatGPT tente de rejeter les requêtes susceptibles d'enfreindre sa politique de contenu. Cependant, certains utilisateurs sont parvenus à contourner ces restrictions début décembre 2022 en utilisant diverses techniques de manipulation des requêtes. Ils ont ainsi réussi à amener ChatGPT à fournir des instructions pour fabriquer un cocktail Molotov ou une bombe nucléaire, ou encore à générer des arguments dans le style néonazi. Un journaliste du Toronto Star a obtenu des résultats mitigés en parvenant à faire tenir des propos incendiaires à ChatGPT peu après son lancement : ChatGPT a été amené à approuver l'invasion russe de l'Ukraine en 2022, mais même lorsqu'on lui a demandé de jouer le jeu d'un scénario fictif, ChatGPT a refusé de fournir des arguments expliquant pourquoi le Premier ministre canadien Justin Trudeau était coupable de trahison. (wiki)
Date de publication : 18 février 2023