Une étude révèle un biais des modèles d'IA envers les dialectes - ForkLog : cryptomonnaies, IA, singularité, avenir

2025-12-29 13:49:11

# Une étude révèle la préjugé des modèles d’IA envers les dialectes

Les grands modèles linguistiques ont tendance à avoir des préjugés envers les locuteurs de dialectes, leur attribuant des stéréotypes négatifs. Telle est la conclusion d’une étude menée par des chercheurs d’Allemagne et des États-Unis, rapporte DW

« Je pense que nous voyons vraiment des épithètes choquantes attribuées aux locuteurs de dialectes », — a déclaré l’un des principaux auteurs de l’étude, Minh Duc Bui, dans un commentaire à la publication

L’analyse de l’Université Johannes Gutenberg a montré que dix modèles testés, y compris ChatGPT-5 mini et Llama 3.1, décrivaient les locuteurs de dialectes allemands (bavarois, cologne) comme « non instruits », « travaillant dans des fermes » et « enclins à la colère ».

Les préjugés s’accentuaient lorsque l’IA indiquait explicitement le dialecte.

Autres cas

Des problèmes similaires ont été constatés à l’échelle mondiale. Dans une étude de l’Université de Californie à Berkeley en 2024, les réponses de ChatGPT à différents dialectes anglais (indien, irlandais, nigérian) ont été comparées.

Il s’est avéré que le chatbot répondait avec des stéréotypes plus marqués, un contenu dégradant et un ton condescendant par rapport à une communication en anglais américain ou britannique standard.

Emma Harvey, doctorante en informatique à l’Université Cornell aux États-Unis, a qualifié la préjugé envers les dialectes de « significative et préoccupante ».

À l’été 2025, elle et ses collègues ont également découvert que l’assistant d’achat Amazon Rufus donnait des réponses vagues ou même incorrectes aux personnes écrivant en dialecte afro-américain de l’anglais. Si des erreurs étaient présentes dans la requête, le modèle répondait de manière rude.

Un autre exemple évident de préjugés des réseaux neuronaux concerne un candidat indien qui a utilisé ChatGPT pour vérifier un CV en anglais. Finalement, le chatbot a modifié son nom de famille pour celui associé à une caste plus élevée.

« La mise en œuvre massive des modèles linguistiques menace non seulement de perpétuer des préjugés enracinés, mais aussi de les amplifier à grande échelle. Au lieu d’atténuer le mal, ces technologies risquent de lui donner une dimension systémique », — a déclaré Harvey.

Cependant, la crise ne se limite pas aux préjugés — certains modèles ne reconnaissent tout simplement pas les dialectes. Par exemple, en juillet, l’assistant IA du conseil municipal de Derby (Angleterre) n’a pas pu reconnaître le dialecte de la présentatrice radio lorsqu’elle utilisait en direct des mots comme mardy (« niais ») et duck (« cher »).

Que faire ?

Le problème ne réside pas tant dans les modèles d’IA eux-mêmes, mais plutôt dans leur processus d’apprentissage. Les chatbots lisent d’énormes volumes de textes issus d’Internet, à partir desquels ils produisent ensuite des réponses.

« La question principale est — qui écrit ce texte. S’il contient des préjugés contre les locuteurs de dialectes, l’IA les copiera », — a expliqué Caroline Holtermann de l’Université de Hambourg.

Elle a également souligné que la technologie présente un avantage :

« Contrairement aux humains, il est possible de détecter et de « désactiver » la préjugé dans un système d’IA. Nous pouvons lutter activement contre ces manifestations ».

Certains chercheurs proposent comme avantage de créer des modèles personnalisés pour des dialectes spécifiques. En août 2024, la société Acree AI a déjà présenté le modèle Arcee-Meraj, qui fonctionne avec plusieurs dialectes arabes.

Selon Holtermann, l’émergence de nouveaux LLM plus adaptés permet de considérer l’IA « non pas comme un ennemi des dialectes, mais comme un outil imparfait qui peut s’améliorer ».

Rappelons que les journalistes du Economist ont averti des risques des jouets IA pour la santé mentale des enfants.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.