The Babbel Blog

All posts by Joshua Stephens

Biais Automatique : Quand les machines découvrent les genres

Posted on octobre 16, 2018 by

D’importantes innovations dans l’apprentissage automatique ont fait les gros titres des journaux l’an dernier et nous renvoient l’image des préjugés constants qui nourrissent notre société. En terme de stéréotypes de genre, le risque est réel quand les machines apprennent des langues. Kate McCurdy, linguiste informaticienne chez Babbel, a étudié comment les algorithmes confondent le genre sémantique avec le genre grammatical, les conséquences que cela pourrait avoir pour des applications de ce qu’on appelle l’intelligence artificielle et comment nous pouvons en corriger l’évolution.

 

Et si vous commenciez par nous expliquer votre projet ?

 

Bien sûr. J’analyse le genre grammatical dans les word embeddings. Le word embedding (ou plongement lexical) est une sorte de technologie de traitement naturel des langues, utilisée dans de nombreux contextes. Le principe est que l’algorithme apprend le sens d’un mot en fonction des mots qui l’entourent. D’énormes progrès ont été faits dans ce domaine au cours des dernières années. De nombreuses études sont actuellement menées sur ce sujet et de grandes entreprises comme Google ou Facebook les utilisent déjà. Il y a environ deux ans, un nouvel algorithme pouvait entraîner rapidement un programme à déduire le sens de certains mots, ce qui était plutôt incroyable à l’époque. Vous pouviez le laisser agir librement avec un corpus de mots et il apprenait par exemple que « chien », « chat » et « animaux » sont apparentés, ou que « pomme » et « banane » sont liés, sans que personne ne le lui dise explicitement. C’est vraiment impressionnant et cela a été utilisé depuis dans de nombreuses applications technologiques. Mais nous avons remarqué qu’il y avait aussi des problèmes liés à cet algorithme.

(suite…)