Algorithmes : Entre fantasmes et réalité (3/3)

Entraîner son algorithme

Après avoir étudié les biais explicites, voyons la deuxième catégorie : les biais implicites.

Contrairement aux premiers, ce type de biais n’est pas dû à l’humain mais à la machine. Lorsque l’on recherche une photo de chien sur Google, comment l’algorithme de recherche arrive-t-il à discerner un chien d’un chat ? Deux réponses à cette question sont possibles.

Tel un enfant à qui il faut tout apprendre, la première technique consiste à définir manuellement tous les paramètres. Tous ces critères résultants de choix sont explicites. Par exemple : un chien marche à quatre pattes. Toutes les images possédant un animal marchant à quatre pattes seront donc validées. Mais bien évidement ce critère seul est beaucoup trop large.

De plus, il ne faut pas définir les paramètres pour identifier un chien mais toutes les races de chien ! Le travail est immense et extrêmement chronophage. Mais heureusement il existe une alternative : l’apprentissage automatique.

Le Machine Learning

Cette technique, aussi appelée Machine learning, est divisée en deux catégories : l’apprentissage supervisé et l’apprentissage non supervisé. La différence entre ces deux types d’apprentissages dépend de l’aide apportée ou non au système développé.

Dans le premier cas de l’apprentissage supervisé on fournit à l’algorithme des exemples de résultats souhaités (des photos de chien pour reprendre notre premier exemple) et non souhaités afin de lui permettre d’apprendre. En cas d’erreur de sa part il suffit simplement de le corriger. Petit à petit ses critères se précisent. Plus la base de données est importante, plus l’algorithme sera précis. Mais ce type d’apprentissage possède un inconvénient que nous avons déjà évoqué : les biais algorithmiques explicites. Si les responsables de cet algorithme ne pensent pas à toutes les races de chien, le système peut se tromper.

Afin de pallier au travail répétitif de correction, certaines grandes entreprises engagent des micro-travailleurs. Cette nouvelle catégorie de travailleurs concentre à elle seule un peu plus de 333 000 personnes en France (en cumulant les travailleurs « très actifs », « réguliers », et « occasionnels »). Extrêmement précaires, ils sont concurrencés par un autre type d’usagers : nous. Si certains sites nous demandent en tant qu’internautes de cliquer sur telle image de feu rouge, sur celles où apparaissent un camion, c’est tout simplement pour améliorer leurs algorithmes. Ce travail dissimulé rejoint une tendance beaucoup plus grande : celle du consom-acteurs. Tels que les caisses automatiques dans les grandes surfaces, le consommateur est invité à exercer lui-même une partie du travail.

La deuxième catégorie d’apprentissage, la non supervisée, soulève également de nombreux fantasmes. En effet dans ce modèle c’est l’algorithme lui-même qui repère les points communs entre les différentes données qui lui sont soumises. Comme le dit elle-même Aurélie Jean : « Ce sont des critères inférés de l’expérience et développés par l’algorithme lui-même, et non par ses concepteurs. Voilà pourquoi j’aime parler de critères implicites »[1]. Par un apprentissage mécanique, froid et sans réflexion profonde, l’algorithme va développer ses propres critères de sélection, ses propres biais. Comme pour notre première technique, la quantité de données est un critère essentiel. Et tout comme dans l’apprentissage supervisé, l’algorithme ne saura réellement pas ce qu’est un chien, mais pourra remplir la mission qui lui a été assignée : reconnaître un chien d’un chat.

C’est là que se trouve une différence fondamentale entre l’intelligence artificielle et l ‘intelligence humaine : les machines appliquent, nous comprenons. La puissance face à la réflexion. Même à l’ère prochaine des ordinateurs quantiques, capables de procéder à des calculs seulement imaginables jusqu’à aujourd’hui, la réflexion humaine restera inimitable.

[1] Aurélie Jean, De l’autre côté de la Machine, Voyage d’une scientifique au pays des algorithmes, Édition de l’Observatoire, 2019

Sources :

https://www.supinfo.com/articles/single/6041-machine-learning-introduction

https://www.futura-sciences.com/tech/definitions/intelligence-artificielle-deep-learning-17262/

https://www.silicon.fr/micro-travail-4-choses-a-savoir-sur-leconomie-du-clic-en-france-232891.html

https://www.lemonde-apres.com/fr/blog/les-micro-travailleurs-les-nouveaux-freelances-du-tiers-monde
Aurélie Jean, De l’autre côté de la Machine, Voyage d’une scientifique au pays des algorithmes, Édition de l’Observatoire, 2019

HistoireH. Le Bras23 mars 2020algorithme, informatique, algèbre, mathematique, deep learning, formule, executable, implementation, valeurs, machine learning