Le scandale Cambridge Analytica ou encore plus récemment la polémique autour du 10 years challenge nous ont rendu assez méfiants quand il s’agit de confidentialité et de protection des données.   Ce n’est pourtant pas la première fois que les internautes sont mis à profit pour mener des projets bien plus larges. Ainsi, les fameux CAPTCHA, ces petits tests d’identification prouvant qu’un internaute est bien humain et non un robot, sont utilisés depuis des années pour tirer profit de la main d’oeuvre gratuite que représentent les internautes.   Le test reCAPTCHA contribuait par exemple à numériser des livres pour l’immense bibliothèque numérique de Google.  
  Dans ce test, seul le premier mot sert en réalité à identifier l’humain de la machine. Le deuxième est en fait issu d’un des millions de livres ou journaux numérisés par Google. Les logiciels de reconnaissance de caractères ayant leurs limites, certains termes n’ont pas pu être déchiffrés automatiquement. Google se sert donc des internautes pour le faire « à la main » ;   Ce n’est pas fini, en 2012 le principe sera adapté à Google Street View: l’internaute se voit proposer de déchiffrer les textes photographiés dans la rue, comme les panneaux routiers ou les numéros de maison. Une tâche là aussi complexe pour une machine, mais facile pour un humain. Objectif, là encore, profiter de la masse des internautes et de leur temps pour enrichir l’outil de Google. En labellisant sans s’en rendre compte des millions d’images, les internautes contribuent à une gigantesque base de données qui « nourrit » des programmes, afin qu’ils apprennent, par eux-mêmes, à identifier le contenu des photos.

Il apparait donc clairement qu’au delà de l’ingéniosité des test CAPTCHA, notre contribution rend de plus en plus difficile de dissocier un humain d’une machine.

Est-ce une bonne chose pour l’avenir de l’humanité? Ca, c’est un autre débat…

Boundless.

En savoir plus…