Cet article est publié à l’origine par Ijsberg Magazine, un nouveau média d’actualité internationale que je vous recommande chaudement pour sa pratique du long-format et sa vision innovante du journalisme. Et ça, même Google le dit

Google veut en finir avec le reCaptcha, ces suites de lettres et de chiffres qu’il fallait recopier pour prouver que nous n’étions pas un logiciel spammeur.

Selon le géant américain, cette pratique est dépassée et se faisait au détriment de l’ergonomie et de la navigation des utilisateurs. Dorénavant, il suffira de cocher une case indiquant « je ne suis pas un robot ». Afin de vérifier que cette information est exacte, Google utilisera des éléments comme vos cookies de navigation, le mouvement de votre souris pour cocher cette case ou vous demandera de sélectionner une image, comme dans l’exemple ci-dessous.

cat_captcha_google
Les chats, alliés de Google pour le contrôle d’Internet

Mais derrière ce que dit Google se cache une nouvelle façon de vous exploiter. Le « Captcha » a été inventé en 1997 comme un système anti-spam. Son nom vient de l’acronyme « completely automated public Turing test to tell computers and humans apart », basé sur les fameux tests de Turing qui permettent de distinguer un humain d’un ordinateur.

Un moyen d’améliorer les logiciels de reconnaissance de texte

Depuis, les inventeurs du concept ont développé le « reCaptcha » et ont vendu le tout à Google en 2009. Le reCaptcha permet d’analyser votre réponse et d’alimenter les capacités de reconnaissance de texte des ordinateurs. C’est un peu paradoxal, mais assez pratique pour une entreprise comme Google, qui cherche à numériser toute sorte de livre pour sa bibliothèque en ligne Google Books. Or, toutes les petites phrases utilisées dans les reCaptcha ressemblent à celles imprimées dans un livre, avec ses erreurs d’impressions et ses déformations liées au passage du temps.

Imaginez des millions de personnes décryptant quotidiennement et gratuitement ces petits morceaux de phrases et alimentant ainsi les logiciels de Google. Au moment du rachat de cette technologie par le moteur de recherche, Luis von Ahn, son créateur, parlait de 200 millions de reCaptcha résolus chaque jour. En comptant environ 10 secondes par reCaptcha, cela équivalait à employer sans interruption 23 000 personnes pendant 24 heures…

Dans une logique de crowdsourcing, certaines « entreprises » se sont même développées autour des reCaptcha, comme le rapportait à l’époque le New York Times. En Asie du sud-est, les pirates n’hésitaient pas à sous-traiter cette activité, pour environ un dollar les mille lignes déchiffrées.

Luis von Ahn et son oeuvre
Luis von Ahn et son oeuvre

Le reCaptcha, désormais inutile dans 99,8% des cas

Google Books n’est pas le seul projet du géant américain à profiter de cette main-d’œuvre gratuite. La reconnaissance des caractères est aussi utile aux Google Glass, qui, associées à Google Trad, pourront traduire par exemple des indications dans une langue étrangère.

Autre exemple : certains reCaptcha utilisent un numéro de rue. En le décryptant, vous alimentez les capacités de reconnaissance de Google Maps. Grâce à ses logiciels, Google, en un seul passage, est capable de lire le nom et le numéro des rues, ou encore les enseignes d’un magasin. C’est très utile lorsqu’il s’agit de proposer à un commerçant de faire de la publicité dans Google Maps, mais aussi lorsqu’une Google Car automatique devra lire les informations indiquées sur les panneaux de signalisation. Les possibilités sont nombreuses tellement les projets de l’Américain sont liés.

Pendant cinq ans, le concept de reCaptcha a été largement exploité par Google. Mais, comme l’indique l’entreprise, il est temps de changer. Et le confort des internautes n’est pas la seule explication : les spécialistes estiment que les robots sont aujourd’hui tellement perfectionnés qu’ils peuvent passer le test sans encombre dans plus de 99,8% des cas. Les internautes du monde entier, passés de 2 à 3 milliards entre 2010 et aujourd’hui, ont bien travaillé.

No-Captcha : Google s’attaque à la reconnaissance d’images

Si sa forme actuelle est dépassée, l’intérêt du reCaptcha, qui renforce l’intelligence des logiciels de Google via le crowdfunding, reste certain. Avec cette mise à jour appelée « No-Captcha », Google veut maintenant utiliser cette procédure pour reconnaitre des images et les associer avec ce qu’elles représentent. Cela permettra d’améliorer les résultats de recherche de Google Image, mais là encore les utilisations possibles sont nombreuses. Il suffira de demander à ses Google Glass quel est l’objet que l’on a sous les yeux pour s’en rendre compte.

On peut aussi associer le No-Captcha avec les recherches réalisées par Google au sein de son « laboratoire X ». Il y a plus de deux ans, l’entreprise américaine faisait la une des médias en développant un réseau neuronal, c’est-à-dire, pour simplifier, un ordinateur construit comme un cerveau humain. Ce dernier avait réussi à apprendre seul à reconnaître un chat. Le taux de réussite était alors de 15,8%, mais de l’aveu des responsables du projet, il suffit d’alimenter en données l’algorithme d’apprentissage de la machine pour que les résultats soient de plus en plus probants.

Dans la même idée, Google a réussi le mois dernier à faire travailler ensembles deux réseaux neuronaux. Leur objectif était d’identifier et de décrire le contenu d’une image. Un réseau identifie les objets présents à l’image, l’autre écrit une courte légende. Le système n’est pas parfait, des erreurs pouvant être provoquées par les ombres et les perspectives, mais l’aide des données collectées par le No-Captcha devrait être précieuse.

Ici, le but de Google est double : améliorer l’identification, et donc le référencement, des milliards d’éléments présents sur le Web, tout en rendant son moteur de recherche plus « humain » et plus à même de comprendre nos requêtes.

Journaliste, diplômé en économie et en histoire, j'ai fait mes classes au service sport du quotidien La Marseillaise avant de tomber dans le Web et l'actualité du numérique. Avec Snackable, je vais essayer de vous faire partager ce qui me passionne ou m'interpelle.

NO COMMENTS

Leave a Reply