reCAPTCHA, c'est vous qui digitalisez des livres anciens

Publié par
j0k3r_n0ir le 27 Mai 2007 à 22:51. Lu 1819 fois
L'idée est très ingénieuse et mérite d'être connu de tous !
Sur une grande majorité des sites internets actuels, on retrouve des captchas qui permettent d'identifier un véritable internaute d'un ordinateur. Ils sont placés à la fin de formulaires d'inscription et présentent des lettres et/ou des chiffres que vous devez reconnaitre. C'est l'Université Carnegie Mellon, aux USA, qui est à l'origine de cette initiative.
Une jeune équipe de cette même université a eu la bonne idée d'utiliser les captchas pour digitaliser les livres anciens ! Ces livres anciens sont généralement mis sous format électronique grâce à des logiciels OCR qui permettent de reconnaitre des mots via une image. Mais ces logiciels s'avèrent de temps en temps défaillant sur certains mots.
Le principe de
reCAPTCHA (lien externe) est d'afficher deux mots à reconnaitre. Le premier étant un mot déjà connu par les logiciels OCR et le deuxième leur est inconnu. Ainsi, en répondant correctement vous informer l'ordinateur de la véritable orthographe du deuxième mot. Il suffit que 3 personnes valident ce même mot pour que l'ordinateur soit sûr de son orthographe.
Cette idée permet ainsi d'utiliser le temps que tous les internautes passent à remplir un captcha pour digitaliser d'anciens ouvrages.
Vous trouverez
plein de ressources (lien externe) sur le site de reCAPTCHA pour mettre en oeuvre ce captcha dans vos applications.
A noter qu'il existe aussi un
plugin Symfony (lien externe) pour intégrer reCAPTCHA :)