L’importanza dei codici CAPTCHA: aiutano a preservare la storia

Dover costantemente dimostrare di essere umano in mezzo a un oceano di robot digitando i cosiddetti CAPTCHA può risultare fastidioso, ma ci sono diverse ragioni per cui farlo.

Cosa sono i CAPTCHA?

I CAPTCHA (“Completely Automated Public Turing test to tell Computers and Humans Apart) sono test ideati per impedire spam o violazioni di sicurezza. Vengono mostrate all’utente un paio di parole sfocate o distorte e questo dovrà diligentemente digitare le lettere che formano quelle parole in uno spazio bianco.

Ma non si tratta solo di sicurezza. Dopo aver letto questo articolo, la prossima volta che affronterete uno di questi CAPTCHA vi sentirete orgogliosi, perché starete contribuendo a preservare la storia. 

I CAPTCHA infatti vengono utilizzati anche per aiutare a migliorare la digitalizzazione di innumerevoli testi antichi, che siano libri, riviste o giornali, che i programmi di scansione faticano a decifrare.

L’obiettivo dietro a quelle parole così sfocate o distorte non è mettere alla prova la vostra pazienza: queste sono tratte da testi scansionati, che sono spesso tradotti in modo errato da programmi di auto-digitalizzazione o da software di riconoscimento ottico dei caratteri, e che invece gli umani possono aiutare a chiarire.

Grazie ai CAPTCHA, persone provenienti da tutto il mondo hanno digitalizzato l’equivalente di 20 anni di copie del New York Times in pochi mesi. Nel primo anno, sono state decifrate 440 milioni di parole, l’equivalente di 17.600 libri.

Google ha acquistato questa tecnologia nel 2009, e la sta utilizzando nel suo ambizioso progetto Google Books, che digitalizza volumi antichi, rari e fuori stampa, offrendoli gratuitamente agli utenti.

L’inventore del CAPTCHA, Luis von Ahn, realizzò che anche se ci si mettevano solo pochi secondi a digitare le lettere, le persone stavano perdendo una quantità enorme di tempo, perciò decise di trovare una soluzione che veicolasse meglio questa energia umana, quella che chiama “Human computation”.

Il software aggiornato è stato rinominato reCAPTCHA.

Inoltre, avrete notato che ci possono essere anche dei numeri nel CAPTCHA. Questo fa parte di un piano ancora più ambizioso: digitalizzare i numeri civici scansionati da Google Street View. Un’impresa forse meno nobile della preservazione della letteratura del passato, ma che in fin dei conti tornerà utile, prima o poi.