Du måste aktivera javascript för att sverigesradio.se ska fungera korrekt och för att kunna lyssna på ljud. Har du problem med vår sajt så finns hjälp på http://kundo.se/org/sverigesradio/

Ovetande Internetanvändare bygger upp datorbibliotek

Publicerat fredag 15 augusti 2008 kl 05.31
1 av 3
2 av 3
3 av 3
Två ord skrivs av, ett okänt ord och ett känt kontrollord.

Forskare från universitetet Carnegie Mellon i USA har tagit miljontals Internetanvändare till hjälp så att man nu kan digitalisera motsvarande omkring 160 böcker varje dag. Det handlar om att att överföra text från gamla, slitna böcker där bläcket börjat bli suddigt och svårläsligt till datorn och göra det lätt sökbart.

Du kanske har stött på det själv någon gång när du försökt logga in på en e-postsajt, en blogg eller kanske en biljettförsäljningssajt. Innan du släpps in ser du några snirkliga, suddiga bokstäver som du måste skriva av korrekt. Bokstäver som människor kan skriva av, men som är svårare för datorer att tyda.

Förhindrar datorer att logga in på hemsidor
Det här systemet kallas för Captcha och är ett sätt att hindra just automatiserade datorprogram från att logga in på en sajt, program som exempelvis genererar skräppost.
Varje dag ägnar sig miljontals Internetanvändare på det här sättet åt rätt avancerad textanalys, och det här ville de amerikanska forskarna utnyttja.

För drygt ett år sedan lanserade de därför ett nytt sådant här inloggningssystem, reCaptcha, där Internetbesökaren istället får översätta riktig text, ett par ord från äldre, slitna böcker eller tidningar.

Motsvarar 17 600 böcker
Ett av orden är känt, men det andra har de vanliga automatiska digitaliseringsprogrammen inte lyckats knäcka. Översätter sedan tillräckligt många det okända ordet på samma sätt så anses översättningen vara pålitlig.
På så vis har man det senaste året översatt mer än 440 miljoner svårtydda ord. Något som motsvarar ungefär 17 600 manuellt digitaliserade böcker, enligt en rapport i tidskriften Science. 

Grunden i vår journalistik är trovärdighet och opartiskhet. Sveriges Radio är oberoende i förhållande till politiska, religiösa, ekonomiska, offentliga och privata särintressen.
Har du frågor eller förslag gällande våra webbtjänster?

Kontakta gärna Sveriges Radios supportforum där vi besvarar dina frågor vardagar kl. 9-17.

Du hittar dina sparade avsnitt i menyn under "Min lista".