Kennst du Captchas? Das sind kleine Grafiken mit vermurkstem Text, die primär als SPAM-Schutz für alles mögliche verwendet werden.
Kommentar-Funktionen oder Gästebücher, Anmeldeformulare oder E-Mail-Adressen-Anzeige - all das kann durch Captchas geschützt werden.
Man muss dazu einfach nur den vermurksten Text (der verdreht, zerkritzelt, etc. ist, so dass er von Computern nicht mehr gelesen werden kann, von Menschen aber schon noch) entziffern, und schon kann man kommentieren, sich anmelden oder versteckte Informationen sehen.
Das interessante daran: Anscheinend werden wetweit pro Tag 60 Millionen Captchas gelöst, was insgesamt ca. 150.000 Stunden Arbeit verursacht. Diese Arbeitszeit möchte die Carnegie Mellon University, die auch das ursprüngliche Captcha entwickelt hat, nützen, um alte Bücher zu digitalisieren.
Normalerweise läuft das so ab, dass die Bücher eingescannt und durch Texterkennungs-Programme geschickt werden, nur funktioniert das bei alten Büchern oft nicht.
Deshalb sollen “reCAPTCHAS” helfen, Bücher zu digitalisieren. Die Digitalisierungssoftware zerteilt die Texte der Bücher nur noch in einzelne Wörter, von denen immer ein bereits bekanntes und ein noch unbekanntes gemeinsam angezeigt werden - diese muss man übersetzen. Wird das dem System bereits bekannte Wort richtig übersetzt, wird davon ausgegangen, dass auch das unbekannte Wort richtig übersetzt wurde. Zur Sicherheit wird jedes Wort mehrmals übersetzt.
Das Ziel der Universität ist es, möglichst viele ganze Bücher mit diesem System zu übersetzen.
Meine Meinung? Geniale Idee! Zur Zeit ist das nur auf Englisch verfügbar, hoffentlich können die Macher von reCAPTCHA möglichst bald auch anderssprachige Bücher digitalisieren, dann könnte man es wirklich überall einsetzen.