Wikipedia für Daten
13. April 2008
Vor einigen Tagen hat der FriendFeed-Mitgründer Bret Taylor ein “Wikipedia für Daten” gefordert. Während er bei Google Zugriff auf verschiedenste Arten von Daten hatte, die Google alle kostenpflichtig lizenziert hatte, hat man das außerhalb nicht. Recht hat er! Kurz darauf hat Read/WriteWeb mit einer Liste an freien Datenquellen geantwortet.
Das Problem daran ist, dass die meisten dieser Daten Englisch sind, da haben deutsche Websites nicht viel davon. Manches wird zwar nicht übersetzt (ein Bandname bleibt immer gleich), Beschreibungen und Texte aber schon, außerdem ist oft das grundsätzliche Problem da, dass (um beim Beispiel “Musik” zu bleiben) Englische Services die deutsche Szene nicht detailliert genug abdecken.
Also: Wo bekommt man an deutschsprachige Daten her?
DBpedia hat vermutlich den vernünftigsten Ansatz: Einfach Wikipedia nehmen und die Daten strukturieren. Das basiert auf dem jeweils Englischen Artikel, dafür werden aber dann Informationen aus anderen Sprachen angezeigt - vorausgesetzt, die Artikel wurden verknüpft. (Was aber eh ziemlich oft der Fall ist.)
Beispiel: http://dbpedia.org/page/Cambridge
dict.cc ist ein Deutsch-Englisch-Wörterbuch, das auf beeindruckende 410.000 Wortpaare gewachsen ist. Die Daten hinter dict.cc sind leider nur für private Verwendung kostenlos, kommerzielle Lizenzen werden meines Wissens nicht verkauft. Wenn man nett fragt und zurück verlinkt, ist vermutlich die Integration der Daten in eine Website kein Problem. Früher waren die Daten wirklich frei, seit das von einem windigen Geschäftemacher ausgenutzt wurde und eine Anzeige zu nichts geführt hat, gibt’s leider diese Einschränkung.
Das ist eindeutig eine magere Auswahl. Eigentlich sollte Wikipedia das anbieten. Wikipedia ist das bekannteste Projekt für freie Informationen und hat eine große Community. Wäre es nicht möglich, die MediaWiki-Software um ein Datenbank-Modul zu erweitern? Ich will nicht weitere Templates - die schaun auf der Website gut aus, sind aber mit keinem Webservice vernünftig abfragbar. Ich hätte gerne eine Datenbank.
Zur Zeit ist Wikipedia nicht darauf ausgerichtet, andere Websites mit Daten zu füttern. Könnte sich das nicht ändern? Ich fände es wünschenswert…
18. April 2008 at 23:26 Uhr
Nun, für eine Datenbank hinter bzw. in der Wikipedia gibt es jedenfalls schon die passende Software: http://de.wikipedia.org/wiki/Semantic_MediaWiki .
Fehlt nur noch die Integration…
27. April 2008 at 20:01 Uhr
Amen. Meine Unterstützung bei einem Vorstoß hättest du.
11. Mai 2008 at 11:36 Uhr
Der Vollständigkeit halber sei erwähnt, dass mein Vorredner bereis einmal ein Projekt in diese Richtung gestartet hat, aber es irgendwie im Sande verlief: http://meta.wikimedia.org/wiki/User:Marcus_Cyron/Wikidata