Wikipedia als Übersetzungsmaschine? Klingt erstmal merkwürdig. Dafür gibt es doch Microsoft Bing Translator, Google Translator, DeepL oder eben die vielen professionellen Übersetzer und Agenturen wie uns.

Die Idee ist eine ganz andere. Denny Vrandečić arbeitet an einer Universalsprache der Fakten.

Das Projekt „Wikipedia“ umfasst mittlerweile mehr als 50 Mio. Artikel in den unterschiedlichsten Sprachen. Dabei sind viele Artikel keine einfachen Übersetzungen aus anderen Sprachen, sondern in der jeweiligen Sprache erstellte Artikel. Damit sind sie nicht „global“ verfügbar bzw. lesbar, sondern eben nur in der Quellsprache. Eine maschinelle Übersetzung ist meist schwierig, da es sich um Sprachen handelt, für die zu wenige Sprachdaten für eine qualitativ ausreichende maschinelle Übersetzung vorliegen. Oder es handelt sich um sehr fachspezifische Themen.

Das Prinzip hinter dem „Abstrakte Wikipedia“ kann man an einem einfachen Beispiel veranschaulichen. Anstatt in einem Fließtext von „jeder Zweite“ zu sprechen, verwendet man z.B. die mathematische Auszeichnung „50%“. Diese kann dann beim Rendern der jeweiligen Ausgabesprache durch Begriffe wie „Half“ oder „la Moitié“ ersetzt werden.

Dieser Gedanke ist auch auf die Dokumentation von zum Beispiel Maschinen oder Softwareprodukten anwendbar und macht die Übersetzung einfacher – egal ob durch professionelle Übersetzer oder eben maschinelle Übersetzungen.

Und zum Abschluss macht Vrandečić auch zu seiner Muttersprache noch eine interessante Aussage: „Außerdem hat sich die Sprache (Kroatisch) in den letzten 20 Jahren stark verändert, das hat politische Hintergründe, viele Begriffe werden heute neu definiert, um das Kroatische stärker vom Serbischen abzugrenzen.

Quelle:
Wikipedia wird 20: »Wenn Google das Projekt angehen würde, das würde glorios scheitern« – DER SPIEGEL