Wikipedia: Community-Projekt repariert über neun Millionen Links

Bibliotheca Alexandrina - Internet ArchiveFoto: Bibliotheca Alexandrina/Internet Archive (San Francisco), Urheber: Raimond Spekking (CC BY-SA 4.0)

Ein Community-Projekt zwischen der Wikipedia und Internet Archive haben in den letzten Jahren über neun Millionen Links repariert. Die „kaputten“ Links verweisten zuvor Webseiten, die nicht mehr vorhanden waren.

Als Webseiten-Betreiber kennt man vielleicht das Problem, dass es in all den Jahren hin und wiedermal vorkommt, dass zuvor gesetzte Links auf externen Seiten „heutzutage“ nicht mehr gültig sind. Das geschieht, wenn beispielsweise der Inhalt auf dieser Seite gelöscht wurde oder die komplette Webseite nicht mehr vorhanden ist. Aber auch als Seitenbesucher bekommt man sowas gelegentlich mal mit. Man klickt auf eine Verlinkung auf einer Webseite und der Inhalt dahinter ist nicht mehr verfügbar (404-Fehler).


Genau dieses Problem hat auch Wikipedia. Wikipedia „lebt“ zum Beispiel davon, Inhalte von anderen Webseiten zu übernehmen und als Quelle anzugeben. Beispielsweise, weil man in einem Beitrag über ein Ereignis schreibt und darauf verweist, woher man die Informationen her hat.

In all den Jahren kann es aber natürlich auch mal vorkommen, dass der Inhalt der Quelle nicht mehr aufrufbar ist. In diesem Fall spricht man von dem gesetzten Link zur Webseite (Quelle) von einem toten Link. Um dieses Problem zu beheben, hat ein Community-Projekt dazu erheblich beigetragen, „tote“ gegen „aktive“ Links auszutauschen. Möglich machte dies das Internet Archiv mit dem Projekt „Wayback-Machine“.


Wayback-Machine ist ein Projekt, womit möglichst alle fremden Webseiten auf der eigene Webseite archiviert werden. Man speichert quasi den Inhalt auf der eigenen Webseite, um so Interessenten zeigen zu können, wie der Inhalt an einem bestimmten Datum ausgesehen hat.

Dank des Community-Projekts wurde versucht, die toten Links, die bei Wikipedia gesetzt wurden, gegen Links von der Wayback-Machine auszutauschen, sodass man den regulären Inhalt wieder sehen kann. Das hat natürlich einen erheblichen Vorteil für so ziemlich alle Parteien.


Dazu wurde ein Bot namens „IABot“ für Wikipedia programmiert, der die toten Links auf Wikipedia sammelte und anschließend schaute, ob der reguläre Inhalt über die Wayback-Machine vorzufinden ist. Ist das der Fall, wird der tote Link gegen den Link der Wayback-Machine ausgetauscht. So wurden über neun Millionen Links ausgetauscht, die zuvor nicht mehr funktioniert haben.

Eine erste Analyse von Wikipedia zeigt, dass sich das Community-Projekt durchaus gelohnt hat. Denn ein erheblicher Großteil der externen Links, die von den Seitenbesucher angeklickt wurden, führten zur Wayback-Machine.

Kommentar hinterlassen zu "Wikipedia: Community-Projekt repariert über neun Millionen Links"

Hinterlasse einen Kommentar

E-Mail Adresse wird nicht veröffentlicht.


*