Prof. Dr. Thomas Hoeren

Die «Wayback-Machine» - Was bringen Internetarchive für die


In Prozessen erweist sich die schnelle Änderbarkeit von HTML-Dokumenten als Problem. Wie soll jemand z.B. nachweisen, welchen Inhalt eine Homepage zu einem bestimmten Zeitpunkt hatte? Homepages sind schnell änderbar. Das macht es für den forensisch tätigen Rechtsanwalt schwierig, Altversionen einer Website zu finden und zu Nachweiszwecken in das Verfahren einzuführen.

Der folgende Beitrag beschreibt ein in Deutschland kaum bekanntes Tool, das Abhilfe schaffen könnte: die Waybackmaschine.

I. Einführung

Bei Websites fehlt es regelmäßig an einer dauerhaften Verkörperung. Das führt zu erheblichen Beweisproblemen. Wie will man eine Verletzung marken- oder verbraucherschutzrechtlicher Vorgaben nachweisen, wenn es die Website in der streitgegenständlichen Version nicht mehr gibt. Der Provider kann sich problemlos darauf berufen, dass es die Website nie - oder nicht mit diesem Inhalt - gegeben hat. In dieser Situation können Waybackmaschinen helfen, die die Rekonstruktion älterer Versionen einer Website zu ermöglichen.

II. Internet-Archive

Internet-Archive ist ein Non-Profit-Unternehmen und dient dem Aufbau einer umfassenden Internetbibliothek. Ziel ist es, Forschern, Historikern, Wissenschaftlern und allen weiteren Interessierten einen permanenten Zugang insb. zu nicht mehr vorhandenen Webseiten zu bieten. Das Unternehmen wurde 1996 gegründet und hat seinen Sitz in San Francisco. Gründer und Direktor ist der Amerikaner Brewster Kahle, ein kalifornischer Informatiker. Für die Archivierungen wird die von Kahle entwickelte Suchmaschine Alexa ausgewertet.

Mit der Wayback-Machine (www.waybackmachine.com oder http://www.archive.org/web/web.php) soll eine Art Langzeitgedächtnis des Netzes geschaffen werden, denn die meisten Webseiten von 1996 sind schon jetzt nicht mehr im Internet vorhanden. Das Archiv gibt Einblicke in die Entwicklung des Internet und nicht mehr existierende Homepages lassen sich so wieder rekonstruieren (Niko Deussen, Per Zeitmaschine in die Vergangenheit, abrufbar unter: www.zeit.de/archiv/2002/16/200216_t-waybackmachine.xml?page=all). Seit November 2001 ist die Internetsuchmaschine "The Wayback Machine" für die Öffentlichkeit zugänglich. Die gesammelten Seiten betragen z.Zt. ca. 40 Billionen Webseiten und nehmen einen Speicherplatz von etwa einem Petabyte ein.

Im Abstand von ca. zwei Monaten wird das gesamte Internet archiviert. Damit kommt monatlich etwa ein Datenvolumen von 20 Terabytes hinzu. Im Idealfall kann der Anwender somit im 60-Tage-Rhythmus verfolgen, wie sich eine Website verändert. Das Internetarchiv ist damit die größte existierende Datenbank der Welt.

Auf der Startseite der Wayback-Machine kann man die gewünschte URL oder Stichwörter in die Suchmaske eingeben und dann aus einer Übersicht der Jahresarchive eine der verfügbaren archivierten Webseiten auswählen. Bei der Stichwortsuche werden nicht nur die gesuchten Worte berücksichtigt, da das System "versteht", welche Worte in diesem Zusammenhang ebenfalls als treffend gelten können. Dafür gibt es einen Katalog automatisch generierter Kategorien und Themen. Während der Suchanfrage wird eine Auswahl an Kategorien und Themen gebildet, die zur Verfeinerung der Suche verwendet werden kann. In jeder Ergebnisliste sind entsprechende Auswahlfelder am rechten Seitenrand sichtbar. Wählt man dort einen Begriff, wird die Suchanfrage um diesen Begriff erweitert und die Treffer werden präziser.

Weiterhin besteht die Möglichkeit, durch die Auswahl eines Datenbereichs die Suche auf einen Zeitraum einzuschränken. Alle Treffer erhalten eine Bewertung. Durch die Auswahl eines Treffers auf hinteren Plätzen gibt man zu erkennen, dass dieser Treffer einen höheren Wert besitzt. Dieser wird zukünftig für die eigene Anfrage höher bewertet. So kann es passieren, dass zwei Personen die gleiche Suchanfrage stellen und nach einer gewissen Menge von Anfragen unterschiedliche Ergebnisse erhalten, da sie verschiedene Treffer auswählten. Die Websites lassen sich nicht nur wieder aufrufen, sondern auch browsen. Dazu werden die originalen Links der Webseiten neu über die Adresse des Archivservers verknüpft. Zu herausragenden Ereignissen werden außerdem Sondersammlungen angelegt, wie z.B. zu den Terroranschlägen vom 11.9. 2001. Eine "Advanced Search" lässt die Suche auf bestimmte Zeiträume begrenzen und bietet viele weitere Feineinstellungen für die Suchmaschine.

Einzelne Webseiten fehlen. Zum einen kann der Grund darin liegen, dass die automatische Archivierungssoftware von der Webseite keine Kenntnis hatte. Weiterhin sind diejenigen Seiten nicht archiviert, die passwortgeschützt sind. Außerdem gibt es für Websitebetreiber die Möglichkeit, mit einem entsprechenden Eintrag in der Datei robots.txt zu verhindern, dass Seiten von Internet-Archive erfasst und archiviert werden. Dann erscheint eine "robots.txt query exclusion error"-Nachricht. Auch bereits archivierte Seiten können von den jeweiligen Websitebetreibern nachträglich gelöscht werden. Für diesen Fall erscheint eine "blocked site error"-Nachricht.

Einige der archivierten Seiten sind unvollständig. Dies kann daran liegen, dass nicht alle Websites gleich leicht zu archivieren sind. Z.B. Javascript-Elemente sind oft schwer zu archivieren. Generell sind auf dem html-Protokoll beruhende Seiten am einfachsten zu speichern. Größere Bilder und andere speicherplatzintensive Mediadaten sind meistens nicht als Kopie vorhanden.


III. Google als Alternative?

Einen ähnlichen, jedoch längst nicht so weitgehenden Service bietet die Suchmaschine Google an. Nach Eingabe eines Suchbegriffs und Anzeige der Ergebnisse bietet Google die Möglichkeit einer Suche im Archiv an, der sog. Google Cache. Im Gegensatz zu der Waybackmachine werden bei Google die Seiten nur für drei Wochen gespeichert und anschließend gelöscht.

Eine rückwärtige Suche ist somit auf den Zeitraum von max. drei Wochen begrenzt. Weiterhin speichert Google im Gegensatz zur Waybackmaschine auch keine vollständigen Webpräsenzen, sondern es handelt sich vielmehr nur um einzelne Seiten. Klickt man auf einen Link innerhalb der Cache-Seiten, führt dieser nicht zur betreffenden Cache-Seite, sondern springt vielmehr in die aktuelle Version der Webseite.


IV. Rechtliche Möglichkeiten und Grenzen

In der Zwischenzeit gibt es bereits erste Fälle, in denen die Wayback-Machine erfolgreich im Prozess eingesetzt werden konnte. So gewann der Computer-Gigant Dell Inc. 2005 dank des Suchtools den Streit um DellComputersSuck.com (National Arbitration Forum, Dell Inc. v. Innervision Web Solutions c/o Domain Registrar, Claim Number: FA05030004 45601; http://www.arbforum.com/domains/decisions/445601.htm). Zu den ersten Nutzern des Tools zählte die Vodafone Group PLC, die im Jahr 2001 dank Wayback-Machine das Verfahren um die Domain vodaphone.com für sich entschied (D2001-1037. In inzwischen 13 Fällen taucht die Waybackmaschine in UDRP-Verfahren auf und wird dort wie selbstverständlich als Beweismittel zugelassen; s. etwa D2005-0743 - elc.com; D2002-0058 - autoway.com; D2003-0932 - gfe.com). Unklar ist allerdings, ob Waybackmaschinen nicht urheberrechtliche Vorgaben verletzen (Martin Bahr, The Wayback Machine und Google Cache - eine Verletzung deutschen Urheberrechts? JurPC Web-Dok. 29/2002, Abs. 1-18,abrufbar unter: www.jurpc.de/aufsatz/20020029.htm).

Durch das Bereitstellen des Archivs werden u.a. auch urheberrechtlich geschützte Werke vervielfältigt und zum öffentlichen Abruf bereitgestellt. Die Wayback-Machine stellt ein durchsurfbares Webseiten-Archiv über einen unbegrenzten Zeitraum zur Verfügung. Fraglich ist hier, ob die einzelnen Ersteller von Webseiten einer so umfassenden und dauerhaften Speicherung durch das Bereitstellen der Seiten im Internet konkludent zugestimmt haben.

Zumindest wird die Archivierung nicht immer dem potenziellen Willen des Webseitenbetreibers entsprechen, da sicherlich Fälle denkbar sind, in denen der einzelne Urheber nicht wünscht, dass seine Seiten archiviert werden. Dies spricht dafür, dass die Archivierung durch die Wayback-Machine gegen § 16 UrhG verstößt. Eine Rechtfertigung über § 53 Abs. 2 Nr. 1 UrhG ist nur zulässig, zum eigenen wissenschaftlichen Gebrauch Vervielfältigungen herzustellen.

Das Archiv der Wayback-Machine ist jedoch frei zugänglich und eine Begrenzung auf rein wissenschaftliche Zwecke liegt somit nicht vor. Auch scheidet eine Rechtfertigung gem. § 53 Abs. 2 Nr. 2 UrhG aus. Danach dürfen Vervielfältigungen zur Aufnahme in ein eigenes Archiv gemacht werden, wenn dies der Zweck gebietet. Bei der Wayback-Machine ist jedoch gerade die Benutzung durch Dritte der Grund für das Internetangebot. Die Benutzung durch Dritte ist allerdings nach Rspr. und Schrifttum nicht zulässig. Auch ist die Wayback-Machine nicht gem. § 53 Abs. 2 Nr. 4b UrhG zu rechtfertigen. Danach können Vervielfältigungen zum sonstigen eigenen Gebrauch hergestellt werden, wenn es sich um ein seit mind. zwei Jahren vergriffenes Werk handelt.

Hier fehlt es an dem Erfordernis, dass nur der Gebrauch für eigene Zwecke statthaft ist, denn die Wayback-Machine zielt gerade auf eine Benutzung durch die Allgemeinheit ab. Man wird sich in dieser Situation allenfalls auf das Urteil des BGH in Sachen Paperboy (BGH MMR 2003, 719 - Paperboy), berufen können. Hiernach sollen Links, auch Deep Links, zum Wesen des Internet gehören und daher urheber- und wettbewerbsrechtlich zustimmungsfrei zulässig sein. Dies gelte auch dann, wenn dies dem Interesse des Informationsanbieters widerspricht, dadurch Werbeeinnahmen zu erzielen, dass Nutzer, die Artikel über die Startseiten aufrufen, zunächst der dort aufgezeigten Werbung begegnen.

Allerdings beschränkt sich der Paperboy-Freibrief nur auf die Bereitstellung öffentlich zugänglich gemachter Informationsangebote, nicht jedoch auf alte, eigentlich nicht mehr zugreifbare Alt-Homepages. Insofern bleibt das weitere rechtliche Schicksal der Waybackmaschinen unklar.

Prof. Dr. Thomas Hoeren, Münster.

Diese Meldung wurde der Rubrik «Kommunikationsrecht - Die Monatsschau» von RA Dr. Raimund Schütz, Freshfields Bruckhaus Deringer, Düsseldorf. entnommen.


MMR 2006, Heft 1, V