Drei Mythen und ein Todesfall: Urheberrechtliche Fragen bei der Generierung von KI-Daten
© Adobe Stock | Chaosamran_Studio

Das LG Hamburg hat erstmals zur Reichweite des Urheberrechts bei KI-nahen Produkten entschieden – und mit einem ausführlichen obiter dictum ein Grundsatzurteil daraus gemacht. Die Entscheidung kommentiert Professor Dr. Thomas Hoeren.

Im Zusammenhang mit KI, dem neuen Modewort, kommt es immer mehr zu Mythen und Irrglauben. Viele reden bei der Diskussion über KI mit, ohne etwas von dem Thema zu verstehen. Die Bundesmythen und Fehleinschätzungen betreffen zunächst einmal den Begriff KI selbst. Keiner vermag derzeit zu verstehen, was genau KI ist. Unterschiedslos werden maschinelles Lernen und künstliche Intelligenz miteinander vermengt. Dabei geht es oft nur um das stets präsente ChatGPT. Tatsächlich gehört die Welt von OpenAI in den Kosmos generativer Software, die wiederum nur ein kleinerer Ausschnitt in der großen amorphen Masse KI ist. Außerdem ist ChatGPT auch nur ein Produkt unter vielen anderen, die zum Teil deutlich bessere Resultate bringen, wie etwa Gemini oder Anthropic.

Womit wir schon bei dem zweiten Irrglauben sind: KI bringe in vielen Bereichen der Rechtsordnung massive neue Probleme. An zwei Beispielen lässt sich leicht zeigen, wie falsch diese Annahme ist. Das Arbeitsgericht Hamburg hat in aller Klarheit entschieden, dass die Einführung von ChatGPT nicht mitbestimmungspflichtig ist und daher auch nicht der Kontrolle durch den Betriebsrat unterliegt (Beschluss vom 16.01.2024 – 24 BVGa 1/14). Also besteht kein Problem bei generativer Software mit der Einführung im Betrieb.

Auch das leidige Thema Datenschutz ist für die Fragestellungen rund um das Training von KI zunächst einmal entschieden, durch eine Stellungnahme des Hamburgischen Landesdatenschutzbeauftragten. Dieser hat im Juli 2024 zum Erstaunen der Hardliner in einem ausführlichen Papier begründet, warum regelmäßig durch generative Software im Trainieren von Daten kein Personenbezug anzunehmen sei.

Die Reichweite des Urheberrechts bei KI-Produkten

Und damit kommt man schon zum dritten Irrglauben, nämlich dem, dass KI eine brutale Gefährdung der kreativen Darsteller sei und fundamental in deren Urheberrechte eingreife. Die Content-Industrie schreit jedenfalls Zeter und Mordio gegen KI und hat ein Gutachten in Auftrag gegeben, das mit fragwürdigen Grundannahmen den Nachweis führen soll, dass ChatGPT auch urheberrechtlich geschützte Werke speichere. Und sofort haben die üblichen Verdächtigen, zum Beispiel die VG Wort, ihre Wahrnehmungsverträge geändert und für sich das Recht in Anspruch genommen, auch die Nutzung von Werken als Training für KI zu lizenzieren.

Das LG Hamburg hat diesem Begehren jetzt erst einmal einen vorläufigen Riegel vorgeschoben (Urteil vom 27.09.2024 - 310 O 227/23). Im Urteil des LG im Fall LAION handelt es sich wahrscheinlich um das europaweit erste Urteil, das sich mit der Reichweite des Urheberrechts bei KI-nahen Produkten beschäftigt.

Dabei steht nicht die generative Künstliche Intelligenz im Vordergrund, sondern ein Tabellendokument mit mehr als 5 Milliarden Bild-Text-Paaren, welches öffentlich zugängliche Bilder verlinkt. Im Zentrum des Verfahrens stand daher die Erstellung der Datensätze, nicht aber das KI-Training. Das Gericht bezeichnete dies als "KI-Webscraping" und unterschied dabei drei Phasen der Anwendung der TDM-Ausnahme, wobei es sich in diesem Fall auf die erste Phase beschränkte.

Richter wollten ein Grundsatzurteil fällen

Das Urteil ist kein direktes Urteil zur Zulässigkeit generativer KI-Programme oder des Data-Minings, aber die obiter dicta könnten für künftige urheberrechtliche Diskussionen in diesem Bereich von Bedeutung sein. Auffällig war die Schnelligkeit, mit der das Urteil gefällt wurde, was sich am nachlässigen Umgang mit der Literatur zeigt.

Das Gericht distanzierte sich deutlich von dem oben erwähnten Gutachten, das die Reichweite der urheberrechtlichen Schranken aus § 44b und § 60d UrhG im Auftrag der Content-Industrie pauschal abgelehnt hatte. Methodisch hätte es ausgereicht, sich auf den entscheidenden Gedanken des § 60d UrhG – dem Data-Mining zu Forschungszwecken – zu konzentrieren, doch die Richter wollten ein Grundsatzurteil fällen, das die europäische Diskussion nachhaltig beeinflusst.

Die Richter verwarfen schnell § 44a UrhG – die nur vorübergehende Vervielfältigung –, da sie diese weder als "flüchtig" noch als "zufällig" einstuften. Im vorliegenden Fall wurde die Bilddatei bewusst heruntergeladen, um sie mit einer speziellen Software zu analysieren. Damit war das Herunterladen kein bloßer Begleitvorgang zur durchgeführten Analyse, sondern ein bewusster und aktiv gesteuerter Vorgang, der vor der Analyse stattfand.

Ein weiterer strittiger Punkt war der Umgang mit der Vorschrift des § 44b Abs. 3 UrhG, der die Anforderungen an einen Nutzungsvorbehalt näher regelt. Das Gericht meinte, dass ein auf der Website einer Fotoagentur veröffentlichter Nutzungsvorbehalt zugunsten des Klägers ausgelegt werden könnte, was rechtlich fragwürdig ist. Es stellte sich auch die Frage, ob eine AGB-Erklärung als maschinenlesbar gelten könne, was die Richter bejahten, obwohl dies in der DSM-Richtlinie anders gehandhabt wird.

Gericht bejaht Ausnahme zu Forschungszwecken

Schließlich verdient die Auslegung des § 60d UrhG im Urteil Lob. Das Gericht stellte klar, dass Data-Mining für wissenschaftliche Forschungszwecke durch Forschungsorganisationen auch gegen Rechtevorbehalte zulässig sei. Es bleibt jedoch unverständlich, warum das Gericht den Fall nicht dem EuGH zur Klärung vorgelegt hat, insbesondere angesichts der zahlreichen europarechtlichen Implikationen.

§ 60d UrhG erlaubt die Vervielfältigung zu Zwecken der wissenschaftlichen Forschung unter bestimmten Voraussetzungen. Hochschulen, Forschungsinstitute und andere Einrichtungen, die wissenschaftliche Forschung betreiben, dürfen Werke vervielfältigen, wenn sie erstens nichtkommerzielle Zwecke verfolgen, zweitens ihren gesamten Gewinn in die wissenschaftliche Forschung reinvestieren oder drittens aufgrund eines staatlich genehmigten Auftrags im öffentlichen Interesse handeln.

Diese Ausnahme gilt nicht für Forschungseinrichtungen, die mit einem privaten Unternehmen zusammenarbeiten, das einen gewissen Einfluss auf die Forschungseinrichtung ausübt und bevorzugten Zugang zu den Ergebnissen ihrer wissenschaftlichen Forschung hat.

Das Gericht stellte fest, dass die Vervielfältigung von LAION zu Forschungszwecken vorgenommen wurde. Auch wenn die Erstellung des Datensatzes als solche noch nicht mit einem Erkenntnisgewinn verbunden sein mag, wurde sie als grundlegender Schritt mit dem Ziel angesehen, den Datensatz zum Zwecke eines späteren Erkenntnisgewinns zu verwenden. Es reiche aus, dass der Datensatz kostenlos veröffentlicht und damit (auch) den Forschern im Bereich der künstlichen neuronalen Netze zur Verfügung gestellt werde.

Nicht-kommerzieller Zweck bei Open-Source-Daten erfüllt

Auch LAION verfolgte nach dem Urteil nicht-kommerzielle Zwecke. Der nicht-kommerzielle Zweck von LAION im Zusammenhang mit der Erstellung des LAION-5B-Datensatzes ergebe sich aus der Tatsache, dass LAION diesen unstreitig kostenlos öffentlich zur Verfügung stelle. Die Organisation und Finanzierung von LAION sei in diesem Zusammenhang unerheblich.

Der betroffene Urheber hatte vortragen lassen, dass es eine Zusammenarbeit mit Stability AI gebe, das nach seiner Behauptung durch die Finanzierung des betreffenden Datensatzes und die Besetzung relevanter Positionen bei LAION durch eigene Mitarbeiter direkten Einfluss auf LAION hatte. Laut einem Interview mit dem Gründer und Geschäftsführer hat Stability AI den LAION-5B-Datensatz finanziert.

Das Hamburger Gericht war der Ansicht, dass die Gegenausnahme des § 60d Abs. 2 Nr. 3 UrhG nicht erfüllt sei. Die Tatsache, dass zwei Mitglieder von LAION auch für ein kommerzielles Unternehmen (wahrscheinlich Stability AI) arbeiteten, beweise nicht, dass dieses Unternehmen einen entscheidenden Einfluss auf die Forschungsarbeit von LAION hatte. Der betroffene Urheber hatte auch nicht einmal behauptet, dass ein Privatunternehmen bevorzugten Zugang zu den Ergebnissen der wissenschaftlichen Forschung von LAION hatte. Daher konnte sich LAION auf die Ausnahme des § 60d UrhG für die Kopie berufen, die bei der Erstellung des LAION-5B-Datensatzes angefertigt wurde.

Und der Todesfall? Wenn weiterhin in typisch deutscher Manier "KI" zerredet würde, wird die ganze Szene rund um Künstliche Intelligenz und maschinelles Lernen aus Europa abwandern und sich endgültig in die USA oder nach Asien zurückziehen. Erste Unternehmen schließen bereits in Deutschland und haben die Nase von den Regulierungsfanatikern voll. Es steht insofern ein tragischer Todesfall zu befürchten, der die derzeitige Rezession in Europa weiter beflügeln wird.

Prof. Dr. Thomas Hoeren leitet das Institut für Informations-, Telekommunikations- und Medienrecht an der Universität Münster. Der Artikel gibt seine persönliche Meinung wieder.

Prof. Dr. Thomas Hoeren, 14. Oktober 2024.