LG München I v. 11.11.2025 - 42 O 14139/24
ChatGPT: Wiedergabe kompletter Songtexte verstößt gegen Urheberrecht
Die GEMA hat gegen zwei Unternehmen der Unternehmensgruppe Open AI, die Sprachmodelle und darauf basierende Chatbots betreiben (etwa ChatGPT), Anspruch auf Unterlassung, Auskunft und Schadensersatz hinsichtlich der Wiedergabe von Liedtexten neun bekannter deutscher Urheber. Sowohl durch die Memorisierung in den Sprachmodellen als auch durch die Wiedergabe der Liedtexte in den Outputs des Chatbot liegen Eingriffe in die urheberrechtlichen Verwertungsrechte vor. Diese sind nicht durch Schrankenbestimmungen, insbesondere die Schranke für das Text und Data Mining gedeckt.
Der Sachverhalt:
Das Verfahren betrifft die Liedtexte neun bekannter deutscher Urheber (darunter "Männer" von Herbert Grönemeyer, "Atemlos" von Kristina Bach oder "Wie schön, dass du geboren bist" von Rolf Zuckowski). Die klagende Verwertungsgesellschaft GEMA macht die Ansprüche geltend. Die Klägerin ist der Ansicht, die Liedtexte seien in den Sprachmodellen der Beklagten memorisiert und würden bei Nutzung des Chatbots auf einfache Anfragen der Nutzer als Antworten (Outputs) in weiten Teilen originalgetreu ausgegeben.
Die Beklagten sind zwei Unternehmen der Unternehmensgruppe Open AI und Betreiber von Sprachmodellen und darauf basierender Chatbots (etwa ChatGPT). Sie wenden gegen die erhobenen Ansprüche ein, ihre Sprachmodelle speicherten oder kopierten keine spezifischen Trainingsdaten, sondern reflektierten in ihren Parametern, was sie basierend auf dem gesamten Trainingsdatensatz erlernt hätten. Da die Outputs nur als Folge von Eingaben von Nutzern (Prompts) generiert werden würden, seien nicht die Beklagten, sondern der jeweilige Nutzer als Hersteller des Outputs für diese verantwortlich. Ohnehin seien eventuelle Rechtseingriffe von den Schranken des Urheberrechts, insbesondere der Schranke für das sog. Text- und Data-Mining gedeckt.
Das LG gab der Klage überwiegend statt. Das Urteil ist nicht rechtskräftig.
Die Gründe:
Der Klägerin stehen die geltend gemachten Ansprüche sowohl aufgrund der gegebenen Vervielfältigung der Texte in den Sprachmodellen als auch durch ihre Wiedergabe in den Outputs zu. Sowohl durch die Memorisierung in den Sprachmodellen als auch durch die Wiedergabe der Liedtexte in den Outputs des Chatbot liegen Eingriffe in die urheberrechtlichen Verwertungsrechte vor. Diese sind nicht durch Schrankenbestimmungen, insbesondere die Schranke für das Text und Data Mining gedeckt. Hinsichtlich der ebenfalls geltend gemachten Ansprüche auf Grund einer Verletzung des allgemeinen Persönlichkeitsrechts wegen fehlerhafter Zuschreibung veränderter Liedtexte war die Klage jedoch abzuweisen.
Die streitgegenständlichen Liedtexte sind reproduzierbar in den Sprachmodellen 4 und 4o der Beklagten enthalten. Es ist bekannt, dass Trainingsdaten in Sprachmodellen enthalten sein können und sich als Outputs extrahieren lassen. Dies wird als Memorisierung bezeichnet. Eine solche liegt vor, wenn die Sprachmodelle beim Training dem Trainingsdatensatz nicht nur Informationen entnehmen, sondern sich in den nach dem Training spezifizierten Parametern eine vollständige Übernahme der Trainingsdaten findet. Eine solche Memorisierung ist durch einen Abgleich der Liedtexte, die in den Trainingsdaten enthalten waren, mit den Wiedergaben in den Outputs festgestellt. Angesichts der Komplexität und Länge der Liedtexte ist der Zufall als Ursache für die Wiedergabe der Liedtexte ausgeschlossen.
Durch die Memorisierung ist eine Verkörperung als Voraussetzung der urheberrechtlichen Vervielfältigung der streitgegenständlichen Liedtexte durch Daten in den spezifizierten Parametern des Modells gegeben. Nach der Rechtsprechung des EuGH ist für die Vervielfältigung eine mittelbare Wahrnehmbarkeit ausreichend, die gegeben ist, wenn das Werk unter Einsatz technischer Hilfsmittel wahrgenommen werden kann. Diese Vervielfältigung in den Modellen ist weder durch die Schrankenbestimmungen des Text und Data Mining des § 44b UrhG noch durch § 57 UrhG als unwesentliches Beiwerk gedeckt. Zwar unterfallen Sprachmodelle grundsätzlich dem Anwendungsbereich der Text und Data Mining Schranken. Die Vorschriften decken erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus für das Training, wie etwa die Vervielfältigung eines Werks durch seine Überführung in ein anderes (digitales) Format oder Speicherungen im Arbeitsspeicher. Hintergrund hierfür ist der Gedanke, dass diese Vervielfältigungen lediglich zu nachfolgenden Analysezwecken erstellt werden und damit die Verwertungsinteressen des Urhebers am Werk nicht beeinträchtigen. Da diese für das Text und Data Mining rein vorbereitenden Handlungen kein Verwertungsinteresse berühren, sieht das Gesetz keine Vergütungspflicht gegenüber dem Urheber vor.
Werden beim Training - wie hier - nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt, stellt dies kein Text und Data Mining dar. Die Prämisse des Text und Data Mining und der diesbezüglichen Schrankenbestimmungen, dass durch die automatisierte Auswertung von bloßen Informationen selbst keine Verwertungsinteressen berührt sind, greift in dieser Konstellation nicht. Im Gegenteil, durch die gegebenen Vervielfältigungen im Modell wird in das Verwertungsrecht der Rechteinhaber eingegriffen. Eine andere, mutmaßlich technik- und innovationsfreundliche Auslegung, die ebenfalls Vervielfältigungen im Modell von der Schranke als gedeckt ansehen wollte, verbietet sich angesichts des klaren Wortlauts der Bestimmung. Auch eine analoge Anwendung kommt nicht in Betracht.
Mangels Vorliegens eines Hauptwerks stellen die Vervielfältigungen der streitgegenständlichen Liedtexte kein unzulässiges Beiwerk nach § 57 UrhG dar. Die Liedtexte sind nicht neben dem gesamten Trainingsdatensatz als nebensächlich und verzichtbar anzusehen. Der Eingriff der Beklagten in die Verwertungsrechte der Klägerin ist auch nicht durch eine Einwilligung der Rechteinhaber gerechtfertigt. Auch durch Wiedergabe der Liedtexte in den Outputs des Chatbots haben die Beklagten unberechtigt die streitgegenständlichen Liedtexte vervielfältigt und öffentlich zugänglich gemacht. In den Outputs sind die originellen Elemente der Liedtexte stets wiedererkennbar. Hierfür sind die Beklagten und nicht die Nutzer verantwortlich. Die Outputs sind durch einfach gehaltene Prompts generiert worden. Die Beklagten betreiben die Sprachmodelle, für die die Liedtexte als Trainingsdaten ausgewählt und mit denen sie trainiert worden sind. Sie sind für die Architektur der Modelle und die Memorisierung der Trainingsdaten verantwortlich. Damit haben die von den Beklagten betriebenen Sprachmodelle die ausgegebenen Outputs maßgeblich beeinflusst, der konkrete Inhalt der Outputs wird von den Sprachmodellen generiert. Der Eingriff in die Verwertungsrechte durch die Outputs ist ebenfalls nicht durch eine Schrankenbestimmung gedeckt.
Mehr zum Thema:
Aufsatz
Fair Use – ein Ass im Ärmel der US-Techkonzerne?
Niko Härting / Carl Nowak, CR 2025, 675
CR0083920
Aufsatz
Online-Dossier: AI Regulation & KI-Verordnung
Online-Redaktion, IT-Recht Blog 2025
ITBLOG0007619
Beratermodul IT-Recht
Otto Schmidt Answers ist in diesem Modul mit 5 Prompts am Tag enthalten! Nutzen Sie die Inhalte in diesem Modul direkt mit der KI von Otto Schmidt. Hier das informative Rezensions- und Anwendungsvideo von RA Michael Rohrlich und Marc Oliver Thoma ansehen! Bearbeiten Sie zahlreiche bewährte Formulare mit LAWLIFT! 4 Wochen gratis nutzen!




