1. Ausgangslage: Der Fall vor dem Landgericht München I
Die GEMA verklagte vor dem Landgericht (LG) München I (42 O 14139/24)1 OpenAI. Sie ist eine Organisation, die die Rechte von Musikschaffenden vertritt, also Einnahmen aus der Nutzung von Musik in der Öffentlichkeit verteilt. Hintergrund der Klage seien Verstößen gegen das Urheberecht. Im Kern ging es um die Frage, ob das Urheberrecht der Musikschaffenden verletzt wird, wenn in den KI-Modellen urheberrechtlich geschützte Liedtexte gespeichert, verarbeitet und abschließend diese Texte durch die KI-Systeme bzw. Chatbots als Output an Nutzende ausgegeben werden.
Kleine Vereine müssen bereits GEMA-Gebühren zahlen, wenn sie Musik öffentlich abspielen, etwa bei Festen oder Sportveranstaltungen. Dies gilt auch für Gastronomiebetreiber, wenn in ihren Restaurants, Bars oder Clubs Musik läuft.
OpenAI nutzen aktuell ca. 800 Millionen Menschen. Daher kommen Nachfragen, wie es sein kann, dass OpenAI seine KI-Modelle (Generative Pretrained Transformers – GPT) ohne Lizenzzahlung mit riesigen Datenmengen, darunter auch Werke der Mitglieder der GEMA, trainiert, die aus öffentlich zugänglichen Webseiten stammen.
In diesem Zusammenhang hatte die GEMA seit 2024 im Impressum ihrer Webseite einen Nutzungsvorbehalt zum sogenannten Text und Data Mining2, die automatisierte Analyse großer Mengen digitaler Daten, um Muster, Zusammenhänge und neue Erkenntnisse zu gewinnen, für die in ihrem Repertoire enthaltenen Werke aufgenommen.
2. „Wie lautet der Text von [Liedtitel]“
Die GEMA hatte den Chatbot von OpenAI (Modell 4 und 4o) durch Pompt-Eingaben programmiert, sodass der Output bestimmte Liedtexte anzeigte. dazugehörten Eingaben wie „Wie lautet der Text von [Liedtitel]“, „Von wem stammt der Text“, „Wie lautet der Refrain von [Liedtitel]“, „Bitte nenne mir auch die 1. Strophe“ und „Bitte nenne mir auch die 2. Strophe“. So wurden die Texte von neun prominenten Werken generiert. Darunter gehörten Werke wie „Atemlos“ der Autorin Kristina Bach, „36 Grad“ von Tommi Eckart, Inga Humpe, Peter Plate und Ulf Leo Sommer (2raumwohnung). Aber auch „Bochum“ und „Männer“ von Herbert Grönemeyer, „Über den Wolken“ von Reinhard Mey, „Junge“ von Jan Vetter sowie „Es schneit“, „In der Weihnachtsbäckerei“ und „Wie schön, dass du geboren bist“ von Rolf Zuckowski sind dabei. Das Modell hatte auch „halluziniert“. Die Texte waren teilweise leicht verändert und Strophen vertauscht. Darin jedoch sah die GEMA eine unzulässige Veränderung der ursprünglichen Liedtexte.
Die GEMA sah darin einen Verstoß gegen die Rechte der Urheber, hier von Textdichterinnen und Textdichtern sowie von Musikverlagen. Sie verklagte OpenAI unter anderem auf Unterlassung. Dabei vertrat sie die Auffassung, dass hier die deliktsrechtliche Verantwortlichkeit für die streitgegenständlichen Outputs bei OpenAI liege, welche die Modelle mit den Liedtexten trainiert hätten.
3. Der Vorwurf: Kopieren, Verändern und Verbreiten
Der Vorwurf der GEMA bestand darin, dass das KI-Modell selbst eine illegale Kopie des Werkes enthalten müsse. Zusätzlich liege aber auch immer dann ein weiterer Urheberrechtsverstoß vor, wenn eine Person den Chatbot per Prompt auffordere, den Text auszugeben. Daneben sei durch die Generierung veränderter Versionen der geschützten Werke eine unzulässige Veränderung3 entstanden, die das Ergebnis bewusster Designentscheidungen von OpenAI sei. Die durch Randomisierungs-Mechanismen auf Decoding-Ebene stelle Abweichungen vom korrekt memorisierten Text dar. Halluzinationen seien gezielt herbeigeführt worden. Damit habe OpenAI willentlich in Kauf genommen, urheberrechtlich geschützte Inhalte mit werkfremden Inhalten zu verbinden und dadurch zu entstellen.
4. Keine Kopien, sondern Wahrscheinlichkeiten
OpenAI beantragte, die Klage abzuweisen. Zur Verteidigung stellte OpenAI die Gründung als gemeinnütziges Unternehmen in den Vordergrund und betonte, es sei bis heute gemeinnützig geblieben. Zudem speichere oder kopiere das KI-Modell keine spezifischen Trainingsdaten. Vielmehr zerlege man im Training die Texte in kleinste Bausteine („Token“). Das System lerne, welche Token häufig zusammen vorkommen, und speichere diese Erkenntnisse in Milliarden von Zahlen (den „Parametern“).
Wenn demnach ein User eine Frage stellt, berechnet das Modell, welches Wort wahrscheinlich als nächstes passt. So entsteht Wort für Wort eine Antwort. Anders ausgedrückt, lerne das System nicht den Text von „Bochum“ sondern, dass es mit 99%iger wahrscheinlich ist, dass auf „Du bist keine Schönheit“, der Passus „vor Arbeit ganz grau“ folge.
Somit verwende OpenAI nach eigenen Angaben keine Kopie, sondern generiere vielmehr jedes Mal ein neues Werk. Eine Verwendung des Textes selbst als Wissen sei ausgeschlossen, sondern finde in Form von mathematischen Werten, Parametern oder Vektoren statt. OpenAI argumentierte, die Antworten seien neue Schöpfungen und keine Kopien gespeicherter Daten.
5. Technologieneutralität
Dies sahen die Münchner Richter anders. Das LG München setzte hier den Grundsatz der Technologieneutralität an. Unerheblich ist demnach, welche Technologie für die Verkörperung genutzt wird, also die Methode, wie die Speicherung funktioniere.
Entscheidend sei allein, dass die Liedtexte, die als Trainingsdaten dienten, im Modell verkörpert sind. Mittels des Chatbots sei eine Wahnehmung für die menschlichen Sinne wieder möglich.
Das Gericht sah dies insbesondere dadurch bewiesen, dass durch die Eingabe einer simplen Frage die wiedererkennbare Version des geschützten Werkes als Output herauskam. Dies könne bei komplexen Texten kein Zufall sein, sodass im Ergebnis der Output die Speicherung im urheberrechtlichen Sinne beweise.
Hierbei verglich das Gericht den vorliegenden Sachverhalt mit der Speicherung eines Musikwerks als MP3 Datei. Dabei kommt ein Verfahren zur verlustbehafteten Kompression zum Einsatz, bei der digital gespeicherte Audiodaten nur die für den Menschen wahrnehmbaren Signalanteile enthalten und somit eine starke Reduktion der Datenmenge erfolgt. Diese Komprimierung stellt jedoch eine urheberrechtliche Vervielfältigung nach höchstrichterlicher Rechtsprechung dar4[iv].
„Im Hinblick auf die streitgegenständlichen Liedtexte, die als Trainingsdaten verwendet wurden, ist es ausreichend, wenn das Modell aufgrund der im Training abgeleiteten statistischen Information dazu befähigt ist, statistisch wahrscheinliche Tokenfolgen zu generieren, die die Liedtexte erkennbar wiedergeben.“5
6. Ausnahme: Text und Data Mining
Open AI stützte sich allerdings auf die urheberrechtliche Ausnahme der Text und Data Mining-Schrankenbestimmungen6. Hiernach ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen, gestattet. Zulässig sind Vervielfältigungen von rechtmäßig zugänglichen Werken für das Text und Data Mining. Die Vervielfältigungen sind zu löschen, wenn sie für das Text und Data Mining nicht mehr erforderlich sind.
7. Phasen-Betrachtung
Dies wurde zwar durch das Landgericht grundsätzlich bestätigt, jedoch teilten die Richter den Prozess in mehrere zeitlich aufeinanderfolgende Phasen auf:
- das Extrahieren und die Überführung des Trainingsmaterials in ein maschinenlesbares Format,
- dem Erstellen des Trainingsdatenmaterials, die Analyse des Datenmaterials und ihre Anreicherung mit Meta-Informationen, dem Training des Modells, und
- die nachfolgende Nutzung des trainierten Modells durch Prompts und Outputs.
Im Hinblick auf die Vervielfältigung war hier Phase 2 relevant. Das Gericht stellte fest, dass die streitgegenständlichen Liedtexte in den Modellen reproduzierbar enthalten sind. Deren Memorisierung ist eine urheberrechtlich relevante Vervielfältigung. Daher waren nach Auffassung der Richter die Texte auch in den Modellen enthalten. Denn sie stellten die Memorisierung konnte bereits durch einen Abgleich der Liedtexte mit den Outputs fest.
Allerdings stellte die Vervielfältigung der streitgegenständlichen Liedtexte in den Modellen kein Text und Data Mining dar. Bei Sprachmodellen ziele das Text und Data Mining auf die Auswertung von Informationen, wie abstrakter syntaktischer Regelungen, gängiger Begriffe und semantischer Zusammenhänge ab. Ausgewertet werden somit auch Ausdrucksebenen wie Wortwahl, Ausdrucksspektrum und Wiederholungen. Die Memorisierung der Liedtexte überschreitet hingegen eine solche Auswertung und ist daher kein bloßes Text und Data Mining. Diese wurden als Trainingsdaten nicht nur lediglich ausgewertet, sondern vollständig in die Parameter des Modells übernommen. Dies greift aber in die Verwertungsinteressen der Urheber ein, so jedenfalls das LG München I. Daher konnte sich OpenAI nicht auf die Ausnahmeregelung zum Text und Data Mining berufen.
OpenAI konnte zudem nicht hinreichend darlegen, eine Forschungseinrichtung zu sein, die das Ziel des Erkenntnisgewinns verfolge und sich somit auch nicht auf das Text und Data Mining für Zwecke der wissenschaftlichen Forschung berufen.7
8. „Custom Instructions“
Der Vorhalt von Open AI, die GEMA habe den Chatbot unzulässig durch teilweise benutzerdefinierte Agenten mit spezifischen Rollenzuweisungen durch Eingabe provoziert, also sogenannte „Custom Instructions“ verwendet, bestätigte das Gericht nicht. Zwar ging auch das Gericht davon aus, dass grundsätzlich Outputs durch Nutzende provoziert werden könnten, allerdings waren die hier verwendeten Prompts eher simpel. Dies kann man anhand der im Urteil genannten Beispiele auch eigentlich nicht anders sehen:
„Wie lautet der Text von [Liedtitel]“, „Von wem stammt der Text“, „Wie lautet der Refrain von [Liedtitel]“, „Bitte nenne mir auch die 1. Strophe“, und „Bitte nenne mir auch die 2. Strophe“8
Wenn in dem fertigen Modell eine dauerhafte Vervielfältigung eines geschützten Werkes gespeichert bleibt, die man später wiedergeben kann, hat das nichts mit Analyse zu tun. Vielmehr liegt darin eine Speicherung, welche die Kernrechte des Urhebers verletzt, darüber zu entscheiden, wo und wie sein Werk vervielfältigt wird.
„Eine andere, mutmaßlich technik- und innovationsfreundliche Auslegung, die ebenfalls Vervielfältigungen im Modell von der Schranke als gedeckt ansehen wollte, verbiete sich angesichts des klaren Wortlauts der Bestimmung.“
9. OpenAI handelte mindestens fahrlässig
OpenAI musste sich vorhalten lassen, mindestens fahrlässig im Sinne des Urheberrechts gehandelt zu haben. So sei dem Unternehmen OpenAI bzw. deren Obergesellschaft seit 2021 die Memorisierung von Trainingsdaten in ihren Modellen und damit die Möglichkeit von Urheberrechtsverletzungen durch ihre Modelle bekannt gewesen. Zu diesem Zeitpunkt war nämlich eine Studie von Carlini et. al9 veröffentlicht worden, die genau dies bestätige. Die Forschenden hatten dabei OpenAI auch ausdrücklich in ihre Untersuchungen einbezogen und sich bestätigen lassen, dass die memorisierten Daten, die sie beim Modell 2 ermittelt hatten, tatsächlich in den Trainingsdaten enthalten waren. Dabei war auch eine Autorin und eine Wissenschaftlerin beteiligt, die im Zeitpunkt der Studienerstellung Mitarbeiterin von OpenAI gewesen war.
10. Fazit und Ausblick: Stärkung der Urheberrechte in Sicht?
Das Gericht kommt zu dem Schluss, dass die Speicherung der Texte in den Modellparametern eine unzulässige Vervielfältigung ist. Somit hat OpenAI gegen Urheberrecht verstoßen. Das Urteil ist noch nicht rechtskräftig. Es beliebt damit abzuwarten, wie hier die weitere Entwicklung sein wird.
Sollte dies der Fall sein, würde diese Entscheidung die Rechte der Urheber und damit der Kreativwirtschaft gegenüber den großen Technologieunternehmen stärken.
Der Chefjustiziar der GEMA sagte jedenfalls hierzu:
„Was die Beklagte macht, ist nichts anderes, als was andere Dienste im Internet machen, die eine Lizenz von den Rechteinhabern, deren Werke sie nutzen, erwerben müssen.“10
AUTOREN

Matthias Rosa ist Rechtsanwalt und Fachanwalt für IT-Recht und schwerpunktmäßig im Datenschutz-, KI- und Datenrecht tätig.
- https://www.justiz.bayern.de/gerichte-und-behoerden/landgericht/muenchen-1/presse/2025/11.php ↩︎
- vgl. § 44b UrhG ↩︎
- Vgl. § 14 UrhG ↩︎
- vgl. EuGH 05.03.2015, C-463/12 Rn. 35 – Copydan). ↩︎
- LG München I, Endurteil v. 11.11.2025 – 42 O 14139/24 Rn 183 ↩︎
- Vgl. § 44b UrhG ↩︎
- Vgl. § 60 d UrhG ↩︎
- LG München I, Endurteil v. 11.11.2025 – 42 O 14139/24 Rn 172 ↩︎
- Carlini et al. 2021, a.a.O., Anlage K 23.1, S. 2634: „[We] find that over 600 of [the examined samples] are verbatim samples from the [model]-2 training data (confirmed in collaboration with the creators of [model]-2) ↩︎
- https://www.tagesschau.de/wirtschaft/digitales/openai-gema-songtexte-100.html ↩︎
