Sammelklage gegen Adobe wegen Urheberrechtsverletzung und KI-Training

  • Die Autoren werfen Adobe vor, urheberrechtlich geschützte Bücher zum Trainieren seines SlimLM-Modells verwendet zu haben.
  • Die Sammelklage konzentriert sich auf die Datensätze SlimPajama-627B, RedPajama und Books3.
  • Der Fall könnte wichtige Präzedenzfälle zum Urheberrecht und zum KI-Training in den USA und Europa schaffen.
  • Die Kontroverse stellt das Datenmodell der generativen KI und Adobes Versprechen einer „verantwortungsvollen KI“ in Frage.

Sammelklage gegen Adobe wegen Urheberrechtsverletzung und KI-Training

Der Rechtsstreit um Training von Modellen künstlicher Intelligenz mit urheberrechtlich geschützten Werken Ein neues Kapitel wurde aufgeschlagen, und Adobe steht im Zentrum des Sturms. Das Unternehmen, das traditionell mit dem Kreativsektor verbunden ist, sieht sich nun einer großen Herausforderung gegenüber. Sammelklage was grundsätzlich die Frage aufwirft, wie das Unternehmen an einige der Daten gelangte, die zum Training einer seiner KIs verwendet wurden.

Im Mittelpunkt der Klage steht SlimLM, eine Familie von leichtgewichtigen Sprachmodellen, die für Aufgaben der Dokumentenunterstützung entwickelt wurden, insbesondere in HandyIn der Beschwerde wird behauptet, dass folgende Mittel zum Trainieren dieses Systems verwendet wurden: Raubkopien von Büchern und anderen urheberrechtlich geschützten Werken ohne die Zustimmung der Urheber, was nicht nur für Adobe, sondern für die gesamte generative KI-Branche, auch in Europa und Spanien, eine heikle Angelegenheit darstellt, wo die Debatte über die legitime Verwendung von Daten für KI immer hitziger wird.

Kontext der Sammelklage und Ursprung des Konflikts

Rechtlicher Kontext der Sammelklage gegen Adobe

El Dezember 17 2025Adobe wurde über Folgendes informiert: vorgeschlagene kollektive Maßnahmen vor einem Bundesgericht im nördlichen Bezirk von Kalifornien. Die Klage wurde von dem Autor aus Oregon eingereicht. Elizabeth Lyonwirft dem Unternehmen vor, ausgenutzt zu haben Raubkopien von Büchern —darunter auch einige seiner eigenen Werke— um das Vortraining seiner KI-Modelle zu unterstützen.

In der Klage wird behauptet, dass Adobe ihre Texte als Teil eines verarbeitete Teilmenge Daten, die als Grundlage für SlimLM dienten. Dieses Material bildete einen Teil einer Kette bekannter Datensätze im KI-Ökosystem: Bücher3, integriert in Roter Pyjamaund wiederum in den Datensatz integriert SlimPajama-627B, wurde verwendet, um das Adobe-Modell vorzutrainieren. Laut den Klägern wurden dabei angeblich Tausende urheberrechtlich geschützter Werke ohne Genehmigung, Nennung des Urhebers oder Entschädigung verwendet.

Lyon behauptet, zu handeln im Namen anderer Autoren und Rechteinhaber die sich in einer ähnlichen Situation wiederfinden würden, was den Fall zu einem potenziell weitreichende SammelklageObwohl noch keine konkrete Summe veröffentlicht wurde, zielt die Klage auf eine erhebliche finanzielle Entschädigung, Schadensersatz und sonstige Kosten sowie die Übernahme der Anwaltskosten und eine ausdrückliche Erklärung von Adobe ab, dass es sich um eine vorsätzliche Urheberrechtsverletzung handelt.

Das Unternehmen seinerseits argumentierte, dass SlimLM wurde mit SlimPajama-627B trainiert., beschrieben als ein Open-Source-Datensatz, der von der Firma Cerebras im Juni 2023 veröffentlicht wurde und sich aus Daten zusammensetzt, die angeblich von mehrere offene und deduplizierte KorporaDer Kern des Rechtsstreits liegt genau in der Frage, ob dieser „offene“ Charakter ausreicht, um die Verwendung urheberrechtlich geschützter Werke zu legitimieren, die ohne die Zustimmung ihrer Urheber in den Datensatz gelangt wären.

Der Prozess befindet sich derzeit noch in der Anfangsphase. Adobe hat es vermieden, sich öffentlich detailliert zu äußern, und Medien wie Reuters haben festgestellt, dass das Unternehmen auf bestimmte Anfragen nach einer Stellungnahme nicht reagiert hat. Lyon hat jedoch betont, dass es entschlossen, die Sache entschieden voranzubringen und dass sie über die Ressourcen verfügt, die Sache bis zum Ende durchzuziehen, was auf einen langwierigen und öffentlichkeitswirksamen Rechtsstreit hindeutet.

Wie SlimLM in Adobes KI-Strategie passt

Adobes SlimLM-Modell und KI-Training

Eines der Elemente, das diesen Fall besonders bemerkenswert macht, ist, dass das fragliche Modell nicht FireflyAdobes bekannteste Kreativ-Suite für die breite Öffentlichkeit, aber SlimLMein wesentlich diskreteres System, das auf Aufgaben wie Unterstützung bei Dokumenten und Supportfunktionen im Hintergrund. Das heißt, wir sprechen nicht von KI, die spektakuläre Bilder für Werbekampagnen generiert, sondern von Modellen, die im Hintergrund von Anwendungen bei der Verarbeitung, Zusammenfassung oder Verwaltung von Texten helfen.

Bislang stützte sich Adobes KI-Strategie stark auf Firefly als Beispiel für „verantwortungsvolle KI“, ausgebildet – laut Angaben des Unternehmens selbst – mit lizenzierte Inhalte (wie beispielsweise Adobe Stock), gemeinfreies Material und andere Ressourcen, an denen das Unternehmen eindeutige Rechte beansprucht. Darüber hinaus hat das Unternehmen Folgendes gefördert: Vergütungsprogramme für Adobe Stock-Mitwirkende, mit dem Ziel, sein Image als Verbündeter von Fotografen, Illustratoren und Content-Erstellern zu stärken.

Die Klage konzentriert sich jedoch nicht auf diesen öffentlichkeitswirksamen Aspekt. Im Mittelpunkt stehen SlimLM und die Herkunft der für das Vortraining verwendeten Datengenau in einem Bereich, der für den Endnutzer weniger sichtbar ist. Dieser Unterschied ist wichtig, weil er zeigt, dass sich die Debatte über die Nutzung urheberrechtlich geschützter Werke nicht auf Werkzeuge beschränkt, die spektakuläre Bilder oder kreative Texte erzeugen, sondern auch Auch leisere Supportmodelle sind betroffen.in Alltagsprodukte integriert.

Laut der vorgelegten Dokumentation wäre SlimLM von SlimPajama-627B, eine Variante eines größeren Datensatzes, Roter Pyjama, sehr beliebt in der KI-Community. Dies wiederum integriert Bücher3eine Sammlung von etwa 191.000 Pfund die in Urheberrechtsstreitigkeiten wiederholt angeführt wurde. In der Klage wird argumentiert, dass, wenn SlimPajama direkt von RedPajama abgeleitet ist und RedPajama Books3 enthält, dann Die Werke von Lyon und anderen Autoren wären während der Vorbereitungsphase kopiert und bearbeitet worden. ohne klare Rechtsgrundlage.

Für Adobe kommt das Problem zu einem heiklen Zeitpunkt, mitten in der Expansion des Unternehmens. Generative KI und Assistenzwerkzeuge Integriert in sein Ökosystem aus Kreativ- und Büroprodukten. Das Image des Unternehmens als Beschützer von Kreativen, das es sorgsam gepflegt hat, um sich von anderen Tech-Giganten abzugrenzen, wird daher besonders intensiv geprüft, auch von Kreativprofis in Spanien und Europa, die täglich mit Programmen wie Photoshop, Illustrator, Acrobat oder Premiere arbeiten.

Die Rolle der Datensätze Books3, RedPajama und SlimPajama

Um zu verstehen, warum diese Forderung weit über einen Einzelfall hinausgeht, lohnt es sich, einen Moment innezuhalten und zu überlegen, wie aktuelle KI-Modelle trainiert werden. Große Sprachmodelle und viele generative KIs lernen aus riesigen Textmengen.Webseiten, Artikel, Bücher, Code, technische Dokumentationen usw. Je vielfältiger und umfangreicher dieses Korpus ist, desto besser funktionieren in der Regel die Modelle, vorausgesetzt, die Datenverarbeitung und das Systemdesign sind auf dem neuesten Stand.

In diesem Zusammenhang sind Datensätze wie beispielsweise Bücher3, eine riesige Sammlung von Büchern, deren Herkunft seit langem Misstrauen hervorgerufen hat, und Roter Pyjama, ein Projekt, das darauf abzielt, Datensätze im Stil großer Labore zu reproduzieren, die zum Trainieren ihrer Modelle verwendet werden. SlimPajama-627B Es handele sich um eine deduplizierte und verfeinerte Variante dieses Materials, das Cerebras der Community im Jahr 2023 als offenen Datensatz zur Verfügung gestellt hat.

Laut der Klage gegen Adobe wurde SlimPajama angeblich entwickelt „Kopieren und Manipulieren“ RedPajama, einschließlich der Rubrik Books3. Diese Einbindung ist es, die theoretisch Folgendes bewirkt: Tausende urheberrechtlich geschützte Werke Die Anklage argumentiert, dass selbst wenn Adobe die Bücher nicht direkt zusammengestellt hätte, die Tatsache, dass es sich auf einen Datensatz stützte, der diese Bücher enthielt, dennoch Betrug darstellt. erneut herunterladen, kopieren und verarbeiten Material, das in der Vorverarbeitungs- und Vortrainingsphase geschützt ist.

Die Kontroverse ist nicht neu: beide Books3 als RedPajama Sie wurden bereits in anderen Klagen gegen Technologieunternehmen angeführt, darunter Fälle, in denen Unternehmen wie Apple und Salesforce beschuldigt wurden, diese Daten zur Schulung ihrer internen Modelle verwendet zu haben. Allen diesen Streitigkeiten liegt dieselbe Frage zugrunde: Kann die Wiederverwendung von „offenen“ Datensätzen, die urheberrechtlich geschützte Werke enthalten, als legitim gelten? ohne zuvor die Erlaubnis aller beteiligten Autoren eingeholt zu haben?

Die Gerichtsverfahren gegen Adobe tragen somit zu einem vereinzelt Rechtsstreitigkeiten Dies zwingt die Branche, ihre Praktiken zu überprüfen. In der Praxis erhöht jeder neue Fall den Druck, Mechanismen zu schaffen für DatenrückverfolgbarkeitKlare Opt-out-Systeme für Urheber und spezifische Lizenzmodelle für das KI-Training, etwas, das in Europa auch durch die EU-KI-Verordnung und die bestehenden Urheberrechtsbestimmungen.

Eine juristische Front, die bereits die gesamte KI-Branche beeinträchtigt.

Die Klage gegen Adobe steht nicht im luftleeren Raum. Seit 2023 gibt es … Welle von Urheberrechtsklagen gegen Unternehmen, die generative KI entwickelnDazu gehören Namen wie OpenAI, Stability AI, Meta, Anthropic und Midjourney. Viele dieser Fälle drehen sich um dieselbe Idee: die unerlaubte Nutzung urheberrechtlich geschützter Werke zum Trainieren von Modellen, die Texte, Bilder oder Musik generieren können, die dem Stil der ursprünglichen Urheber mitunter sehr ähnlich sind.

Einer der jüngsten Meilensteine ​​war die Einigung zwischen Anthropic erzielt, die sich bereit erklärten, etwa 1.500 Mio. Mehrere Autoren verurteilten die Verwendung von Raubkopien ihrer Bücher zum Trainieren des Chatbots Claude. Diese viel diskutierte Übereinkunft wurde als mögliche Wendepunkt in der Art und Weise, wie Technologieunternehmen mit solchen Ansprüchen umgehen, und öffnete die Tür für die Erwartung erheblicher Entschädigungen in künftigen Verfahren.

Unterdessen haben US-Medien wie TechCrunch, Reuters, The Verge und die New York Times darüber berichtet. zusammenhängende Fälle Diese Probleme betreffen nahezu alle wichtigen Akteure im Bereich der KI. Das Muster wiederholt sich tendenziell: riesige Datensätze, die von Webseiten über Code-Repositories bis hin zu ganzen Büchern alles umfassen; ein Mangel an klaren Einwilligungsmechanismen; und immer leistungsfähigere Modelle, die dieses Material nutzen, um ausgefeilte Antworten, Zusammenfassungen und Analysen zu liefern oder kreative Inhalte zu generieren.

Der Fall Adobe fügt eine relevante Nuance hinzu: Das Unternehmen hatte einen Teil seiner kommerziellen Erzählung auf der Idee aufgebaut, sich von den übrigen abzugrenzen Der Schutz von Kreativen ist daher ein wichtiger Aspekt. Aus diesem Grund sorgt der Verdacht, dass eines der Modelle auf Raubkopien basieren könnte, in der Kreativbranche für Aufsehen, auch in Ländern wie Spanien, wo… Schriftsteller, Übersetzer, Journalisten und Verleger Sie beobachten mit einiger Besorgnis, wie ihre Kataloge direkt oder indirekt in Trainingsdatensätzen landen können.

Auch außerhalb der Vereinigten Staaten werden Gerichtsentscheidungen in diesen Angelegenheiten in Europa genau beobachtet werden. US-Rechtsprechung zur fairen Nutzung Das Kopieren für transformative Zwecke entspricht nicht ganz dem europäischen Rechtsrahmen, der Rechteinhaber stärker schützt. Dennoch könnten die anstehenden Urteile Einfluss darauf haben, wie europäische Richter Fragen wie die massenhafte Nutzung von Daten zu Schulungszwecken oder die Notwendigkeit einer spezifischen Vergütung für Urheber auslegen.

Mögliche Auswirkungen in Europa und für Kreative in Spanien

Obwohl die Klage gegen Adobe vor einem US-Gericht eingereicht wurde, könnten ihre Auswirkungen auf beiden Seiten des Atlantiks spürbar sein. Große Technologieunternehmen operieren mit globale Modelle und ihre Art der Datenverwaltung beschränkt sich selten auf eine einzige Gerichtsbarkeit. Sollten US-Gerichte letztendlich feststellen, dass die Nutzung bestimmter Datensätze das Urheberrecht verletzt, ist es wahrscheinlich, dass dieselben Modelle oder Praktiken sollten überprüft werden. auch in Europa.

Im konkreten Fall von Adobe werden viele seiner KI-basierten Tools bereits umfassend eingesetzt in Spanische Designstudios, Werbeagenturen, Verlage und MedienunternehmenDie mögliche Präsenz spanischer Literaturwerke in Datensätzen wie Books3 – ohne Genehmigung – bereitet Autoren und Fachverbänden zunehmend Sorgen. Sollte sich bestätigen, dass in Spanien registrierte Bücher zum Trainieren von Modellen verwendet wurden, könnten neue Probleme entstehen. Beschwerdekanäle für Einzelpersonen oder Gruppen auch in europäischen Rechtsordnungen.

El EU-KI-Verordnung, das Transparenzpflichten für bestimmte Systeme einführt, sowie Gemeinschaftsvorschriften über UrheberrechtDiese Faktoren werden entscheidend dafür sein, welche Praktiken akzeptabel sind. Beispielsweise könnten die Anforderungen an die Dokumentation der verwendeten Datensätze oder an die Bereitstellung klarer Widerspruchsmöglichkeiten für Rechteinhaber verschärft werden, wenn Fälle wie der von Adobe häufiger vorkommen.

Für das europäische Kreativökosystem verstärkt diese Art von Rechtsstreitigkeiten die Wahrnehmung, dass es notwendig ist neue Urlaubs- und Vergütungsformen aushandeln Es geht um KI-Training. Dabei geht es nicht nur darum, unautorisierte Nutzungen zu verhindern, sondern auch darum, Wege zu finden, wie Verlage, Rechteverwaltungsagenturen und Technologieplattformen … Einigung über die Zugangsbedingungen für Kataloge literarische oder visuelle Werke im Austausch gegen angemessene Vergütung.

Aus Innovationssicht wird die Herausforderung darin bestehen Die Entwicklung leistungsstarker Modelle mit echtem Respekt vor geistigem Eigentum in Einklang bringenIn Spanien, wo die Verlagsbranche sowie der audiovisuelle Sektor und die Werbebranche ein erhebliches Gewicht haben, wird der Ausgang des Rechtsstreits gegen Adobe sehr genau verfolgt werden, sowohl von Unternehmen, die bereits KI einsetzen, als auch von Anwaltskanzleien, die auf digitales Recht und geistiges Eigentum spezialisiert sind.

Lehren für Startups und Technologieunternehmen, die KI nutzen

Der Fall Adobe sendet eine direkte Botschaft an Ökosystem von Technologie-StartupsSowohl in Amerika als auch in Europa spielt die Herkunft von Daten eine entscheidende Rolle. Obwohl viele junge Unternehmen keine eigenen großen Sprachmodelle entwickeln, greifen sie häufig auf … zurück. offene Datensätze, APIs von Drittanbietern und vortrainierte Modelle die möglicherweise unwissentlich dieselben rechtlichen Probleme haben, die jetzt vor Gericht verhandelt werden.

Die erste Lektion ist die Notwendigkeit Datenquellen sorgfältig prüfenDie bloße Kennzeichnung eines Datensatzes als „offen“ oder dessen Bereitstellung in einem öffentlichen Repository garantiert nicht automatisch dessen Urheberrechtssicherheit. Überprüfen Sie die Dokumentation, identifizieren Sie alle urheberrechtlich geschützten Komponenten und wenden Sie sich im Zweifelsfall an die zuständige Stelle. Suchen Sie nach umweltfreundlicheren Alternativen oder verhandeln Sie spezielle Lizenzen. Dadurch können spätere, schwerwiegende Probleme vermieden werden.

Das zweite hat damit zu tun Einhaltung internationaler VorschriftenStartups mit Sitz in Spanien oder Lateinamerika, die Nutzer in Europa oder den Vereinigten Staaten erreichen möchten, sollten bedenken, dass sie möglicherweise bestimmten Bestimmungen unterliegen. mehrere Gerichtsbarkeiten gleichzeitigDies erfordert die Entwicklung klarer Richtlinien von Anfang an hinsichtlich Datenerfassung, Speicherung, Einwilligung und Reaktion auf Löschungsanträge oder Urheberrechtsansprüche.

Drittens eröffnet es fruchtbaren Boden für neue Geschäftsmodelle Der Fokus liegt auf verantwortungsvollem Datenmanagement. Rückverfolgbarkeitstools für Datensätze, Dienste zur Überprüfung von Berechtigungen, Plattformen zur Lizenzierung von Kulturkatalogen oder Lösungen, die es Rechteinhabern ermöglichen, die Nutzung ihrer Werke in KI-Systemen zu überwachen, können sich zu solchen entwickeln. sehr wertvolle Produkte in den nächsten Jahren.

Abschließend sollte man nicht vergessen, dass Ruf Sie ist zu einem ebenso wichtigen Gut geworden wie die Technologie selbst. Für jedes Unternehmen, das KI entwickelt oder integriert, kann es problematisch sein, in einen Konflikt über den Missbrauch urheberrechtlich geschützter Inhalte verwickelt zu werden. um Misstrauen bei Kunden, Partnern und Nutzern zu erzeugenDer Aufbau einer Kultur des Respekts vor geistigem Eigentum ist nicht nur eine rechtliche Angelegenheit, sondern auch ein kluger Weg, sich in einem Markt zu differenzieren, der zunehmend mit Versprechen von „ethischer KI“ oder „verantwortungsvoller KI“ überschwemmt wird.

Mögliche Szenarien und was als Nächstes passieren könnte

Wie bei vielen Klagen dieser Art eröffnet auch der Fall gegen Adobe eine Reihe von Möglichkeiten. rechtliche SzenarienDas Gericht könnte die Sammelklage vollumfänglich zulassen, ihren Umfang beschränken, sie bei mangels Begründung abweisen oder, wie es in anderen Verfahren geschehen ist, den Streit durch ein anderes Verfahren beilegen. außergerichtliche Einigung Dies umfasst finanzielle Entschädigungen und Verpflichtungen seitens des Unternehmens zur Änderung seiner Geschäftspraktiken.

Für Adobe liegt der größte Einfluss, abgesehen von den wirtschaftlichen Kosten, möglicherweise in der Notwendigkeit, Überprüfen Sie gründlich ihre DatenlieferkettenDies würde die Prüfung beinhalten, welche Datensätze in den einzelnen Modellen verwendet wurden, welcher Teil des Trainings auf proprietären Daten basiert, welche Lizenzen diese Nutzungen abdecken und wie all dies transparent gegenüber Kunden und Aufsichtsbehörden kommuniziert werden kann.

Die Technologiebranche befindet sich generell an einem Scheideweg. Angesichts zunehmender Urheberrechtsklagen und verschärfter Regulierungen – insbesondere in der Europäischen Union – erscheint es immer weniger tragfähig, die KI-Entwicklung auf … zu gründen. massives Internet-Scraping und zweifelhafte Sammlungen von Büchern oder BildernStattdessen die Idee von Modellen, die mit Aufbereitete Daten, mit klaren Berechtigungen und in vielen Fällen begleitet von Entschädigungsvereinbarungen.

In diesem sich wandelnden Umfeld dient der Fall Adobe als Spiegelbild sowohl für große Technologiekonzerne als auch für kleinere Unternehmen, die KI ohne rechtliche Fallstricke nutzen möchten. Die Entscheidung des Gerichts in dieser Angelegenheit wird von entscheidender Bedeutung sein. die Sammelklage wegen Urheberrecht und KI-Training Dies wird sich nicht nur auf ein bestimmtes Modell wie SlimLM auswirken, sondern könnte die Art und Weise, wie der Zugang zu kreativen Daten im Zeitalter der künstlichen Intelligenz konzipiert wird, grundlegend verändern.

So veröffentlichen Sie ein Buch
Verwandte Artikel:
So veröffentlichen Sie ein Buch