• Aktuellste News
  • Gerade im Trend...
KI-Training mit Nutzerdaten 2025: Opt-out, Text- und Data-Mining, DSGVO & AI Act

KI-Training mit Nutzerdaten 2025: Opt-out, Text- und Data-Mining, DSGVO & AI Act

30. Juli 2025
Epic Games‘ Sieg im Kartellrechtsstreit gegen Google Play Store: Ein Wendepunkt für die App-Ökonomie?

EuGH zu Spielgold und In-Game-Assets

27. März 2026
Ein Bleistift im Influencer-Stil.

Kommentarspalten als Haftungsfalle: Welche rechtlichen Risiken Influencer bei Pornospam, Scam und strafbaren Inhalten eingehen

23. März 2026
Achtung vor Fake-Streamingangeboten

Christian Ulmen, KI-Deepfakes und „digitale Vergewaltigung“

21. März 2026
Wegweisendes Urteil zu KI-Trainingsdaten - LG Hamburg setzt Maßstäbe

Forschungszulage und Erfolgsprovision: Wann Unternehmen sechsstellige Forderungen nicht zahlen müssen

20. März 2026
Was ist bei Gewinnspielen auf Social Media zu beachten?

Gewinnspiele im Marketing: Wann ein Abbruch zulässig ist

10. März 2026
Digitalisierung der Vertragserstellung und Mandantenkommunikation

Vibe Coding in Marketingagenturen – rechtliche Einordnung, Haftung für Bugs und Anforderungen an eine belastbare Vertragsgestaltung

9. März 2026
BGH hält Uber Black für wettbewerbswidrig

Fernunterricht, Coaching und synchrone Online-Formate

2. März 2026

Manipulierte QR-Codes und Quishing

27. Februar 2026
KI-Agenten als autonome Vertragspartner?

KI-Agenten als autonome Vertragspartner?

26. Februar 2026
Platform Cooperatives als Finanzierungs- und Geschäftsmodell

AI-Training-Daten als Vermögenswert: Bilanzierung, IP-Strategie und Exit-Faktor

25. Februar 2026
Streaming-Setup, Influencer und Vertragsrecht

Influencer: Wann aus Marketing plötzlich Handelsvertreterrecht wird

18. Februar 2026
Insolvenzverwalter und Zugang zu Finanzamtdaten?

NRW prüft Influencer – und plötzlich gelten ganz normale Regeln?

12. Februar 2026

NRW audits influencers – and suddenly normal rules apply?

12. Februar 2026

Rechtliche Fallstricke bei Revenue-Based Financing für Startups

12. Februar 2026
Streaming-Setup, Influencer und Vertragsrecht

Streaming-Setup, Influencer und Vertragsrecht

9. Februar 2026
Platform Cooperatives als Finanzierungs- und Geschäftsmodell

Platform Cooperatives als Finanzierungs- und Geschäftsmodell

8. Februar 2026
Landgericht Frankfurt a.M weicht Influencer-Rechtsprechung auf

Umsatzsteuer auf Donations, Spenden und „Support“ bei Influencern?

5. Februar 2026
Kammergericht zu Unterlassungspflichten bei Handlungen Dritter

Gerichtsstand im Vertrag: Ein Wort zu viel, ein Wort zu wenig

4. Februar 2026

Jurisdiction in the contract: one word too many, one word too few

4. Februar 2026
Neue Infos zum Status des Medienstaatsvertrages

Kundenhotline und Support im SaaS

2. Februar 2026
  • Mehr als 3 Millionen Wörter Inhalt
  • |
  • info@itmedialaw.com
  • |
  • Tel: 03322 5078053
  • |
  • LinkedIn
  • |
  • Discord
  • |
  • WhatsApp
Kurzberatung
Rechtsanwalt Marian Härtel - ITMediaLaw

Es befinden sich keine Produkte im Warenkorb.

  • en English
  • de Deutsch
  • Informationen
    • Leistungen
      • Betreuung und Beratung von Agenturen
      • Vertragsprüfung- und erstellung
      • Beratung zum Games-Recht
      • Beratung für Influencer und Streamer
      • Beratung im E-Commerce
      • Beratung zu DLT und Blockchain
      • Rechtsberatung im Gesellschaftsrecht
      • Legal Compliance und Gutachten
      • Outsourcing – für Unternehmen oder Kanzleien
      • Buchung als Speaker
    • Schwerpunkte
      • Focus auf Startups
      • Investmentberatung
      • Unternehmensrecht
      • Kryptowährungen, Blockchain und Games
      • KI und SaaS
      • Streamer und Influencer
      • Games- und Esportrecht
      • IT/IP-Recht
      • Kanzlei für GMBH,UG, GbR
      • Kanzlei für IT/IP und Medienrecht
    • Idealer Partner
    • Über Rechtsanwalt Marian Härtel
    • Schnell und flexibel erreichbar
    • Prinzipien als Rechtsanwalt
    • Warum Rechtsanwalt und Unternehmensberater?
    • Der Alltag eines IT-Rechtsanwalts
    • Wie kann ich Mandanten helfen?
    • Testimonials
    • Team: Saskia Härtel – WER BIN ICH?
    • Agile und leane Kanzlei
    • Preisübersicht
    • Sonstiges
      • AGB
      • Datenschutzerklärung
      • Widerrufserklärung
      • Impressum
  • News
    • Glosse / Meinung
    • Recht im Internet
    • Onlinehandel
    • Recht und Computerspiele
    • Recht und Esport
    • Blockchain und Web 3 Recht
    • Datenschutzrecht
    • Urheberrecht
    • Arbeitsrecht
    • Wettbewerbsrecht
    • Gesellschaftsrecht
    • EU-Recht
    • Jugendschutzrecht
    • Steuerrecht
    • Sonstiges
    • Intern
  • Podcast
    • ITMediaLaw Kurz-Podcast
    • ITMediaLaw Podcast
  • Wissen
    • Gesetze
    • Juristische Begriffe
    • Vertragstypen
    • Klauseltypen
    • Finanzierungsformen und Begriffe
    • Juristische Mittel
    • Behörden / Institutionen
    • Gesellschaftsformen
    • Steuerrecht
    • Konzepte
  • Videos
    • Informationsvideos – über Marian Härtel
    • Videos – über mich (Couch)
    • Blogpost – einzelne Videos
    • Videos zu Dienstleistungen
    • Shorts
    • Podcast Format
    • Drittanbietervideos
    • Sonstige Videos
  • Kontaktaufnahme
  • Shop / Downloads / Community
    • Downloads und Dienstleistungen
      • Beratung
      • Seminare
      • E-Books
      • Freebies
      • Vertragsmuster
      • Bundle
    • Profil / Verwaltung
      • Bestellungen
      • Downloads
      • Rechnungsadresse
      • Zahlungsarten
    • Kasse
    • Warenkorb
    • Support
    • FAQ Shop
  • Informationen
    • Leistungen
      • Betreuung und Beratung von Agenturen
      • Vertragsprüfung- und erstellung
      • Beratung zum Games-Recht
      • Beratung für Influencer und Streamer
      • Beratung im E-Commerce
      • Beratung zu DLT und Blockchain
      • Rechtsberatung im Gesellschaftsrecht
      • Legal Compliance und Gutachten
      • Outsourcing – für Unternehmen oder Kanzleien
      • Buchung als Speaker
    • Schwerpunkte
      • Focus auf Startups
      • Investmentberatung
      • Unternehmensrecht
      • Kryptowährungen, Blockchain und Games
      • KI und SaaS
      • Streamer und Influencer
      • Games- und Esportrecht
      • IT/IP-Recht
      • Kanzlei für GMBH,UG, GbR
      • Kanzlei für IT/IP und Medienrecht
    • Idealer Partner
    • Über Rechtsanwalt Marian Härtel
    • Schnell und flexibel erreichbar
    • Prinzipien als Rechtsanwalt
    • Warum Rechtsanwalt und Unternehmensberater?
    • Der Alltag eines IT-Rechtsanwalts
    • Wie kann ich Mandanten helfen?
    • Testimonials
    • Team: Saskia Härtel – WER BIN ICH?
    • Agile und leane Kanzlei
    • Preisübersicht
    • Sonstiges
      • AGB
      • Datenschutzerklärung
      • Widerrufserklärung
      • Impressum
  • News
    • Glosse / Meinung
    • Recht im Internet
    • Onlinehandel
    • Recht und Computerspiele
    • Recht und Esport
    • Blockchain und Web 3 Recht
    • Datenschutzrecht
    • Urheberrecht
    • Arbeitsrecht
    • Wettbewerbsrecht
    • Gesellschaftsrecht
    • EU-Recht
    • Jugendschutzrecht
    • Steuerrecht
    • Sonstiges
    • Intern
  • Podcast
    • ITMediaLaw Kurz-Podcast
    • ITMediaLaw Podcast
  • Wissen
    • Gesetze
    • Juristische Begriffe
    • Vertragstypen
    • Klauseltypen
    • Finanzierungsformen und Begriffe
    • Juristische Mittel
    • Behörden / Institutionen
    • Gesellschaftsformen
    • Steuerrecht
    • Konzepte
  • Videos
    • Informationsvideos – über Marian Härtel
    • Videos – über mich (Couch)
    • Blogpost – einzelne Videos
    • Videos zu Dienstleistungen
    • Shorts
    • Podcast Format
    • Drittanbietervideos
    • Sonstige Videos
  • Kontaktaufnahme
  • Shop / Downloads / Community
    • Downloads und Dienstleistungen
      • Beratung
      • Seminare
      • E-Books
      • Freebies
      • Vertragsmuster
      • Bundle
    • Profil / Verwaltung
      • Bestellungen
      • Downloads
      • Rechnungsadresse
      • Zahlungsarten
    • Kasse
    • Warenkorb
    • Support
    • FAQ Shop
Rechtsanwalt Marian Härtel - ITMediaLaw

KI-Training mit Nutzerdaten 2025: Opt-out, Text- und Data-Mining, DSGVO & AI Act

30. Juli 2025
in Sonstiges, Urheberrecht
Lesezeit: 6 Minuten Lesezeit
0 0
A A
0

Kurzüberblick: Generative KI braucht Daten. Beim Training treffen Urheberrecht (TDM-Ausnahmen und Opt-out), DSGVO (Rechtsgrundlagen, Informationspflichten, Betroffenenrechte) und der AI Act (Transparenz- und Copyright-Compliance für General-Purpose-Modelle) unmittelbar aufeinander. Entscheidend ist ein sauberer Aufbau aus Rechtsgrundlagen, vertraglichen Zusicherungen, technischen Opt-out-Mechanismen und Prozessen für Einwände, Löschungen und Nachweise. Dieser Leitfaden bündelt die praxistauglichen Schritte – mit Fokus auf deutsche und europäische Regeln.

Inhaltsverzeichnis Verbergen
1. Rechtsrahmen kompakt: TDM-Ausnahmen, Opt-out und die deutsche Umsetzung
2. 2) DSGVO beim Web- und Nutzerdaten-Training: Rechtsgrundlagen, Grenzen, Pflichten
3. AI Act und Copyright-Compliance: Pflichten für General-Purpose-Modelle
4. Opt-out in der Praxis: maschinenlesbare Vorbehalte und wie KI-Teams sie beachten
5. Urheberrecht + DSGVO zusammen denken: Vier typische Stolpersteine
6. Praxisfahrplan: Governance, Verträge, Technik
7. Umsetzungsschritte für Produkt-Teams: „Legal by Architecture“
8. Häufige Fehlannahmen – und wie sie vermieden werden
9. Checkliste 2025: Von der Rechtstheorie zur Revisionssicherheit
10. Fazit
10.1. Author: Marian Härtel

 Rechtsrahmen kompakt: TDM-Ausnahmen, Opt-out und die deutsche Umsetzung

Der unionsrechtliche Dreh- und Angelpunkt für das Training auf urheberrechtlich geschützten Inhalten sind die TDM-Ausnahmen der Richtlinie (EU) 2019/790 (DSM). Art. 3 privilegiert Text- und Data-Mining durch Forschungseinrichtungen/Kulturerbeeinrichtungen bei rechtmäßigem Zugang – ohne Widerspruchsmöglichkeit der Rechteinhaber. Art. 4 eröffnet eine allgemeine TDM-Schranke für weitere Zwecke (auch kommerzielles KI-Training), allerdings nur, soweit Rechteinhaber die Nutzung nicht „in geeigneter Form“ ausdrücklich vorbehalten (Opt-out, online idealerweise maschinenlesbar). In Deutschland sind diese Regeln als § 60d UrhG (Forschung) und § 44b UrhG (allgemeines TDM mit Opt-out) umgesetzt. Für die Praxis heißt das:
– Forschungstraining mit rechtmäßigem Zugang fällt regelmäßig in § 60d UrhG.
– Kommerzielles Training kann auf § 44b UrhG gestützt werden, sofern kein wirksamer Opt-out gesetzt wurde und der Zugang rechtmäßig war.
– Zusätzlich können Datenbankrechte betroffen sein; die TDM-Ausnahmen adressieren auch Extraktionen aus geschützten Datenbanken.

Das Opt-out ist insbesondere online maschinenlesbar auszudrücken. Diskussionen und erste Entscheidungen in Deutschland konkretisieren, dass „maschinenlesbar“ nicht automatisch klassische robots.txt-Verbote meint; vielmehr setzt sich eine spezifische TDM-Reservation durch, die klar und technisch auswertbar signalisiert, dass TDM-Nutzungen vorbehalten werden. Erste Gerichtsentscheidungen haben zudem gezeigt: Die Rechtmäßigkeit des Zugriffs, die Einhaltung von Opt-outs und die saubere Dokumentation sind haftungsrelevant – auch schon bei der Datensatzbildung für das Training, nicht erst beim eigentlichen Modelltraining.

2) DSGVO beim Web- und Nutzerdaten-Training: Rechtsgrundlagen, Grenzen, Pflichten

KI-Training auf personenbezogenen Daten braucht eine tragfähige Rechtsgrundlage nach Art. 6 DSGVO. Die Debatte dreht sich vor allem um berechtigte Interessen (Art. 6 Abs. 1 lit. f). Datenschutzaufsichten betonen: Berechtigte Interessen können denkbar sein, verlangen aber einen strengen Drei-Stufen-Test, Sicherheits- und Transparenzmaßnahmen, Interessenabwägung, Opt-Out-Mechanismen und eine nachvollziehbare Accountability. Für besondere Kategorien (Art. 9 DSGVO) ist der Maßstab erheblich höher; eine Stützung auf berechtigte Interessen scheidet aus, es braucht z. B. ausdrückliche Einwilligung oder eine andere spezielle Ausnahme.

Weitere Eckpunkte:
– Transparenz/Informationspflichten (Art. 13/14): Auch bei Web-Scraping sind Informationspflichten grundsätzlich zu erfüllen; Ausnahmen müssen begründet und dokumentiert werden.
– Betroffenenrechte: Widerspruch (Art. 21), Löschung (Art. 17), Berichtigung/Anmerkung zur Richtigkeit – auch bezogen auf Trainingsdatensätze und unter Umständen Modelle.
– Datenminimierung & Speicherbegrenzung (Art. 5 Abs. 1 lit. c/e): Korpora kuratieren, sensible Felder filtern, Retention begrenzen, Löschroutinen und „Do-Not-Train“-Sperrlisten vorhalten.
– Risikosteuerung & DPIA (Art. 35): Für breit angelegte Scraping/Training-Projekte regelmäßig erforderlich; Ergebnis in Policies und Technik spiegeln.

Europäische und nationale Behörden haben 2024/2025 Leitlinien und Task-Force-Berichte veröffentlicht, die den Rahmen schärfen: EDPB adressiert Transparenz, Richtigkeitsrisiken und Rechtsgrundlagen; CNIL erläutert Bedingungen, unter denen sich Training auf berechtigte Interessen stützen lässt (einschließlich technischer/organisatorischer Schutzmaßnahmen); ICO (UK) konkretisiert die Anforderungen an Web-Scraping und Legitimate-Interest-Tests. Für die Praxis ist entscheidend, diese Vorgaben nachweisbar in Governance und Technik zu verankern.

AI Act und Copyright-Compliance: Pflichten für General-Purpose-Modelle

Der AI Act ist seit Juli 2024 im Amtsblatt; zentrale Teile greifen stufenweise bis 2026. Für General-Purpose-AI-Modelle (GPAI) normiert der Rechtsrahmen Transparenz- und Copyright-Compliance-Pflichten. Anbieter von GPAI-Modellen müssen u. a. eine Policy zur Beachtung des EU-Urheberrechts vorhalten und eine hinreichend detaillierte Zusammenfassung der zum Training verwendeten Inhalte veröffentlichen – unabhängig davon, wo das Training stattfand. Parallel entsteht ein GPAI-Code of Practice (2025) als freiwilliger Anknüpfungspunkt, um die Pflichten – einschließlich Copyright-Respekt und Dokumentation – praktisch umzusetzen. Konsequenz: Rechte- und Daten-Compliance werden prüf- und nachweispflichtig, nicht nur „Best Efforts“.

Opt-out in der Praxis: maschinenlesbare Vorbehalte und wie KI-Teams sie beachten

Die DSM-Richtlinie verlangt für online verfügbare Inhalte einen maschinenlesbaren Vorbehalt. In der Praxis etabliert sich das TDM-Reservation Protocol (TDMRep) als dedizierter, auswertbarer Standard. Es kann u. a. per HTTP-Header oder TDM-Datei signalisieren, dass TDM-Nutzungen vorbehalten sind, und optional auf Lizenzpfade verweisen. Daneben kursieren inoffizielle Signale (z. B. „noai“-Meta/robots-Tags); diese sind nicht harmonisiert und werden inkonsistent beachtet. Wer auf § 44b UrhG setzt, sollte in der Pipeline konsequent TDM-Signale parsen und belegen, dass Opt-outs respektiert werden – andernfalls drohen Urheberrechtsrisiken. Öffentliche Stellen (Rat/Kommission) treiben parallel Standards/Registry-Überlegungen voran, um das Opt-out europaweit interoperabel zu machen.

Technische Mindestmaßnahmen für Scraper/Loader
– Parser für tdm-reservation und – soweit vorhanden – tdm-policy (Fallback: robuste robots-Ehre allein genügt nicht).
– Positiv-/Negativlisten und Blocker gegen bekannte AI-Crawler-Sperren und TDM-Vorbehalte.
– Evidenzspeicher: Für jede Quelle Zeitpunkt, HTTP-Header/Datei-Snapshot, Status des Opt-outs, Lizenzpfad, rechtmäßiger Zugang.
– Re-Crawl-Regeln: TDM-Opt-outs können nachträglich gesetzt werden; Reconcile-Läufe sind einzuplanen.
– Lizenz-Router: Wenn Vorbehalt gesetzt ist, den Lizenzweg anstoßen (z. B. Rechte-Contact-URL aus TDM-Policy).

 Urheberrecht + DSGVO zusammen denken: Vier typische Stolpersteine

Rechtmäßiger Zugang ist kein Freifahrtschein. Kostenlos zugängliche Inhalte können urheberrechtlich frei abrufbar sein, aber datenschutzrechtlich bleibt eine Rechtsgrundlage erforderlich. Ohne tragfähige Art. 6-Basis und ohne transparente Information wird Training auf personenbezogenen Daten riskant – selbst wenn kein Opt-out gesetzt ist.

Spezialkategorien in Web-Daten schleichen sich in großem Stil in Korpora ein (Gesundheit, politische Meinung, Religion). Für das Training existiert regelmäßig keine tragfähige Ausnahme ohne Einwilligung oder engste Spezialtatbestände. Filter/Exklusion sind daher Pflicht, ebenso Sperr-Listen für sensible Entitäten.

Datenbankrechte werden unterschätzt. Viele „offene“ Sammlungen sind sui-generis-Datenbanken; massenhafte Extraktionen können das § 87b UrhG-Recht verletzen, wenn kein TDM-Privileg greift.

Nachträgliche Opt-outs und Betroffenenrechte betreffen nicht nur Datensätze, sondern teils auch Modellartefakte (z. B. Vektoren, Embeddings). Nicht immer besteht ein „Löschanspruch im Modell“, aber belastbare Prozesse für Suppression, Fine-Tuning-Korrekturen und Auskunft sind gefordert – und werden von Aufsichten zunehmend eingefordert. (Gesetze im Internet, EDPB)

Praxisfahrplan: Governance, Verträge, Technik

Governance & Dokumentation
– Policy-Stack: TDM-Compliance-Policy (Opt-out-Respekt, Lizenzpfade), Copyright-Policy (Werks-/Leistungsschutzrechte, Datenbankrechte), Privacy-Policy (Art. 6/9, Transparenz, Betroffenenrechte), Retention-Policy für Korpora/Artefakte.
– Rollen: Data Sourcing, Rights & Privacy Counsel, Dataset Steward, Security/ML-Ops, Audit.
– DPIA und Legitimate-Interest-Abwägung mit konkreten Safeguards (Pseudonymisierung, Blacklists, Sensitive-Data-Filter, Rate-Limits, Zugriffskontrollen, Zweckbindung).
– Transparenz: Layered Notices, Model Cards/Datasheets; für GPAI: Trainingsinhalts-Zusammenfassung gem. AI Act.

Verträge & Rechtekette
– Content-Quellen: Lizenzklauseln zu TDM-Erlaubnis/-Beschränkung, Zweckbindung „Training/Fine-Tuning/Evaluierung“, Gebiete, Laufzeit, Vergütung, Audit/Rechtekette, No-Scrape-Gewährleistung.
– API/Partner: Zusicherung rechtmäßiger Bereitstellung, keine Opt-outs verletzt, keine besondere Kategorien ohne Grundlage, Freistellung + Audit-Rechte.
– Nutzerinhalte (SaaS/UGC): klare AGB-Erlaubnis oder Default No-Training mit granularen Opt-ins; respektive Opt-out in Privacy-Settings; explizite Regeln für fein granulare Zwecke (z. B. „nur Qualitätsverbesserung“, „kein Drittmodell-Training“).
– Datenlieferanten (Annotation, Synthesis): Geheimhaltung, Urheber-/Leistungsschutz, personenbezogene Daten, Bias-/Qualitäts-KPIs, Rechte an Labels.

Technik & Prozesse
– Crawler/Loader respektieren tdm-reservation; Parser verpflichtend in die Pipeline.
– Sensitive-Data-Filter vor Aufnahme in Trainingskorpora; Hash/Heuristik/Regeln + menschliche Stichprobe.
– Betroffenenrechte: Such-/Suppressions-Funktion über Korpus und Artefakte; dokumentierter Widerspruchs- und Lösch-Prozess; differenziert für Trainings- vs. Evaluierungs-Sets und für Fine-Tuning-Adapter.
– Dataset-Provenance: Inhalte, Quellen-URL, Timestamp, Opt-out-Status, Lizenzpfad, Rechtsgrundlage; Unveränderlichkeit (z. B. WORM-Store) und Audit-Trail.
– Model-Level-Kontrollen: Red-Team-Eval für personenbezogene Ausgaben, Prompt-Guards, Throttling, Output-Transparenzhinweise.
– Security by Design: Zugriff/Keys, Segmentierung, Secret Management; Schutz vor Datenabflüssen und Poisoning; regelmäßige Audits.

 Umsetzungsschritte für Produkt-Teams: „Legal by Architecture“

Korpus-Design
– Erstes Sourcing nur aus Quellen ohne TDM-Vorbehalt bzw. mit Lizenz; technische Whitelists.
– Dediziertes Forschungs-Korpus getrennt von kommerziellem Korpus; § 60d-Nutzungen nicht ungeprüft in kommerzielle Pfade kippen.
– Rezidives Sampling vermeiden (wiederholte Ziehungen sensibler Inhalte), um Overfit auf personenbezogene Muster zu reduzieren.

Transparenz & Nutzersteuerung
– Bei Produkten mit Nutzer-Uploads granulare Einwilligungen/Opt-ins zum Training; Default restriktiv; separate Einwilligung für besondere Daten.
– Informationslayer für Scraping-Quellen und Betroffenenrechte; leicht auffindbare „Do-Not-Train“-Schaltflächen.

Evaluation & Betrieb
– Richtigkeit/Accuracy bei personenbeziehbaren Ausgaben adressieren; EDPB hebt Genauigkeitsanforderungen hervor.
– Inhaltszusammenfassung (AI Act) sorgfältig kuratieren: Kategorien, Quellenklassen, Lizenzwege, Opt-out-Respekt – ohne Geschäftsgeheimnisse zu entblößen.
– Incident-Response für Rechte-/Datenschutzverstöße: Intake-Kanal, Sofortmaßnahmen (Block/Suppress), Benachrichtigungen, Remediation.

Häufige Fehlannahmen – und wie sie vermieden werden

„Öffentlich zugänglich = frei trainierbar“ – falsch. Auch öffentlich verfügbare Inhalte sind urheber- und datenrechtlich geschützt. Es braucht TDM-Privileg oder Lizenz und DSGVO-Grundlage.

„robots.txt genügt als Opt-out“ – unzuverlässig. Das TDM-Reservierungs-Signal ist der bessere, auswertbare Weg.

„Einmal trainiert, nie mehr löschbar“ – so pauschal nicht. Ein Lösch-/Widerspruchsprozess kann an Korpus (Entfernung/Suppress), Artefakte (Filter/Adapter-Retraining) und Output-Steuerung anknüpfen; ob ein Modell-Retrain nötig ist, hängt vom Einzelfall ab (Verhältnismäßigkeit, technische Machbarkeit, Risiko).

„Forschungsklausel heilt alles“ – tut sie nicht. § 60d UrhG ist auf berechtigte Träger und rechtmäßigen Zugang begrenzt; Überführungen in kommerzielle Nutzung sind gesondert zu lizenzieren/zu prüfen.

Checkliste 2025: Von der Rechtstheorie zur Revisionssicherheit

  1. Datenquellen-Register mit Opt-out-Status (tdm-reservation), Rechtmäßigkeit, Lizenzpfad.
  2. TDM-Parser produktiv, Blocker für TDM-Vorbehalte aktiv.
  3. DSGVO-Grundlage ausgewiesen (Art. 6/9), LIA/DPIA dokumentiert, Transparenztexte verfügbar.
  4. Sensitive-Data-Mitigation vor Training, Ausschlusslisten aktuell.
  5. Betroffenenrechte-Prozess (Auskunft, Widerspruch, Löschung) end-to-end.
  6. AI-Act-GPAI: Copyright-Policy + Trainingsinhalts-Zusammenfassung implementiert; Code of Practice ggf. gezeichnet.
  7. Vertragliche Zusicherungen mit Content-/API-Partnern (Clearing, Freistellung, Audit).
  8. Audit-Trail für Sourcing, Training, Evaluierung, Releases; regelmäßige Management-Reviews.

Fazit

Rechtskonformes KI-Training ist kein Ratespiel, sondern Prozess- und Beweisdisziplin. Wer TDM-Opt-outs technisch respektiert, DSGVO-Pflichten organisatorisch abbildet und AI-Act-Transparenz substanziell erfüllt, reduziert Streit- und Sanktionsrisiken erheblich – und gewinnt zugleich die Grundlage, um mit Rechteinhabern planbar zu lizenzieren. Der operative Unterschied entsteht nicht in Grundsatzpapieren, sondern in Crawler-Logs, Parsern, Filtern, Policies und Verträgen, die dem Audit standhalten.

 

Marian Härtel
Author: Marian Härtel

Marian Härtel ist Rechtsanwalt und Fachanwalt für IT-Recht mit einer über 25-jährigen Erfahrung als Unternehmer und Berater in den Bereichen Games, E-Sport, Blockchain, SaaS und Künstliche Intelligenz. Seine Beratungsschwerpunkte umfassen neben dem IT-Recht insbesondere das Urheberrecht, Medienrecht sowie Wettbewerbsrecht. Er betreut schwerpunktmäßig Start-ups, Agenturen und Influencer, die er in strategischen Fragen, komplexen Vertragsangelegenheiten sowie bei Investitionsprojekten begleitet. Dabei zeichnet sich seine Beratung durch einen interdisziplinären Ansatz aus, der juristische Expertise und langjährige unternehmerische Erfahrung miteinander verbindet. Ziel seiner Tätigkeit ist stets, Mandanten praxisorientierte Lösungen anzubieten und rechtlich fundierte Unterstützung bei der Umsetzung innovativer Geschäftsmodelle zu gewährleisten.

Weiter lesen

Weitere spannende Blogposts

Datenschutz/Ex-Mitarbeiter und das Nutzen einer catch-all-Email

Datenschutz/Ex-Mitarbeiter und das Nutzen einer catch-all-Email
24. Juli 2019

Ein unterschätzes Problem Immer wieder bekomme ich mit, dass Mandanten von mir, die durchaus auch mit Fluktuationen bei Mitarbeitern kämpfen...

Mehr lesenDetails

Das Wort „Spezialist“ kann unzulässige Spitzenstellungswerbung sein

Das Wort „Spezialist“ kann unzulässige Spitzenstellungswerbung sein
15. April 2020

Das Landgericht Ellwangen in Baden-Württemberg hat eine einstweilige Verfügung dahingehend bestätigt, dass der Begriff "Spezialist" als Spitzenstellungswerbung unzulässig sein kann.Ein...

Mehr lesenDetails

Lastschrift im Onlinehandel am Ende? Die SEPA-VO der EU!

Lastschrift im Onlinehandel am Ende? Die SEPA-VO der EU!
5. September 2019

Unter Juristen wurde schon eine Weile auf das Risiko des Anbietens des Lastschriftverfahrens aufgrund der Geoblocking Verordnung (siehe diesen Beitrag)...

Mehr lesenDetails

 Der finale Entwurf von MICAR (Markets in Crypto Assets Regulation) ist verfügbar: Ein grober Überblick über den Inhalt

EuGH soll entscheiden, ob Verbraucherschützer Datenschutz abmahnen dürfen
20. April 2023

Der finale Entwurf von MICAR (Markets in Crypto Assets Regulation) ist nun verfügbar und markiert einen bedeutenden Schritt in der...

Mehr lesenDetails

Joint Development Agreements im Innovationssektor: Rechtliche Grundlagen, Haftungsfragen und Schutzrechte im Überblick

Joint venture
5. März 2025

Die zunehmende Bedeutung innovativer Kooperationsprojekte im Wettbewerb erfordert eine verlässliche vertragliche Basis, die alle Beteiligten absichert und klare Regelungen trifft....

Mehr lesenDetails

Eigentumsrechte an Algorithmen: Typische Fragen und rechtliche Antworten

EuGH: Generalanwalt bewertet Sampling als Urheberrechtsverletzung
29. Dezember 2024

Immer wieder stellen Mandanten die Frage: „Wem gehören eigentlich die Rechte an einem Algorithmus?“ Diese Frage ist nicht nur für...

Mehr lesenDetails

Multi-Tenant-Architekturen im SaaS-Bereich: Datentrennung und Compliance-Anforderungen

5. November 2024

Multi-Tenant-Architekturen sind das Rückgrat moderner SaaS-Lösungen, da sie eine effiziente Ressourcennutzung und Skalierbarkeit ermöglichen. Allerdings bringen sie auch komplexe rechtliche...

Mehr lesenDetails

Ehrlichkeit im Startup-Marketing: Rechtliche Anforderungen und ethische Grenzen zwischen Transparenz und Werbung

Ehrlichkeit im Startup-Marketing: Rechtliche Anforderungen und ethische Grenzen zwischen Transparenz und Werbung
28. März 2025

Startups stehen oft vor dem Spannungsfeld, sich attraktiv zu präsentieren und zugleich ehrlich und rechtskonform zu kommunizieren. Wie viel Ehrlichkeit...

Mehr lesenDetails

Gesetz zum Schutz von Geschäftsgeheimnissen im April

Gesetz zum Schutz von Geschäftsgeheimnissen im April
30. März 2019

Mit 10 Monaten Verspätung wird im April endlich auch in Deutschland die Richtlinie (EU) 2016/943 über den Schutz vertraulichen Know-hows und vertraulicher...

Mehr lesenDetails
  • Datenschutzerklärung
  • Impressum
  • Kontaktaufnahme
  • Über Rechtsanwalt Marian Härtel
Marian Härtel, Rathenaustr. 58a, 14612 Falkensee, info@itmedialaw.com

Marian Härtel - Rechtsanwalt für IT-Recht, Medienrecht und Startups, mit einem Fokus auf innovative Geschäftsmodelle, Games, KI und Finanzierungsberatung.

Willkommen zurück!

Loggen Sie sich unten in Ihr Konto ein

Haben Sie Ihr Passwort vergessen? Anmeldung

Neues Konto erstellen!

Füllen Sie die nachstehenden Formulare aus, um sich zu registrieren

Alle Felder sind erforderlich. Einloggen

Ihr Passwort abrufen

Bitte geben Sie Ihren Benutzernamen oder Ihre E-Mail-Adresse ein, um Ihr Passwort zurückzusetzen.

Einloggen
  • Informationen
    • Leistungen
      • Betreuung und Beratung von Agenturen
      • Vertragsprüfung- und erstellung
      • Beratung zum Games-Recht
      • Beratung für Influencer und Streamer
      • Beratung im E-Commerce
      • Beratung zu DLT und Blockchain
      • Rechtsberatung im Gesellschaftsrecht
      • Legal Compliance und Gutachten
      • Outsourcing – für Unternehmen oder Kanzleien
      • Buchung als Speaker
    • Schwerpunkte
      • Focus auf Startups
      • Investmentberatung
      • Unternehmensrecht
      • Kryptowährungen, Blockchain und Games
      • KI und SaaS
      • Streamer und Influencer
      • Games- und Esportrecht
      • IT/IP-Recht
      • Kanzlei für GMBH,UG, GbR
      • Kanzlei für IT/IP und Medienrecht
    • Idealer Partner
    • Über Rechtsanwalt Marian Härtel
    • Schnell und flexibel erreichbar
    • Prinzipien als Rechtsanwalt
    • Warum Rechtsanwalt und Unternehmensberater?
    • Der Alltag eines IT-Rechtsanwalts
    • Wie kann ich Mandanten helfen?
    • Testimonials
    • Team: Saskia Härtel – WER BIN ICH?
    • Agile und leane Kanzlei
    • Preisübersicht
    • Sonstiges
      • AGB
      • Datenschutzerklärung
      • Widerrufserklärung
      • Impressum
  • News
    • Glosse / Meinung
    • Recht im Internet
    • Onlinehandel
    • Recht und Computerspiele
    • Recht und Esport
    • Blockchain und Web 3 Recht
    • Datenschutzrecht
    • Urheberrecht
    • Arbeitsrecht
    • Wettbewerbsrecht
    • Gesellschaftsrecht
    • EU-Recht
    • Jugendschutzrecht
    • Steuerrecht
    • Sonstiges
    • Intern
  • Podcast
    • ITMediaLaw Kurz-Podcast
    • ITMediaLaw Podcast
  • Wissen
    • Gesetze
    • Juristische Begriffe
    • Vertragstypen
    • Klauseltypen
    • Finanzierungsformen und Begriffe
    • Juristische Mittel
    • Behörden / Institutionen
    • Gesellschaftsformen
    • Steuerrecht
    • Konzepte
  • Videos
    • Informationsvideos – über Marian Härtel
    • Videos – über mich (Couch)
    • Blogpost – einzelne Videos
    • Videos zu Dienstleistungen
    • Shorts
    • Podcast Format
    • Drittanbietervideos
    • Sonstige Videos
  • Kontaktaufnahme
  • Shop / Downloads / Community
    • Downloads und Dienstleistungen
      • Beratung
      • Seminare
      • E-Books
      • Freebies
      • Vertragsmuster
      • Bundle
    • Profil / Verwaltung
      • Bestellungen
      • Downloads
      • Rechnungsadresse
      • Zahlungsarten
    • Kasse
    • Warenkorb
    • Support
    • FAQ Shop
  • en English
  • de Deutsch
Kostenlose Kurzberatung