• Aktuellste News
  • Gerade im Trend...
KI-Training mit Nutzerdaten 2025: Opt-out, Text- und Data-Mining, DSGVO & AI Act

KI-Training mit Nutzerdaten 2025: Opt-out, Text- und Data-Mining, DSGVO & AI Act

30. Juli 2025
Streaming-Setup, Influencer und Vertragsrecht

Influencer: Wann aus Marketing plötzlich Handelsvertreterrecht wird

18. Februar 2026
Insolvenzverwalter und Zugang zu Finanzamtdaten?

NRW prüft Influencer – und plötzlich gelten ganz normale Regeln?

12. Februar 2026
iStock 1405433207 scaled

Rechtliche Fallstricke bei Revenue-Based Financing für Startups

12. Februar 2026
Streaming-Setup, Influencer und Vertragsrecht

Streaming-Setup, Influencer und Vertragsrecht

9. Februar 2026
Platform Cooperatives als Finanzierungs- und Geschäftsmodell

Platform Cooperatives als Finanzierungs- und Geschäftsmodell

8. Februar 2026
Landgericht Frankfurt a.M weicht Influencer-Rechtsprechung auf

Umsatzsteuer auf Donations, Spenden und „Support“ bei Influencern?

5. Februar 2026
Kammergericht zu Unterlassungspflichten bei Handlungen Dritter

Gerichtsstand im Vertrag: Ein Wort zu viel, ein Wort zu wenig

4. Februar 2026
Neue Infos zum Status des Medienstaatsvertrages

Kundenhotline und Support im SaaS

2. Februar 2026
BGH hält Uber Black für wettbewerbswidrig

BGH: FRAND-Einwand scheitert an fehlender Lizenzwilligkeit

28. Januar 2026
marianregel

InformationCheck.de ist live: Nebenprojekt für quellenbasierte Einordnung von Social-Media-Behauptungen

22. Januar 2026
DPMA

Bezahlte Mods, Fan-Guidelines und EULA: Wann Monetarisierung möglich ist

21. Januar 2026
Ist ein 8jähriger als Esport Spieler zulässig?

LOI, Term Sheet, MoU, für Startups oft bindend?

20. Januar 2026
Was ist eigentlich eine IP? In der Games, Musik und Film-Industrie!

Freelancer bezahlt, Rechte trotzdem nicht bekommen?

19. Januar 2026
Affiliate-Links bei Streamern und Influencern

Vergleichsseiten als SEO-Trick

16. Januar 2026
Reverse Vesting

Vesting, Good Leaver, Bad Leaver – warum fehlende Regelungen Startups teuer zu stehen kommen

15. Januar 2026
ai generated g63ed67bf8 1280

KI-Richtlinie für Agenturen und externe Dienstleister

14. Januar 2026
KI-generierte Musik in Filmen, Games und auf Streaming-Plattformen

KI-generierte Musik in Filmen, Games und auf Streaming-Plattformen

13. Januar 2026
Cold Contacting auf LinkedIn: Aktuelles Urteil des OLG Hamm und was es für Sie bedeutet

LinkedIn Avatare („AI Avatars“) im Unternehmens- und Marketingeinsatz

12. Januar 2026
Key Learnings aus meinem Vortrag: Navigieren durch die komplexe Welt der KI und des Rechts

Nach dem OLG-Hamburg-Urteil: Best Practices für KI-Anbieter

20. Dezember 2025
Kryptowert

Verloren nach Kryptobetrug? – Technisch-rechtliche Symbiose als Rettungsanker

17. Dezember 2025
  • Mehr als 3 Millionen Wörter Inhalt
  • |
  • info@itmedialaw.com
  • |
  • Tel: 03322 5078053
  • |
  • LinkedIn
  • |
  • Discord
  • |
  • WhatsApp
Kurzberatung
Rechtsanwalt Marian Härtel - ITMediaLaw

Es befinden sich keine Produkte im Warenkorb.

  • en English
  • de Deutsch
  • Informationen
    • Leistungen
      • Betreuung und Beratung von Agenturen
      • Vertragsprüfung- und erstellung
      • Beratung zum Games-Recht
      • Beratung für Influencer und Streamer
      • Beratung im E-Commerce
      • Beratung zu DLT und Blockchain
      • Rechtsberatung im Gesellschaftsrecht
      • Legal Compliance und Gutachten
      • Outsourcing – für Unternehmen oder Kanzleien
      • Buchung als Speaker
    • Schwerpunkte
      • Focus auf Startups
      • Investmentberatung
      • Unternehmensrecht
      • Kryptowährungen, Blockchain und Games
      • KI und SaaS
      • Streamer und Influencer
      • Games- und Esportrecht
      • IT/IP-Recht
      • Kanzlei für GMBH,UG, GbR
      • Kanzlei für IT/IP und Medienrecht
    • Idealer Partner
    • Über Rechtsanwalt Marian Härtel
    • Schnell und flexibel erreichbar
    • Prinzipien als Rechtsanwalt
    • Warum Rechtsanwalt und Unternehmensberater?
    • Der Alltag eines IT-Rechtsanwalts
    • Wie kann ich Mandanten helfen?
    • Testimonials
    • Team: Saskia Härtel – WER BIN ICH?
    • Agile und leane Kanzlei
    • Preisübersicht
    • Sonstiges
      • AGB
      • Datenschutzerklärung
      • Widerrufserklärung
      • Impressum
  • News
    • Glosse / Meinung
    • Recht im Internet
    • Onlinehandel
    • Recht und Computerspiele
    • Recht und Esport
    • Blockchain und Web 3 Recht
    • Datenschutzrecht
    • Urheberrecht
    • Arbeitsrecht
    • Wettbewerbsrecht
    • Gesellschaftsrecht
    • EU-Recht
    • Jugendschutzrecht
    • Steuerrecht
    • Sonstiges
    • Intern
  • Podcast
    • ITMediaLaw Kurz-Podcast
    • ITMediaLaw Podcast
  • Wissen
    • Gesetze
    • Juristische Begriffe
    • Vertragstypen
    • Klauseltypen
    • Finanzierungsformen und Begriffe
    • Juristische Mittel
    • Behörden / Institutionen
    • Gesellschaftsformen
    • Steuerrecht
    • Konzepte
  • Videos
    • Informationsvideos – über Marian Härtel
    • Videos – über mich (Couch)
    • Blogpost – einzelne Videos
    • Videos zu Dienstleistungen
    • Shorts
    • Podcast Format
    • Drittanbietervideos
    • Sonstige Videos
  • Kontaktaufnahme
  • Shop / Downloads / Community
    • Downloads und Dienstleistungen
      • Beratung
      • Seminare
      • E-Books
      • Freebies
      • Vertragsmuster
      • Bundle
    • Profil / Verwaltung
      • Bestellungen
      • Downloads
      • Rechnungsadresse
      • Zahlungsarten
    • Kasse
    • Warenkorb
    • Support
    • FAQ Shop
  • Informationen
    • Leistungen
      • Betreuung und Beratung von Agenturen
      • Vertragsprüfung- und erstellung
      • Beratung zum Games-Recht
      • Beratung für Influencer und Streamer
      • Beratung im E-Commerce
      • Beratung zu DLT und Blockchain
      • Rechtsberatung im Gesellschaftsrecht
      • Legal Compliance und Gutachten
      • Outsourcing – für Unternehmen oder Kanzleien
      • Buchung als Speaker
    • Schwerpunkte
      • Focus auf Startups
      • Investmentberatung
      • Unternehmensrecht
      • Kryptowährungen, Blockchain und Games
      • KI und SaaS
      • Streamer und Influencer
      • Games- und Esportrecht
      • IT/IP-Recht
      • Kanzlei für GMBH,UG, GbR
      • Kanzlei für IT/IP und Medienrecht
    • Idealer Partner
    • Über Rechtsanwalt Marian Härtel
    • Schnell und flexibel erreichbar
    • Prinzipien als Rechtsanwalt
    • Warum Rechtsanwalt und Unternehmensberater?
    • Der Alltag eines IT-Rechtsanwalts
    • Wie kann ich Mandanten helfen?
    • Testimonials
    • Team: Saskia Härtel – WER BIN ICH?
    • Agile und leane Kanzlei
    • Preisübersicht
    • Sonstiges
      • AGB
      • Datenschutzerklärung
      • Widerrufserklärung
      • Impressum
  • News
    • Glosse / Meinung
    • Recht im Internet
    • Onlinehandel
    • Recht und Computerspiele
    • Recht und Esport
    • Blockchain und Web 3 Recht
    • Datenschutzrecht
    • Urheberrecht
    • Arbeitsrecht
    • Wettbewerbsrecht
    • Gesellschaftsrecht
    • EU-Recht
    • Jugendschutzrecht
    • Steuerrecht
    • Sonstiges
    • Intern
  • Podcast
    • ITMediaLaw Kurz-Podcast
    • ITMediaLaw Podcast
  • Wissen
    • Gesetze
    • Juristische Begriffe
    • Vertragstypen
    • Klauseltypen
    • Finanzierungsformen und Begriffe
    • Juristische Mittel
    • Behörden / Institutionen
    • Gesellschaftsformen
    • Steuerrecht
    • Konzepte
  • Videos
    • Informationsvideos – über Marian Härtel
    • Videos – über mich (Couch)
    • Blogpost – einzelne Videos
    • Videos zu Dienstleistungen
    • Shorts
    • Podcast Format
    • Drittanbietervideos
    • Sonstige Videos
  • Kontaktaufnahme
  • Shop / Downloads / Community
    • Downloads und Dienstleistungen
      • Beratung
      • Seminare
      • E-Books
      • Freebies
      • Vertragsmuster
      • Bundle
    • Profil / Verwaltung
      • Bestellungen
      • Downloads
      • Rechnungsadresse
      • Zahlungsarten
    • Kasse
    • Warenkorb
    • Support
    • FAQ Shop
Rechtsanwalt Marian Härtel - ITMediaLaw

KI-Training mit Nutzerdaten 2025: Opt-out, Text- und Data-Mining, DSGVO & AI Act

30. Juli 2025
in Urheberrecht, Sonstiges
Lesezeit: 6 Minuten Lesezeit
0 0
A A
0
blogpost ki training nutzerdaten optout tdm 1600

Kurzüberblick: Generative KI braucht Daten. Beim Training treffen Urheberrecht (TDM-Ausnahmen und Opt-out), DSGVO (Rechtsgrundlagen, Informationspflichten, Betroffenenrechte) und der AI Act (Transparenz- und Copyright-Compliance für General-Purpose-Modelle) unmittelbar aufeinander. Entscheidend ist ein sauberer Aufbau aus Rechtsgrundlagen, vertraglichen Zusicherungen, technischen Opt-out-Mechanismen und Prozessen für Einwände, Löschungen und Nachweise. Dieser Leitfaden bündelt die praxistauglichen Schritte – mit Fokus auf deutsche und europäische Regeln.

Inhaltsverzeichnis Verbergen
1. Rechtsrahmen kompakt: TDM-Ausnahmen, Opt-out und die deutsche Umsetzung
2. 2) DSGVO beim Web- und Nutzerdaten-Training: Rechtsgrundlagen, Grenzen, Pflichten
3. AI Act und Copyright-Compliance: Pflichten für General-Purpose-Modelle
4. Opt-out in der Praxis: maschinenlesbare Vorbehalte und wie KI-Teams sie beachten
5. Urheberrecht + DSGVO zusammen denken: Vier typische Stolpersteine
6. Praxisfahrplan: Governance, Verträge, Technik
7. Umsetzungsschritte für Produkt-Teams: „Legal by Architecture“
8. Häufige Fehlannahmen – und wie sie vermieden werden
9. Checkliste 2025: Von der Rechtstheorie zur Revisionssicherheit
10. Fazit
10.1. Author: Marian Härtel

 Rechtsrahmen kompakt: TDM-Ausnahmen, Opt-out und die deutsche Umsetzung

Der unionsrechtliche Dreh- und Angelpunkt für das Training auf urheberrechtlich geschützten Inhalten sind die TDM-Ausnahmen der Richtlinie (EU) 2019/790 (DSM). Art. 3 privilegiert Text- und Data-Mining durch Forschungseinrichtungen/Kulturerbeeinrichtungen bei rechtmäßigem Zugang – ohne Widerspruchsmöglichkeit der Rechteinhaber. Art. 4 eröffnet eine allgemeine TDM-Schranke für weitere Zwecke (auch kommerzielles KI-Training), allerdings nur, soweit Rechteinhaber die Nutzung nicht „in geeigneter Form“ ausdrücklich vorbehalten (Opt-out, online idealerweise maschinenlesbar). In Deutschland sind diese Regeln als § 60d UrhG (Forschung) und § 44b UrhG (allgemeines TDM mit Opt-out) umgesetzt. Für die Praxis heißt das:
– Forschungstraining mit rechtmäßigem Zugang fällt regelmäßig in § 60d UrhG.
– Kommerzielles Training kann auf § 44b UrhG gestützt werden, sofern kein wirksamer Opt-out gesetzt wurde und der Zugang rechtmäßig war.
– Zusätzlich können Datenbankrechte betroffen sein; die TDM-Ausnahmen adressieren auch Extraktionen aus geschützten Datenbanken.

Das Opt-out ist insbesondere online maschinenlesbar auszudrücken. Diskussionen und erste Entscheidungen in Deutschland konkretisieren, dass „maschinenlesbar“ nicht automatisch klassische robots.txt-Verbote meint; vielmehr setzt sich eine spezifische TDM-Reservation durch, die klar und technisch auswertbar signalisiert, dass TDM-Nutzungen vorbehalten werden. Erste Gerichtsentscheidungen haben zudem gezeigt: Die Rechtmäßigkeit des Zugriffs, die Einhaltung von Opt-outs und die saubere Dokumentation sind haftungsrelevant – auch schon bei der Datensatzbildung für das Training, nicht erst beim eigentlichen Modelltraining.

2) DSGVO beim Web- und Nutzerdaten-Training: Rechtsgrundlagen, Grenzen, Pflichten

KI-Training auf personenbezogenen Daten braucht eine tragfähige Rechtsgrundlage nach Art. 6 DSGVO. Die Debatte dreht sich vor allem um berechtigte Interessen (Art. 6 Abs. 1 lit. f). Datenschutzaufsichten betonen: Berechtigte Interessen können denkbar sein, verlangen aber einen strengen Drei-Stufen-Test, Sicherheits- und Transparenzmaßnahmen, Interessenabwägung, Opt-Out-Mechanismen und eine nachvollziehbare Accountability. Für besondere Kategorien (Art. 9 DSGVO) ist der Maßstab erheblich höher; eine Stützung auf berechtigte Interessen scheidet aus, es braucht z. B. ausdrückliche Einwilligung oder eine andere spezielle Ausnahme.

Weitere Eckpunkte:
– Transparenz/Informationspflichten (Art. 13/14): Auch bei Web-Scraping sind Informationspflichten grundsätzlich zu erfüllen; Ausnahmen müssen begründet und dokumentiert werden.
– Betroffenenrechte: Widerspruch (Art. 21), Löschung (Art. 17), Berichtigung/Anmerkung zur Richtigkeit – auch bezogen auf Trainingsdatensätze und unter Umständen Modelle.
– Datenminimierung & Speicherbegrenzung (Art. 5 Abs. 1 lit. c/e): Korpora kuratieren, sensible Felder filtern, Retention begrenzen, Löschroutinen und „Do-Not-Train“-Sperrlisten vorhalten.
– Risikosteuerung & DPIA (Art. 35): Für breit angelegte Scraping/Training-Projekte regelmäßig erforderlich; Ergebnis in Policies und Technik spiegeln.

Europäische und nationale Behörden haben 2024/2025 Leitlinien und Task-Force-Berichte veröffentlicht, die den Rahmen schärfen: EDPB adressiert Transparenz, Richtigkeitsrisiken und Rechtsgrundlagen; CNIL erläutert Bedingungen, unter denen sich Training auf berechtigte Interessen stützen lässt (einschließlich technischer/organisatorischer Schutzmaßnahmen); ICO (UK) konkretisiert die Anforderungen an Web-Scraping und Legitimate-Interest-Tests. Für die Praxis ist entscheidend, diese Vorgaben nachweisbar in Governance und Technik zu verankern.

AI Act und Copyright-Compliance: Pflichten für General-Purpose-Modelle

Der AI Act ist seit Juli 2024 im Amtsblatt; zentrale Teile greifen stufenweise bis 2026. Für General-Purpose-AI-Modelle (GPAI) normiert der Rechtsrahmen Transparenz- und Copyright-Compliance-Pflichten. Anbieter von GPAI-Modellen müssen u. a. eine Policy zur Beachtung des EU-Urheberrechts vorhalten und eine hinreichend detaillierte Zusammenfassung der zum Training verwendeten Inhalte veröffentlichen – unabhängig davon, wo das Training stattfand. Parallel entsteht ein GPAI-Code of Practice (2025) als freiwilliger Anknüpfungspunkt, um die Pflichten – einschließlich Copyright-Respekt und Dokumentation – praktisch umzusetzen. Konsequenz: Rechte- und Daten-Compliance werden prüf- und nachweispflichtig, nicht nur „Best Efforts“.

Opt-out in der Praxis: maschinenlesbare Vorbehalte und wie KI-Teams sie beachten

Die DSM-Richtlinie verlangt für online verfügbare Inhalte einen maschinenlesbaren Vorbehalt. In der Praxis etabliert sich das TDM-Reservation Protocol (TDMRep) als dedizierter, auswertbarer Standard. Es kann u. a. per HTTP-Header oder TDM-Datei signalisieren, dass TDM-Nutzungen vorbehalten sind, und optional auf Lizenzpfade verweisen. Daneben kursieren inoffizielle Signale (z. B. „noai“-Meta/robots-Tags); diese sind nicht harmonisiert und werden inkonsistent beachtet. Wer auf § 44b UrhG setzt, sollte in der Pipeline konsequent TDM-Signale parsen und belegen, dass Opt-outs respektiert werden – andernfalls drohen Urheberrechtsrisiken. Öffentliche Stellen (Rat/Kommission) treiben parallel Standards/Registry-Überlegungen voran, um das Opt-out europaweit interoperabel zu machen.

Technische Mindestmaßnahmen für Scraper/Loader
– Parser für tdm-reservation und – soweit vorhanden – tdm-policy (Fallback: robuste robots-Ehre allein genügt nicht).
– Positiv-/Negativlisten und Blocker gegen bekannte AI-Crawler-Sperren und TDM-Vorbehalte.
– Evidenzspeicher: Für jede Quelle Zeitpunkt, HTTP-Header/Datei-Snapshot, Status des Opt-outs, Lizenzpfad, rechtmäßiger Zugang.
– Re-Crawl-Regeln: TDM-Opt-outs können nachträglich gesetzt werden; Reconcile-Läufe sind einzuplanen.
– Lizenz-Router: Wenn Vorbehalt gesetzt ist, den Lizenzweg anstoßen (z. B. Rechte-Contact-URL aus TDM-Policy).

 Urheberrecht + DSGVO zusammen denken: Vier typische Stolpersteine

Rechtmäßiger Zugang ist kein Freifahrtschein. Kostenlos zugängliche Inhalte können urheberrechtlich frei abrufbar sein, aber datenschutzrechtlich bleibt eine Rechtsgrundlage erforderlich. Ohne tragfähige Art. 6-Basis und ohne transparente Information wird Training auf personenbezogenen Daten riskant – selbst wenn kein Opt-out gesetzt ist.

Spezialkategorien in Web-Daten schleichen sich in großem Stil in Korpora ein (Gesundheit, politische Meinung, Religion). Für das Training existiert regelmäßig keine tragfähige Ausnahme ohne Einwilligung oder engste Spezialtatbestände. Filter/Exklusion sind daher Pflicht, ebenso Sperr-Listen für sensible Entitäten.

Datenbankrechte werden unterschätzt. Viele „offene“ Sammlungen sind sui-generis-Datenbanken; massenhafte Extraktionen können das § 87b UrhG-Recht verletzen, wenn kein TDM-Privileg greift.

Nachträgliche Opt-outs und Betroffenenrechte betreffen nicht nur Datensätze, sondern teils auch Modellartefakte (z. B. Vektoren, Embeddings). Nicht immer besteht ein „Löschanspruch im Modell“, aber belastbare Prozesse für Suppression, Fine-Tuning-Korrekturen und Auskunft sind gefordert – und werden von Aufsichten zunehmend eingefordert. (Gesetze im Internet, EDPB)

Praxisfahrplan: Governance, Verträge, Technik

Governance & Dokumentation
– Policy-Stack: TDM-Compliance-Policy (Opt-out-Respekt, Lizenzpfade), Copyright-Policy (Werks-/Leistungsschutzrechte, Datenbankrechte), Privacy-Policy (Art. 6/9, Transparenz, Betroffenenrechte), Retention-Policy für Korpora/Artefakte.
– Rollen: Data Sourcing, Rights & Privacy Counsel, Dataset Steward, Security/ML-Ops, Audit.
– DPIA und Legitimate-Interest-Abwägung mit konkreten Safeguards (Pseudonymisierung, Blacklists, Sensitive-Data-Filter, Rate-Limits, Zugriffskontrollen, Zweckbindung).
– Transparenz: Layered Notices, Model Cards/Datasheets; für GPAI: Trainingsinhalts-Zusammenfassung gem. AI Act.

Verträge & Rechtekette
– Content-Quellen: Lizenzklauseln zu TDM-Erlaubnis/-Beschränkung, Zweckbindung „Training/Fine-Tuning/Evaluierung“, Gebiete, Laufzeit, Vergütung, Audit/Rechtekette, No-Scrape-Gewährleistung.
– API/Partner: Zusicherung rechtmäßiger Bereitstellung, keine Opt-outs verletzt, keine besondere Kategorien ohne Grundlage, Freistellung + Audit-Rechte.
– Nutzerinhalte (SaaS/UGC): klare AGB-Erlaubnis oder Default No-Training mit granularen Opt-ins; respektive Opt-out in Privacy-Settings; explizite Regeln für fein granulare Zwecke (z. B. „nur Qualitätsverbesserung“, „kein Drittmodell-Training“).
– Datenlieferanten (Annotation, Synthesis): Geheimhaltung, Urheber-/Leistungsschutz, personenbezogene Daten, Bias-/Qualitäts-KPIs, Rechte an Labels.

Technik & Prozesse
– Crawler/Loader respektieren tdm-reservation; Parser verpflichtend in die Pipeline.
– Sensitive-Data-Filter vor Aufnahme in Trainingskorpora; Hash/Heuristik/Regeln + menschliche Stichprobe.
– Betroffenenrechte: Such-/Suppressions-Funktion über Korpus und Artefakte; dokumentierter Widerspruchs- und Lösch-Prozess; differenziert für Trainings- vs. Evaluierungs-Sets und für Fine-Tuning-Adapter.
– Dataset-Provenance: Inhalte, Quellen-URL, Timestamp, Opt-out-Status, Lizenzpfad, Rechtsgrundlage; Unveränderlichkeit (z. B. WORM-Store) und Audit-Trail.
– Model-Level-Kontrollen: Red-Team-Eval für personenbezogene Ausgaben, Prompt-Guards, Throttling, Output-Transparenzhinweise.
– Security by Design: Zugriff/Keys, Segmentierung, Secret Management; Schutz vor Datenabflüssen und Poisoning; regelmäßige Audits.

 Umsetzungsschritte für Produkt-Teams: „Legal by Architecture“

Korpus-Design
– Erstes Sourcing nur aus Quellen ohne TDM-Vorbehalt bzw. mit Lizenz; technische Whitelists.
– Dediziertes Forschungs-Korpus getrennt von kommerziellem Korpus; § 60d-Nutzungen nicht ungeprüft in kommerzielle Pfade kippen.
– Rezidives Sampling vermeiden (wiederholte Ziehungen sensibler Inhalte), um Overfit auf personenbezogene Muster zu reduzieren.

Transparenz & Nutzersteuerung
– Bei Produkten mit Nutzer-Uploads granulare Einwilligungen/Opt-ins zum Training; Default restriktiv; separate Einwilligung für besondere Daten.
– Informationslayer für Scraping-Quellen und Betroffenenrechte; leicht auffindbare „Do-Not-Train“-Schaltflächen.

Evaluation & Betrieb
– Richtigkeit/Accuracy bei personenbeziehbaren Ausgaben adressieren; EDPB hebt Genauigkeitsanforderungen hervor.
– Inhaltszusammenfassung (AI Act) sorgfältig kuratieren: Kategorien, Quellenklassen, Lizenzwege, Opt-out-Respekt – ohne Geschäftsgeheimnisse zu entblößen.
– Incident-Response für Rechte-/Datenschutzverstöße: Intake-Kanal, Sofortmaßnahmen (Block/Suppress), Benachrichtigungen, Remediation.

Häufige Fehlannahmen – und wie sie vermieden werden

„Öffentlich zugänglich = frei trainierbar“ – falsch. Auch öffentlich verfügbare Inhalte sind urheber- und datenrechtlich geschützt. Es braucht TDM-Privileg oder Lizenz und DSGVO-Grundlage.

„robots.txt genügt als Opt-out“ – unzuverlässig. Das TDM-Reservierungs-Signal ist der bessere, auswertbare Weg.

„Einmal trainiert, nie mehr löschbar“ – so pauschal nicht. Ein Lösch-/Widerspruchsprozess kann an Korpus (Entfernung/Suppress), Artefakte (Filter/Adapter-Retraining) und Output-Steuerung anknüpfen; ob ein Modell-Retrain nötig ist, hängt vom Einzelfall ab (Verhältnismäßigkeit, technische Machbarkeit, Risiko).

„Forschungsklausel heilt alles“ – tut sie nicht. § 60d UrhG ist auf berechtigte Träger und rechtmäßigen Zugang begrenzt; Überführungen in kommerzielle Nutzung sind gesondert zu lizenzieren/zu prüfen.

Checkliste 2025: Von der Rechtstheorie zur Revisionssicherheit

  1. Datenquellen-Register mit Opt-out-Status (tdm-reservation), Rechtmäßigkeit, Lizenzpfad.
  2. TDM-Parser produktiv, Blocker für TDM-Vorbehalte aktiv.
  3. DSGVO-Grundlage ausgewiesen (Art. 6/9), LIA/DPIA dokumentiert, Transparenztexte verfügbar.
  4. Sensitive-Data-Mitigation vor Training, Ausschlusslisten aktuell.
  5. Betroffenenrechte-Prozess (Auskunft, Widerspruch, Löschung) end-to-end.
  6. AI-Act-GPAI: Copyright-Policy + Trainingsinhalts-Zusammenfassung implementiert; Code of Practice ggf. gezeichnet.
  7. Vertragliche Zusicherungen mit Content-/API-Partnern (Clearing, Freistellung, Audit).
  8. Audit-Trail für Sourcing, Training, Evaluierung, Releases; regelmäßige Management-Reviews.

Fazit

Rechtskonformes KI-Training ist kein Ratespiel, sondern Prozess- und Beweisdisziplin. Wer TDM-Opt-outs technisch respektiert, DSGVO-Pflichten organisatorisch abbildet und AI-Act-Transparenz substanziell erfüllt, reduziert Streit- und Sanktionsrisiken erheblich – und gewinnt zugleich die Grundlage, um mit Rechteinhabern planbar zu lizenzieren. Der operative Unterschied entsteht nicht in Grundsatzpapieren, sondern in Crawler-Logs, Parsern, Filtern, Policies und Verträgen, die dem Audit standhalten.

 

Marian Härtel
Author: Marian Härtel

Marian Härtel ist Rechtsanwalt und Fachanwalt für IT-Recht mit einer über 25-jährigen Erfahrung als Unternehmer und Berater in den Bereichen Games, E-Sport, Blockchain, SaaS und Künstliche Intelligenz. Seine Beratungsschwerpunkte umfassen neben dem IT-Recht insbesondere das Urheberrecht, Medienrecht sowie Wettbewerbsrecht. Er betreut schwerpunktmäßig Start-ups, Agenturen und Influencer, die er in strategischen Fragen, komplexen Vertragsangelegenheiten sowie bei Investitionsprojekten begleitet. Dabei zeichnet sich seine Beratung durch einen interdisziplinären Ansatz aus, der juristische Expertise und langjährige unternehmerische Erfahrung miteinander verbindet. Ziel seiner Tätigkeit ist stets, Mandanten praxisorientierte Lösungen anzubieten und rechtlich fundierte Unterstützung bei der Umsetzung innovativer Geschäftsmodelle zu gewährleisten.

Weitere spannende Blogposts

Schleswig-Holsteinisches Oberlandesgericht: Haftung bei gefälschten E-Mails mit Rechnungen

E-Rechnungspflicht ab 2025: BMF konkretisiert Vorgaben
5. Februar 2025

Gerade in der letzten Zeit habe ich eine Vielzahl von Fällen bearbeitet, in denen es um gehackte E-Mail-Server und relevante...

Mehr lesenDetails

Datenschutz ist Compliance – Bußgeldkatalog kommt?

LG München: Datenschutzeinwilligung auf Datingplattform
19. September 2019

Aktuell sehen viele, gerade auch Startups, wenn diese "Datenschutz" hören, nur den Umstand "Oh, ich muss noch auf den Generator...

Mehr lesenDetails

Esport Verein zur Förderung der Jugend?

Esport Verein zur Förderung der Jugend?
6. Dezember 2018

Wie schon in diesem Artikel erläutert, ist Dreh- und Angelpunkt bei der Beurteilung, ob ein Verein als gemeinnützig anerkannt werden...

Mehr lesenDetails

Ehrlichkeit und faire Preisgestaltung bei Startups (SaaS, Mobile Apps und digitale Dienste)

Ehrlichkeit und faire Preisgestaltung bei Startups (SaaS, Mobile Apps und digitale Dienste)
24. März 2025

Moderne Startups – insbesondere im Software-as-a-Service (SaaS)-Bereich, bei Mobile Apps und digitalen Dienstleistungen – stehen vor der Herausforderung, Preise ehrlich...

Mehr lesenDetails

Influencer: keine Kennzeichnung bei offensichtlicher Werbung

Rechtsform als Influencer? Ein paar Hinweise!
2. Juli 2020

Das OLG Hamburg hat entschieden, dass Influencer Beiträge mit Produktdarstellungen und Herstellerhinweisen nicht ausdrücklich als Werbung kennzeichnen müssen, wenn für...

Mehr lesenDetails

Agile-Entwicklungsverträge in der Praxis

E-Sport endlich gemeinnützig? Was der Regierungsentwurf zum Steueränderungsgesetz 2025 wirklich bringt
29. Oktober 2025

Ausgangslage und Einordnung Warum eigene Vertragslogik für Agile? Agile Softwareentwicklung arbeitet iterativ, inkrementell und empirisch. Anforderungen werden im Product Backlog...

Mehr lesenDetails

Besser keine Dickpicks per Social Media schicken!

Besser keine Dickpicks per Social Media schicken!
23. Juli 2019

Viele meiner Blogeinträge werden von Social Media Posts, von Fragen von Mandanten und dergleichen inspiriert. Heute gehört dazu ein Thema,...

Mehr lesenDetails

Geplante Rechtsänderungen 2023 im Bereich der Digitalisierung

Geplante Rechtsänderungen 2023 im Bereich der Digitalisierung
5. Januar 2023

Die Bundesregierung hat sich in ihrem Koalitionsvertrag die grundlegende Stärkung im Bereich Digitalisierung fest vorgenommen. Davon sind nahezu alle Lebensbereiche...

Mehr lesenDetails

Fractionalized Digital Assets und ihre Position im deutschen und europäischen Aufsichtsrecht

Fractionalized Digital Assets und ihre Position im deutschen und europäischen Aufsichtsrecht
13. Juli 2023

Einleitung In der sich ständig weiterentwickelnden Welt der digitalen Technologie sind fractionalized digital assets (FDAs) ein aufstrebendes Phänomen, das sowohl...

Mehr lesenDetails
Streaming-Setup, Influencer und Vertragsrecht
Sonstiges

Influencer: Wann aus Marketing plötzlich Handelsvertreterrecht wird

18. Februar 2026

Influencer-Marketing ist längst nicht mehr nur Imagepflege. In vielen Kampagnen geht es messbar um Abverkäufe, Leads, Abo-Abschlüsse und wiederkehrende Umsätze....

Mehr lesenDetails
Insolvenzverwalter und Zugang zu Finanzamtdaten?

NRW prüft Influencer – und plötzlich gelten ganz normale Regeln?

12. Februar 2026
iStock 1405433207 scaled

Rechtliche Fallstricke bei Revenue-Based Financing für Startups

12. Februar 2026
Streaming-Setup, Influencer und Vertragsrecht

Streaming-Setup, Influencer und Vertragsrecht

9. Februar 2026
Platform Cooperatives als Finanzierungs- und Geschäftsmodell

Platform Cooperatives als Finanzierungs- und Geschäftsmodell

8. Februar 2026

Produkte

  • Effiziente Arbeit mit KI in Kanzleien – Praxiswissen für die tägliche Mandatsarbeit Effiziente Arbeit mit KI in Kanzleien – Praxiswissen für die tägliche Mandatsarbeit
    Bewertet mit 5.00 von 5

    geprüfte Gesamtbewertungen

    49,99 €

    inkl. MwSt.

  • Absichtserklärung (Letter of Intent) für Startup-Investments Absichtserklärung (Letter of Intent) für Startup-Investments 5,99 € Ursprünglicher Preis war: 5,99 €0,00 €Aktueller Preis ist: 0,00 €.

    inkl. MwSt.

  • Videoberatung via Microsoft Teams 60 Minuten – Flexibel, unkompliziert und individuell Videoberatung via Microsoft Teams 60 Minuten – Flexibel, unkompliziert und individuell 327,25 €

    inkl. MwSt.

  • Praxisleitfaden Kanzleimarketing 2025 Digitale Sichtbarkeit und Mandantengewinnung für Anwält:innen Praxisleitfaden Kanzleimarketing 2025 Digitale Sichtbarkeit und Mandantengewinnung für Anwält:innen 49,99 €

    inkl. MwSt.

  • Kanzlei-Power-Bundle 2025: KI-Kompetenz & Sofort-Produktivität für Rechtsanwält:innen Kanzlei-Power-Bundle 2025: KI-Kompetenz & Sofort-Produktivität für Rechtsanwält:innen 99,99 €

    inkl. MwSt.

Podcastfolge

Rechtssichere Influencer-Agentur-Verträge: Strategien zur Vermeidung unerwarteter Kündigungen

Rechtssichere Influencer-Agentur-Verträge: Strategien zur Vermeidung unerwarteter Kündigungen

19. April 2025

Anna und Max sprechen in dieser Episode über typische Fallstricke und Gestaltungsmöglichkeiten bei Verträgen zwischen Influencern und Agenturen. Im Mittelpunkt...

Mehr lesenDetails
Rechtliche Herausforderungen und Chancen durch KI-Influencer und virtuelle Mitarbeitende

Rechtliche Herausforderungen und Chancen durch KI-Influencer und virtuelle Mitarbeitende

19. April 2025
Rechtskette beim Spieleentwickler

Rechtskette beim Spieleentwickler

19. April 2025
eda7ba83 c559 4e68 8441 41159a0751f3

Blitzskalierung und rechtliche Herausforderungen: Der Balanceakt für Startups

20. April 2025
Digitale Souveränität: Europas Weg in eine selbstbestimmte digitale Zukunft

Digitale Souveränität: Europas Weg in eine selbstbestimmte digitale Zukunft

12. November 2024

Video

Mein transparente Abrechnung

Mein transparente Abrechnung

10. Februar 2025

In diesem Video rede ich ein wenig über transparente Abrechnung und wie ich kommuniziere, was es kostet, wenn man mit...

Mehr lesenDetails
Faszination zwischen und Recht und Technologie

Faszination zwischen und Recht und Technologie

10. Februar 2025
Meine zwei größten Herausforderungen sind?

Meine zwei größten Herausforderungen sind?

10. Februar 2025
Was mich wirklich freut

Was mich wirklich freut

10. Februar 2025
Was ich an meinem Job liebe!

Was ich an meinem Job liebe!

10. Februar 2025
  • Datenschutzerklärung
  • Impressum
  • Kontaktaufnahme
  • Über Rechtsanwalt Marian Härtel
Marian Härtel, Rathenaustr. 58a, 14612 Falkensee, info@itmedialaw.com

Marian Härtel - Rechtsanwalt für IT-Recht, Medienrecht und Startups, mit einem Fokus auf innovative Geschäftsmodelle, Games, KI und Finanzierungsberatung.

Willkommen zurück!

Loggen Sie sich unten in Ihr Konto ein

Haben Sie Ihr Passwort vergessen? Anmeldung

Neues Konto erstellen!

Füllen Sie die nachstehenden Formulare aus, um sich zu registrieren

Alle Felder sind erforderlich. Einloggen

Ihr Passwort abrufen

Bitte geben Sie Ihren Benutzernamen oder Ihre E-Mail-Adresse ein, um Ihr Passwort zurückzusetzen.

Einloggen
  • Informationen
    • Leistungen
      • Betreuung und Beratung von Agenturen
      • Vertragsprüfung- und erstellung
      • Beratung zum Games-Recht
      • Beratung für Influencer und Streamer
      • Beratung im E-Commerce
      • Beratung zu DLT und Blockchain
      • Rechtsberatung im Gesellschaftsrecht
      • Legal Compliance und Gutachten
      • Outsourcing – für Unternehmen oder Kanzleien
      • Buchung als Speaker
    • Schwerpunkte
      • Focus auf Startups
      • Investmentberatung
      • Unternehmensrecht
      • Kryptowährungen, Blockchain und Games
      • KI und SaaS
      • Streamer und Influencer
      • Games- und Esportrecht
      • IT/IP-Recht
      • Kanzlei für GMBH,UG, GbR
      • Kanzlei für IT/IP und Medienrecht
    • Idealer Partner
    • Über Rechtsanwalt Marian Härtel
    • Schnell und flexibel erreichbar
    • Prinzipien als Rechtsanwalt
    • Warum Rechtsanwalt und Unternehmensberater?
    • Der Alltag eines IT-Rechtsanwalts
    • Wie kann ich Mandanten helfen?
    • Testimonials
    • Team: Saskia Härtel – WER BIN ICH?
    • Agile und leane Kanzlei
    • Preisübersicht
    • Sonstiges
      • AGB
      • Datenschutzerklärung
      • Widerrufserklärung
      • Impressum
  • News
    • Glosse / Meinung
    • Recht im Internet
    • Onlinehandel
    • Recht und Computerspiele
    • Recht und Esport
    • Blockchain und Web 3 Recht
    • Datenschutzrecht
    • Urheberrecht
    • Arbeitsrecht
    • Wettbewerbsrecht
    • Gesellschaftsrecht
    • EU-Recht
    • Jugendschutzrecht
    • Steuerrecht
    • Sonstiges
    • Intern
  • Podcast
    • ITMediaLaw Kurz-Podcast
    • ITMediaLaw Podcast
  • Wissen
    • Gesetze
    • Juristische Begriffe
    • Vertragstypen
    • Klauseltypen
    • Finanzierungsformen und Begriffe
    • Juristische Mittel
    • Behörden / Institutionen
    • Gesellschaftsformen
    • Steuerrecht
    • Konzepte
  • Videos
    • Informationsvideos – über Marian Härtel
    • Videos – über mich (Couch)
    • Blogpost – einzelne Videos
    • Videos zu Dienstleistungen
    • Shorts
    • Podcast Format
    • Drittanbietervideos
    • Sonstige Videos
  • Kontaktaufnahme
  • Shop / Downloads / Community
    • Downloads und Dienstleistungen
      • Beratung
      • Seminare
      • E-Books
      • Freebies
      • Vertragsmuster
      • Bundle
    • Profil / Verwaltung
      • Bestellungen
      • Downloads
      • Rechnungsadresse
      • Zahlungsarten
    • Kasse
    • Warenkorb
    • Support
    • FAQ Shop
  • en English
  • de Deutsch
Kostenlose Kurzberatung