• Aktuellste News
  • Gerade im Trend...
Legal Wiki statt blindem RAG

Legal Wiki statt blindem RAG

8. April 2026
Epic Games‘ Sieg im Kartellrechtsstreit gegen Google Play Store: Ein Wendepunkt für die App-Ökonomie?

EuGH zu Spielgold und In-Game-Assets

27. März 2026
Ein Bleistift im Influencer-Stil.

Kommentarspalten als Haftungsfalle: Welche rechtlichen Risiken Influencer bei Pornospam, Scam und strafbaren Inhalten eingehen

23. März 2026
Achtung vor Fake-Streamingangeboten

Christian Ulmen, KI-Deepfakes und „digitale Vergewaltigung“

21. März 2026
Wegweisendes Urteil zu KI-Trainingsdaten - LG Hamburg setzt Maßstäbe

Forschungszulage und Erfolgsprovision: Wann Unternehmen sechsstellige Forderungen nicht zahlen müssen

20. März 2026
Was ist bei Gewinnspielen auf Social Media zu beachten?

Gewinnspiele im Marketing: Wann ein Abbruch zulässig ist

10. März 2026
Digitalisierung der Vertragserstellung und Mandantenkommunikation

Vibe Coding in Marketingagenturen – rechtliche Einordnung, Haftung für Bugs und Anforderungen an eine belastbare Vertragsgestaltung

9. März 2026
BGH hält Uber Black für wettbewerbswidrig

Fernunterricht, Coaching und synchrone Online-Formate

2. März 2026

Manipulierte QR-Codes und Quishing

27. Februar 2026
KI-Agenten als autonome Vertragspartner?

KI-Agenten als autonome Vertragspartner?

26. Februar 2026
Platform Cooperatives als Finanzierungs- und Geschäftsmodell

AI-Training-Daten als Vermögenswert: Bilanzierung, IP-Strategie und Exit-Faktor

25. Februar 2026
Streaming-Setup, Influencer und Vertragsrecht

Influencer: Wann aus Marketing plötzlich Handelsvertreterrecht wird

18. Februar 2026
Insolvenzverwalter und Zugang zu Finanzamtdaten?

NRW prüft Influencer – und plötzlich gelten ganz normale Regeln?

12. Februar 2026

NRW audits influencers – and suddenly normal rules apply?

12. Februar 2026

Rechtliche Fallstricke bei Revenue-Based Financing für Startups

12. Februar 2026
Streaming-Setup, Influencer und Vertragsrecht

Streaming-Setup, Influencer und Vertragsrecht

9. Februar 2026
Platform Cooperatives als Finanzierungs- und Geschäftsmodell

Platform Cooperatives als Finanzierungs- und Geschäftsmodell

8. Februar 2026
Landgericht Frankfurt a.M weicht Influencer-Rechtsprechung auf

Umsatzsteuer auf Donations, Spenden und „Support“ bei Influencern?

5. Februar 2026
Kammergericht zu Unterlassungspflichten bei Handlungen Dritter

Gerichtsstand im Vertrag: Ein Wort zu viel, ein Wort zu wenig

4. Februar 2026

Jurisdiction in the contract: one word too many, one word too few

4. Februar 2026
Neue Infos zum Status des Medienstaatsvertrages

Kundenhotline und Support im SaaS

2. Februar 2026
  • Mehr als 3 Millionen Wörter Inhalt
  • |
  • info@itmedialaw.com
  • |
  • Tel: 03322 5078053
  • |
  • LinkedIn
  • |
  • Discord
  • |
  • WhatsApp
Kurzberatung
Rechtsanwalt Marian Härtel - ITMediaLaw

Es befinden sich keine Produkte im Warenkorb.

  • en English
  • de Deutsch
  • Informationen
    • Leistungen
      • Betreuung und Beratung von Agenturen
      • Vertragsprüfung- und erstellung
      • Beratung zum Games-Recht
      • Beratung für Influencer und Streamer
      • Beratung im E-Commerce
      • Beratung zu DLT und Blockchain
      • Rechtsberatung im Gesellschaftsrecht
      • Legal Compliance und Gutachten
      • Outsourcing – für Unternehmen oder Kanzleien
      • Buchung als Speaker
    • Schwerpunkte
      • Focus auf Startups
      • Investmentberatung
      • Unternehmensrecht
      • Kryptowährungen, Blockchain und Games
      • KI und SaaS
      • Streamer und Influencer
      • Games- und Esportrecht
      • IT/IP-Recht
      • Kanzlei für GMBH,UG, GbR
      • Kanzlei für IT/IP und Medienrecht
    • Idealer Partner
    • Über Rechtsanwalt Marian Härtel
    • Schnell und flexibel erreichbar
    • Prinzipien als Rechtsanwalt
    • Warum Rechtsanwalt und Unternehmensberater?
    • Der Alltag eines IT-Rechtsanwalts
    • Wie kann ich Mandanten helfen?
    • Testimonials
    • Team: Saskia Härtel – WER BIN ICH?
    • Agile und leane Kanzlei
    • Preisübersicht
    • Sonstiges
      • AGB
      • Datenschutzerklärung
      • Widerrufserklärung
      • Impressum
  • News
    • Glosse / Meinung
    • Recht im Internet
    • Onlinehandel
    • Recht und Computerspiele
    • Recht und Esport
    • Blockchain und Web 3 Recht
    • Datenschutzrecht
    • Urheberrecht
    • Arbeitsrecht
    • Wettbewerbsrecht
    • Gesellschaftsrecht
    • EU-Recht
    • Jugendschutzrecht
    • Steuerrecht
    • Sonstiges
    • Intern
  • Podcast
    • ITMediaLaw Kurz-Podcast
    • ITMediaLaw Podcast
  • Wissen
    • Gesetze
    • Juristische Begriffe
    • Vertragstypen
    • Klauseltypen
    • Finanzierungsformen und Begriffe
    • Juristische Mittel
    • Behörden / Institutionen
    • Gesellschaftsformen
    • Steuerrecht
    • Konzepte
  • Videos
    • Informationsvideos – über Marian Härtel
    • Videos – über mich (Couch)
    • Blogpost – einzelne Videos
    • Videos zu Dienstleistungen
    • Shorts
    • Podcast Format
    • Drittanbietervideos
    • Sonstige Videos
  • Kontaktaufnahme
  • Shop / Downloads / Community
    • Downloads und Dienstleistungen
      • Beratung
      • Seminare
      • E-Books
      • Freebies
      • Vertragsmuster
      • Bundle
    • Profil / Verwaltung
      • Bestellungen
      • Downloads
      • Rechnungsadresse
      • Zahlungsarten
    • Kasse
    • Warenkorb
    • Support
    • FAQ Shop
  • Informationen
    • Leistungen
      • Betreuung und Beratung von Agenturen
      • Vertragsprüfung- und erstellung
      • Beratung zum Games-Recht
      • Beratung für Influencer und Streamer
      • Beratung im E-Commerce
      • Beratung zu DLT und Blockchain
      • Rechtsberatung im Gesellschaftsrecht
      • Legal Compliance und Gutachten
      • Outsourcing – für Unternehmen oder Kanzleien
      • Buchung als Speaker
    • Schwerpunkte
      • Focus auf Startups
      • Investmentberatung
      • Unternehmensrecht
      • Kryptowährungen, Blockchain und Games
      • KI und SaaS
      • Streamer und Influencer
      • Games- und Esportrecht
      • IT/IP-Recht
      • Kanzlei für GMBH,UG, GbR
      • Kanzlei für IT/IP und Medienrecht
    • Idealer Partner
    • Über Rechtsanwalt Marian Härtel
    • Schnell und flexibel erreichbar
    • Prinzipien als Rechtsanwalt
    • Warum Rechtsanwalt und Unternehmensberater?
    • Der Alltag eines IT-Rechtsanwalts
    • Wie kann ich Mandanten helfen?
    • Testimonials
    • Team: Saskia Härtel – WER BIN ICH?
    • Agile und leane Kanzlei
    • Preisübersicht
    • Sonstiges
      • AGB
      • Datenschutzerklärung
      • Widerrufserklärung
      • Impressum
  • News
    • Glosse / Meinung
    • Recht im Internet
    • Onlinehandel
    • Recht und Computerspiele
    • Recht und Esport
    • Blockchain und Web 3 Recht
    • Datenschutzrecht
    • Urheberrecht
    • Arbeitsrecht
    • Wettbewerbsrecht
    • Gesellschaftsrecht
    • EU-Recht
    • Jugendschutzrecht
    • Steuerrecht
    • Sonstiges
    • Intern
  • Podcast
    • ITMediaLaw Kurz-Podcast
    • ITMediaLaw Podcast
  • Wissen
    • Gesetze
    • Juristische Begriffe
    • Vertragstypen
    • Klauseltypen
    • Finanzierungsformen und Begriffe
    • Juristische Mittel
    • Behörden / Institutionen
    • Gesellschaftsformen
    • Steuerrecht
    • Konzepte
  • Videos
    • Informationsvideos – über Marian Härtel
    • Videos – über mich (Couch)
    • Blogpost – einzelne Videos
    • Videos zu Dienstleistungen
    • Shorts
    • Podcast Format
    • Drittanbietervideos
    • Sonstige Videos
  • Kontaktaufnahme
  • Shop / Downloads / Community
    • Downloads und Dienstleistungen
      • Beratung
      • Seminare
      • E-Books
      • Freebies
      • Vertragsmuster
      • Bundle
    • Profil / Verwaltung
      • Bestellungen
      • Downloads
      • Rechnungsadresse
      • Zahlungsarten
    • Kasse
    • Warenkorb
    • Support
    • FAQ Shop
Rechtsanwalt Marian Härtel - ITMediaLaw

Legal Wiki statt blindem RAG

Was Startups bei KI, Scraping, Bots, SEO und Agenturverträgen wirklich beachten müssen

8. April 2026
in Sonstiges
Lesezeit: 11 Minuten Lesezeit
0 0
A A
0

Die aktuelle Diskussion rund um Legal AI, Akten-Wikis und wissensbasierte Systeme zeigt sehr deutlich: Es geht längst nicht mehr nur darum, möglichst viele PDFs in ein System zu kippen und anschließend mit Retrieval-Augmented Generation, also RAG, ein paar brauchbare Antworten herauszubekommen. Die bessere Frage lautet heute: Wie baut man ein belastbares, skalierbares und rechtlich sauberes Wissenssystem, das für Startups, Agenturen und digitale Geschäftsmodelle wirklich funktioniert?

Inhaltsverzeichnis Verbergen
1. 1. Warum das Wiki-Konzept gerade jetzt stärker wird
2. 2. Was ein Legal Wiki von einer Dokumentensammlung unterscheidet
3. 3. Warum Legal AI ohne saubere Daten- und Quellenlogik gefährlich wird
4. 4. Scraping, Crawling und Botnutzung: Die eigentliche Baustelle hinter vielen KI-Projekten
5. 5. Was darf ich eigentlich „scrollen“ und was darf ich speichern?
6. 6. Interne Wikis sind nicht dasselbe wie öffentliche Wikis
7. 7. Wie ein Startup sein internes Wiki rechtssicher aufbaut
8. 8. Was beim öffentlichen Legal Wiki zusätzlich zu beachten ist
9. 9. SEO für Legal Wikis: Sichtbarkeit aufbauen, ohne fremde Inhalte zu ersetzen
10. 10. Was Startups beim Einsatz von Open Models, APIs und Toolchains beachten müssen
11. 11. Agenturverträge: Der unterschätzte Hebel für rechtssichere KI-Projekte
12. 12. Welche Punkte in einem Agenturvertrag für Legal-AI- oder Wiki-Projekte nicht fehlen dürfen
13. 13. Warum gerade hier Mandate entstehen
14. 14. Wie ein belastbares Setup in der Praxis aussehen kann
15. 15. Fazit: Nicht die KI allein ist der Hebel, sondern die Wissensarchitektur
15.1. Author: Marian Härtel

Genau hier wird das Konzept des Wikis spannender als die klassische Dateiliste und oft auch wertvoller als ein rein technisch gedachtes RAG-Setup. Ein gut gebautes Wiki ist kein Dokumentenfriedhof. Es ist ein strukturierter Wissensraum mit Quellen, Beziehungen, Zuständigkeiten, Rechten, Statuslogiken und Versionen. Und genau diese Struktur ist der Punkt, an dem sich die rechtlichen Fragen mit der Produktfrage verbinden.

Denn sobald Startups anfangen, mit KI interne Wissenssysteme aufzubauen, externe Inhalte zu verarbeiten, Bots einzusetzen, Websites zu crawlen, Daten für ein öffentliches oder internes Wiki zu strukturieren oder Agenturen mit dem Aufbau solcher Systeme zu beauftragen, tauchen sofort eine Reihe juristischer Folgefragen auf. Was darf ich scrapen? Was ist beim Crawling erlaubt? Welche Inhalte darf ich in ein internes Wiki übernehmen? Welche Unterschiede gibt es zwischen einem internen Wissenssystem und einem öffentlichen Legal Wiki? Was darf ich mit SEO machen, wenn Inhalte maschinell angereichert oder systematisch strukturiert werden? Und was muss vertraglich geregelt sein, wenn Agenturen, Freelancer oder externe Entwickler an so einem System arbeiten?

Dieser Beitrag verbindet genau diese Ebenen. Er soll nicht nur ein technischer oder juristischer Überblick sein, sondern eine strategische Einordnung für Unternehmen, die mit KI, Open-Source-Modellen, Bot-Infrastrukturen oder externen Datensammlungen arbeiten und daraus ein funktionierendes Wissensprodukt machen wollen.

1. Warum das Wiki-Konzept gerade jetzt stärker wird

Viele Teams starten beim Thema Legal AI oder Wissensmanagement mit einem sehr einfachen Gedankengang: Wir haben Dateien, also brauchen wir eine Suche. Danach kommt meist die nächste Stufe: Wir haben eine Suche, also koppeln wir ein Sprachmodell daran. Das Ergebnis ist dann ein klassisches RAG-System.

Das Problem daran ist nicht, dass RAG technisch schlecht wäre. Das Problem ist, dass RAG oft als Lösung für ein Problem eingesetzt wird, das eigentlich woanders liegt. Die eigentliche Herausforderung ist nämlich fast nie nur der Zugriff auf Text. Die eigentliche Herausforderung ist die Organisation von Wissen.

Eine Dateiliste ist aus juristischer und organisatorischer Sicht fast immer ein schwaches Modell. Dateien sagen nichts über Priorität, Gültigkeit, Aktualität, Verantwortlichkeit, Zusammenhang oder zulässige Nutzung aus. Ein PDF kann hochrelevant, veraltet, intern vertraulich, öffentlich frei nutzbar oder rechtlich problematisch sein. In einer Dateiliste sehen diese Zustände häufig gleich aus. In einem Wiki hingegen lassen sie sich systematisch abbilden.

Ein Wiki ist damit nicht einfach eine Sammlung von Seiten. Es ist ein Kontrollsystem für Wissen. Es ordnet Inhalte, trennt Rohmaterial von freigegebenen Inhalten, macht Quellenbezüge sichtbar und schafft dadurch eine Struktur, die nicht nur für Menschen besser lesbar ist, sondern auch für KI-Systeme deutlich belastbarer wird.

Der große Vorteil für Startups ist: Wer früh mit einem Wiki-orientierten Modell arbeitet, baut nicht nur einen schlauen Bot, sondern eine Wissensarchitektur. Und genau diese Wissensarchitektur entscheidet später darüber, ob das System skalierbar, investorenfähig, compliance-tauglich und mandatsfähig ist.

2. Was ein Legal Wiki von einer Dokumentensammlung unterscheidet

Im Alltag wird oft unterschätzt, wie groß der Unterschied zwischen abgelegten Dokumenten und strukturiertem Wissen tatsächlich ist. Eine Dokumentensammlung ist zunächst nur ein Speicherort. Ein Wiki ist ein Beziehungsraum.

In einer Dokumentensammlung werden Inhalte meistens nach Ordnerlogik abgelegt. Das kann für eine kleine Arbeitsgruppe noch funktionieren, scheitert aber sehr schnell, wenn mehrere Personen parallel arbeiten, Inhalte versioniert werden müssen oder KI auf diese Inhalte zugreifen soll. Denn dann stellt sich sofort die Frage, welche Version gilt, welche Inhalte freigegeben sind, welche Aussagen nur Entwürfe sind, welche Texte aus externen Quellen stammen und welche Daten intern nicht öffentlich verwendet werden dürfen.

Ein Legal Wiki löst dieses Problem, indem es Informationen nicht nur speichert, sondern qualifiziert. Ein Eintrag ist dann nicht einfach ein Text, sondern eine Aussage mit Herkunft, Status, Zusammenhang und Verantwortlichkeit. Genau das ist für juristische oder compliance-nahe Systeme zentral.

Für Startups bedeutet das: Wer ein internes Wissenssystem baut, sollte nicht primär fragen, welches Modell am besten antwortet. Die bessere erste Frage lautet: Welche Struktur geben wir unserem Wissen, damit ein Modell später überhaupt belastbar damit arbeiten kann?

3. Warum Legal AI ohne saubere Daten- und Quellenlogik gefährlich wird

Der Markt rund um Legal AI entwickelt sich derzeit mit enormer Geschwindigkeit. Überall wird versprochen, dass KI Recherche, Vertragsprüfung, Wissensaufbau, Inhaltszusammenfassung und interne Organisation schneller und billiger macht. Das stimmt zum Teil auch. Aber Geschwindigkeit ist nicht dasselbe wie Qualität. Und rechtlich zulässig ist das technisch Machbare ohnehin nicht automatisch.

Sobald Inhalte in ein System eingespeist werden, stellt sich die Frage nach der Herkunft. Sobald eine Maschine Zusammenfassungen erzeugt, stellt sich die Frage nach der Qualität. Sobald Inhalte angezeigt, verlinkt, indiziert oder weiterverwendet werden, stellt sich die Frage nach Nutzungsrechten, Urheberrecht, Datenbankschutz, Datenschutz und Wettbewerbsrecht.

Gerade bei Startups entsteht hier oft ein gefährlicher Denkfehler. Viele Gründer gehen davon aus, dass ein internes Tool schon deshalb rechtlich harmlos sei, weil es nicht sofort öffentlich sichtbar ist. Das ist zu kurz gedacht. Auch interne Systeme können problematisch sein, wenn sie personenbezogene Daten falsch verarbeiten, fremde Inhalte ohne Grundlage kopieren oder Datenquellen so nutzen, dass spätere externe Nutzung bereits angelegt ist.

Das heißt nicht, dass man kein internes AI-Wiki bauen darf. Im Gegenteil. Es heißt nur, dass man den Aufbau nicht wie ein Bastelprojekt behandeln sollte. Wer Legal AI ernsthaft als Produkt oder Prozess einsetzt, braucht eine klare Trennung zwischen Datengewinnung, Datenaufbereitung, Wissensfreigabe und öffentlicher Darstellung.

4. Scraping, Crawling und Botnutzung: Die eigentliche Baustelle hinter vielen KI-Projekten

Einer der sensibelsten Bereiche bei modernen Wissenssystemen ist die Frage, wie Daten überhaupt in das System gelangen. Viele Projekte scheitern rechtlich nicht an der KI, sondern an der Datenerhebung davor.

In der Praxis geht es meist um drei Dinge: Scraping, Crawling und Botnutzung.

Scraping meint typischerweise das automatisierte Auslesen von Inhalten aus Websites oder Plattformen. Crawling beschreibt das systematische Durchlaufen von Seiten, um Inhalte zu erfassen oder zu indexieren. Botnutzung meint technische Prozesse, die automatisiert auf Inhalte zugreifen, sei es über Browser-Simulation, Requests, APIs oder andere Schnittstellen.

Juristisch kommt es dabei nicht nur auf die Technik an, sondern auf die konkrete Art der Nutzung. Eine Website zu lesen, ist nicht dasselbe wie eine Website automatisiert in großem Stil zu erfassen. Eine Quelle anzusehen, ist nicht dasselbe wie eine eigene Datenbank daraus aufzubauen. Eine Information zu referenzieren, ist nicht dasselbe wie Inhalte zu kopieren, umzuschreiben und als Teil eines eigenen Angebots bereitzustellen.

Besonders heikel wird es dort, wo technische Maßnahmen umgangen werden. Wenn Paywalls, Logins, Sperren, Rate-Limits, Zugriffsbeschränkungen oder Schutzmechanismen bewusst umgangen werden, steigt das Risiko deutlich. Auch dort, wo fremde Inhalte in einer Form übernommen werden, die das Original wirtschaftlich ersetzt, wird es regelmäßig problematisch.

Startups sollten sich daher von der Illusion verabschieden, dass alles frei nutzbar sei, was öffentlich im Netz steht. Öffentlich sichtbar bedeutet nicht automatisch frei kopierbar, frei indizierbar oder frei zur Weiterverarbeitung in Bots und Wikis geeignet.

5. Was darf ich eigentlich „scrollen“ und was darf ich speichern?

Die Frage klingt banal, ist aber in vielen Projekten zentral. Denn technisch verschwimmt die Grenze zwischen normalem Nutzen und automatisiertem Auslesen oft sehr schnell.

Rein faktisch darf ein Mensch Websites anschauen, lesen und durchscrollen. Problematisch wird es dort, wo aus einem Lesevorgang ein Erfassungsvorgang wird. Sobald Inhalte automatisiert geladen, strukturiert, gespeichert, analysiert und in einem neuen System wiedergegeben werden, ist man nicht mehr bei bloßem Konsum, sondern bei Weiterverarbeitung.

Für die rechtliche Bewertung ist deshalb entscheidend, was mit dem abgerufenen Inhalt passiert. Wer Informationen lediglich zur Kenntnis nimmt, steht anders da als jemand, der dieselben Informationen automatisiert in eine eigene Wissensdatenbank überführt. Noch einmal anders liegt der Fall, wenn diese Daten später öffentlich durchsuchbar gemacht oder in einem Bot ausgespielt werden.

Die zentrale Leitlinie für Unternehmen lautet daher: Lesen ist nicht gleich Verwerten. Und Verwerten ist nicht gleich Veröffentlichen. Jede zusätzliche Stufe erhöht die rechtlichen Anforderungen.

6. Interne Wikis sind nicht dasselbe wie öffentliche Wikis

Ein ganz wesentlicher Unterschied liegt darin, ob ein Wiki rein intern genutzt wird oder ob es öffentlich oder halböffentlich zugänglich ist. Viele Gründer vermischen diese Ebenen zu schnell.

Ein internes Wiki dient in erster Linie dem Wissensaufbau im Unternehmen. Hier geht es um Prozesse, Notizen, interne Leitfäden, Projektwissen, Vertragsmuster, Marktanalysen, Produktinformationen oder auch rechtliche Einordnungen. Ein solches System kann rechtlich leichter beherrschbar sein, wenn sauber dokumentiert wird, welche Inhalte hineinfließen und welche Zugriffsrechte gelten.

Ein öffentliches Wiki ist etwas anderes. Sobald externe Nutzer Inhalte abrufen können, entsteht eine ganz andere Risikolage. Dann geht es nicht nur um interne Nutzungslogik, sondern um öffentliche Zugänglichmachung, urheberrechtliche Relevanz, Wettbewerbsfragen, Persönlichkeitsrechte, Transparenzpflichten und gegebenenfalls auch um Plattformverantwortung.

Wer also ein internes KI-Wiki baut und mittelfristig daraus ein öffentliches Wissensprodukt machen will, sollte das von Anfang an mitdenken. Die saubere Lösung besteht darin, Inhalte von Beginn an nach Freigabestatus zu trennen. Es muss klar sein, was nur intern nutzbar ist, was extern zitiert werden darf und was tatsächlich als öffentliches Wissensangebot erscheinen soll.

7. Wie ein Startup sein internes Wiki rechtssicher aufbaut

Ein funktionierendes internes Wiki braucht kein perfektes Großkonzept, aber es braucht klare Grundregeln. In der Praxis sollte jedes Startup, das mit KI und Wissensstrukturen arbeitet, zumindest folgende Fragen sauber beantworten:

Erstens: Welche Quellen fließen überhaupt in das System ein?
Zweitens: Wer darf Inhalte importieren, ändern und freigeben?
Drittens: Welche Inhalte sind sensibel, personenbezogen oder vertraulich?
Viertens: Welche Inhalte dürfen in KI-Antworten verwendet werden und welche nicht?
Fünftens: Welche Inhalte können später öffentlich gemacht werden?

Sobald diese Fragen nicht beantwortet sind, entsteht ein typisches Risiko: Das Team baut schnell ein leistungsfähiges System, aber niemand weiß mehr genau, was darin steckt. Spätestens wenn Investoren, Kunden, Partner oder Anwälte darauf schauen, wird aus einem technologischen Vorsprung plötzlich ein Haftungsthema.

Die bessere Lösung ist ein einfaches Governance-Modell. Jede Seite oder jedes Wissenselement bekommt mindestens einen Quellennachweis, einen Bearbeitungsstatus und eine Freigabestufe. Außerdem sollte nachvollziehbar sein, wann Inhalte zuletzt geprüft wurden und durch wen. So entsteht eine Struktur, die sowohl menschlich nutzbar als auch KI-fähig ist.

8. Was beim öffentlichen Legal Wiki zusätzlich zu beachten ist

Sobald Inhalte nicht nur intern verwendet, sondern auch nach außen dargestellt werden, treten weitere Rechtsfragen in den Vordergrund. Dazu gehören unter anderem die Zulässigkeit der öffentlichen Wiedergabe, die Reichweite von Zitaten, die Frage der urheberrechtlichen Schutzfähigkeit, die Nutzung fremder Datenbanken und die Darstellung personenbezogener Informationen.

Öffentliche Legal Wikis sind deshalb nur dann ein starkes Geschäftsmodell, wenn sie klar auf eigener Leistung beruhen. Das heißt praktisch: nicht einfach fremde Inhalte spiegeln, sondern eigene Aufbereitung, eigene Analyse, eigene Systematik, eigene Einordnung und eine nachvollziehbare Quellenkultur schaffen.

Für SEO und Markenaufbau ist genau das ohnehin die bessere Strategie. Ein öffentliches Wiki wird dann stark, wenn es nicht nur Informationen reproduziert, sondern Komplexität reduziert. Nutzer wollen nicht die hundertste Sammlung von Textbausteinen. Sie wollen Orientierung, Systematik und Vertrauenswürdigkeit. Genau das ist der Punkt, an dem Produktdenken und Rechtsdenken zusammenlaufen.

9. SEO für Legal Wikis: Sichtbarkeit aufbauen, ohne fremde Inhalte zu ersetzen

SEO ist für solche Systeme ein riesiger Hebel. Gleichzeitig ist SEO dort besonders riskant, wo Unternehmen versuchen, Reichweite durch massenhafte Übernahme fremder Inhalte zu gewinnen.

Die sichere und langfristig ohnehin bessere Strategie lautet: Sichtbarkeit entsteht durch eigene Strukturleistung, nicht durch bloße Wiederholung. Ein Legal Wiki kann SEO-stark sein, wenn es Begriffe erklärt, Zusammenhänge herstellt, klare Seitenstrukturen anbietet, häufige Fragen beantwortet, Standards einordnet und technische sowie rechtliche Themen verständlich macht.

Problematisch wird es dort, wo das System fremde Seiten faktisch ersetzt. Wer fremde Inhalte systematisch übernimmt, in eine neue Suchlogik packt und dann mit Suchmaschinenreichweite monetarisiert, bewegt sich in einer deutlich heikleren Zone.

Das bedeutet nicht, dass man keine Quellen nutzen darf. Im Gegenteil. Quellen sind wichtig. Aber Quellen sollten als Quellen erkennbar bleiben. Der Mehrwert muss in der eigenen Verarbeitung liegen. Wer das sauber macht, stärkt nicht nur seine rechtliche Position, sondern baut auch die bessere Marke auf.

10. Was Startups beim Einsatz von Open Models, APIs und Toolchains beachten müssen

Viele Teams bauen ihr System heute modular. Statt einer monolithischen Plattform nutzen sie Open-Source-Modelle, APIs, Vektordatenbanken, Browser-Tools, Crawler, Automatisierungsplattformen und eigene Skripte. Technisch ist das effizient. Rechtlich bedeutet es aber auch: Die Verantwortung verteilt sich nicht automatisch auf die Anbieter.

Ein häufiger Fehler ist die Annahme, dass der Einsatz einer API oder eines bekannten Tools bereits rechtliche Sicherheit erzeugt. Das stimmt so nicht. Auch wenn der technische Zugriff bequem ist, muss weiter geprüft werden, welche Daten verarbeitet werden, welche Lizenzbedingungen gelten, ob Daten zu Trainingszwecken weiterverwendet werden, ob personenbezogene Daten im Spiel sind und welche Zugriffsrechte tatsächlich bestehen.

Je modularer das Setup, desto wichtiger ist deshalb eine klare Dokumentation der Datenflüsse. Es muss nachvollziehbar sein, welche Daten woher stammen, wohin sie übertragen werden, wie lange sie gespeichert werden und wer auf sie zugreifen kann. Nur so lässt sich später verlässlich beantworten, ob ein System datenschutzkonform, urheberrechtlich sauber und vertraglich ausreichend abgesichert ist.

11. Agenturverträge: Der unterschätzte Hebel für rechtssichere KI-Projekte

Spätestens wenn externe Entwickler, Agenturen oder Freelancer an Bord kommen, entscheidet der Vertrag darüber, ob ein Projekt tragfähig ist oder nicht. Gerade bei KI-, Wiki- und Datenprojekten sind Agenturverträge oft erschreckend oberflächlich. Es wird über Features gesprochen, aber nicht über Datenherkunft. Es wird über UX gesprochen, aber nicht über Rechte. Es wird über Launch-Termine gesprochen, aber nicht über Haftung, Dokumentation und Freigabelogik.

Ein sauberer Vertrag für ein solches Projekt muss deutlich mehr abdecken als nur die technische Umsetzung. Er sollte klar regeln, welche Leistungen geschuldet sind, welche Datenquellen verwendet werden dürfen, wer die Rechte an importierten oder erzeugten Inhalten trägt, wie mit personenbezogenen Daten umzugehen ist, welche Dokumentation zu liefern ist und wie mit unklaren oder problematischen Quellen umgegangen wird.

Besonders wichtig ist dabei die Frage, wer die Verantwortung für die Rechtmäßigkeit der Datenbasis trägt. Wenn eine Agentur Datenquellen auswählt, Crawler einrichtet oder Content-Importe organisiert, muss vertraglich geklärt sein, nach welchen Regeln das geschieht. Genauso wichtig ist umgekehrt, dass der Auftraggeber nicht stillschweigend davon ausgeht, alles werde schon rechtlich in Ordnung sein, nur weil es technisch funktioniert.

12. Welche Punkte in einem Agenturvertrag für Legal-AI- oder Wiki-Projekte nicht fehlen dürfen

Wer ein solches Projekt beauftragt, sollte in Verträgen zumindest die folgenden Themen sauber regeln:

Zunächst braucht es eine präzise Leistungsbeschreibung. Es muss klar sein, ob nur ein internes Tool gebaut wird, ob ein öffentliches Wiki entstehen soll, ob Scraping-Komponenten integriert sind, ob SEO-Strukturen mitgedacht werden und ob KI-Antworten auf externe oder nur interne Inhalte zugreifen.

Danach muss geregelt sein, welche Datenquellen zulässig sind. Hier gehört hinein, ob nur kundenseitig freigegebene Quellen genutzt werden dürfen, ob öffentliche Websites einbezogen werden, ob APIs bevorzugt werden sollen und ob technische Schutzmaßnahmen tabu sind.

Außerdem muss vertraglich festgelegt werden, wie Rechte und Lizenzen behandelt werden. Wer haftet dafür, dass importierte Inhalte genutzt werden dürfen? Wer stellt sicher, dass keine unzulässigen Volltextkopien entstehen? Wer prüft, ob ein öffentliches Wiki rechtlich freigegeben werden kann?

Wenn personenbezogene Daten verarbeitet werden, gehört zwingend ein Datenschutzblock dazu, häufig auch eine saubere Rollenverteilung und gegebenenfalls ein AV-Vertrag. Gerade bei KI-Projekten mit Nutzerinteraktionen, Mandantendaten, Bewerberdaten oder Supportinformationen ist das nicht optional.

Nicht weniger wichtig sind Haftung, Freistellung und Dokumentationspflichten. Wer ein komplexes Wissenssystem baut, sollte am Ende nicht nur Quellcode bekommen, sondern auch nachvollziehbare Informationen darüber, welche Datenkategorien verwendet wurden, wie die Importlogik funktioniert, welche Systeme angebunden wurden und wie Änderungen dokumentiert werden.

13. Warum gerade hier Mandate entstehen

Genau an dieser Stelle entsteht übrigens das, was für Kanzleien, spezialisierte Berater und legal-tech-nahe Angebote wirtschaftlich interessant ist. Denn Unternehmen und Agenturen merken oft erst spät, dass technische Projekte rechtlich nicht nur ein Begleitproblem haben, sondern eine eigene Struktur brauchen.

Startups, die mit KI experimentieren, unterschätzen regelmäßig die Tragweite von Datenherkunft, Nutzungsrechten, Bot-Infrastruktur und öffentlicher Bereitstellung. Agenturen wiederum fokussieren sich häufig auf Performance, UX und technische Machbarkeit, ohne den rechtlichen Unterbau ausreichend zu dokumentieren. Das führt zwangsläufig zu Konflikten, Nachbesserungsbedarf und Beratungsbedarf.

Wer sich hier gut positioniert, kann genau diese Lücke schließen: nicht gegen Innovation, sondern als Ermöglicher rechtssicherer Innovation. Das ist auch der Grund, warum die Verbindung von Legal AI, Wiki-Logik, SEO, Scraping und Vertragsgestaltung so interessant ist. Es handelt sich nicht um fünf getrennte Themen, sondern um ein zusammenhängendes Marktsegment.

14. Wie ein belastbares Setup in der Praxis aussehen kann

Ein sinnvolles Setup für Startups beginnt nicht mit maximaler Automatisierung, sondern mit Klarheit. Zuerst sollte feststehen, welche Wissensbereiche intern organisiert werden sollen und welche Inhalte überhaupt rechtlich tragfähig importierbar sind. Danach wird die Struktur festgelegt: Welche Seitentypen gibt es? Welche Quellenfelder? Welche Statusstufen? Welche Rollen? Welche Zugriffsrechte?

Erst wenn diese Grundlage existiert, sollte die KI darübergelegt werden. Denn die KI ist nur so belastbar wie der Wissensraum, auf den sie zugreift. Wenn ungeprüfte, widersprüchliche oder rechtlich problematische Inhalte in einem gemeinsamen Pool landen, macht das Sprachmodell das Projekt nicht besser, sondern nur schneller riskant.

Parallel dazu braucht es ein sauberes Trennmodell zwischen internem und öffentlichem Bereich. Interne Inhalte sollten standardmäßig nicht öffentlich indexierbar sein. Öffentliche Inhalte sollten nur aus freigegebenen, sauber dokumentierten Quellen und eigener Bearbeitung bestehen. SEO sollte auf die eigene Aufbereitungsleistung setzen, nicht auf fremde Inhalte als Reichweitenvehikel.

Und wenn externe Dienstleister beteiligt sind, müssen Scope, Rechte, Datenschutz, Dokumentation und Haftung vertraglich so geregelt werden, dass die technische Umsetzung nicht später zur juristischen Baustelle wird.

15. Fazit: Nicht die KI allein ist der Hebel, sondern die Wissensarchitektur

Die Debatte um RAG, Legal AI und Wissenssysteme wird häufig zu technisch geführt. Dabei liegt der eigentliche Hebel woanders. Der entscheidende Unterschied entsteht nicht dadurch, welches Modell antwortet, sondern dadurch, wie Wissen organisiert, qualifiziert, freigegeben und genutzt wird.

Ein Akten-Wiki oder Legal Wiki ist deshalb kein Trendbegriff, sondern ein sinnvoller nächster Schritt. Es ersetzt nicht jede KI-Technik, aber es gibt ihr einen belastbaren Rahmen. Und genau dieser Rahmen entscheidet darüber, ob ein Startup nur eine interessante Demo baut oder ein tragfähiges Produkt. Er entscheidet darüber, ob ein internes Tool beherrschbar bleibt oder später im Chaos endet. Und er entscheidet darüber, ob externe Sichtbarkeit über SEO und öffentliche Inhalte zur Marke wird oder zum Risiko.

Wer heute mit KI arbeitet, braucht deshalb nicht nur Modelle, sondern Regeln. Nicht nur Daten, sondern Datenherkunft. Nicht nur Bots, sondern Nutzungsgrenzen. Nicht nur Agenturen, sondern belastbare Verträge. Nicht nur Content, sondern Struktur.

Genau darin liegt die eigentliche Stärke des Wiki-Ansatzes. Er bringt Ordnung in ein Feld, das technisch immer mächtiger, aber rechtlich und organisatorisch auch immer komplexer wird. Für Startups ist das kein Nachteil, sondern eine Chance. Denn wer diese Ordnung früh etabliert, schafft nicht nur Compliance, sondern einen echten strategischen Vorsprung.

Marian Härtel
Author: Marian Härtel

Marian Härtel ist Rechtsanwalt und Fachanwalt für IT-Recht mit einer über 25-jährigen Erfahrung als Unternehmer und Berater in den Bereichen Games, E-Sport, Blockchain, SaaS und Künstliche Intelligenz. Seine Beratungsschwerpunkte umfassen neben dem IT-Recht insbesondere das Urheberrecht, Medienrecht sowie Wettbewerbsrecht. Er betreut schwerpunktmäßig Start-ups, Agenturen und Influencer, die er in strategischen Fragen, komplexen Vertragsangelegenheiten sowie bei Investitionsprojekten begleitet. Dabei zeichnet sich seine Beratung durch einen interdisziplinären Ansatz aus, der juristische Expertise und langjährige unternehmerische Erfahrung miteinander verbindet. Ziel seiner Tätigkeit ist stets, Mandanten praxisorientierte Lösungen anzubieten und rechtlich fundierte Unterstützung bei der Umsetzung innovativer Geschäftsmodelle zu gewährleisten.

Weitere spannende Blogposts

Atemschutzmasken selber herstellen und anbieten?

Atemschutzmasken selber herstellen und anbieten?
30. März 2020

0Aktuell gibt es überall Bedarf für Schutzkleidung wie Atemschutzmasken und neben professionellen Anbietern drängen auch zahlreiche Selbstständige auf den Markt...

Mehr lesenDetails

Urheberrecht im digitalen Zeitalter

Urheberrecht im digitalen Zeitalter: Worauf Startups achten sollten
8. Oktober 2024

Im Zeitalter der Digitalisierung stehen Startups vor besonderen Herausforderungen im Bereich des Urheberrechts. Die rasante technologische Entwicklung und die zunehmende...

Mehr lesenDetails

Fack ju Göthe darf als Marke eingetragen werden

Internationale Markenanmeldung beim WIPO
2. Juli 2019

Da glaubt man, viele Probleme im Markenrecht zumindest schon einmal auf dem Tisch gehabt oder mit Kollegen und Mandanten evaluiert...

Mehr lesenDetails

Blockchain Startups und die neuen Regulierungen: TOFR und CARF

Transfer of Funds Regulation (ToFR
9. Februar 2025

Die Blockchain-Industrie ist bekannt für ihre Liebe zu Abkürzungen – und das ist gut so, denn in diesem Jahr gibt...

Mehr lesenDetails

Des Kaisers neue Kleider…

Des Kaisers neue Kleider…
4. Januar 2019

Ok, es sind nicht wirklich "neue Kleider", sondern eher "verschönerte Kleider" ;) Nach einigen Wochen Arbeit konnte ich heute nun...

Mehr lesenDetails

BGH entscheidet zu Auslistungsbegehren gegenüber Google

BGH hält Uber Black für wettbewerbswidrig
23. Mai 2023

Sachverhalt: Der Kläger ist für verschiedene Gesellschaften, die Finanzdienstleistungen anbieten, in verantwortlicher Position tätig oder an ihnen beteiligt. Die Klägerin...

Mehr lesenDetails

Kommerzielle Nutzung von Discord: Ein juristischer Leitfaden

Was ist mit der Haftung bei einem Discord-Server?
18. Oktober 2023

Einleitung Discord hat sich seit seiner Gründung im Jahr 2015 zu einer beliebten Plattform für Gamer, Communities und zuletzt auch...

Mehr lesenDetails

Externe Datenschutzbeauftragte handeln gewerblich

Risiko Sozialversicherungs / Steuerprüfung für Streamer, Esportler u.a.
24. März 2020

Ein externer Datenschutzbeauftragter ist gewerblicher Unternehmer, auch wenn er zugleich als Rechtsanwalt tätig ist. Wie der Bundesfinanzhof (BFH) mit Urteil...

Mehr lesenDetails

Influencer: Wann aus Marketing plötzlich Handelsvertreterrecht wird

Streaming-Setup, Influencer und Vertragsrecht
18. Februar 2026

Influencer-Marketing ist längst nicht mehr nur Imagepflege. In vielen Kampagnen geht es messbar um Abverkäufe, Leads, Abo-Abschlüsse und wiederkehrende Umsätze....

Mehr lesenDetails
Legal Wiki statt blindem RAG
Sonstiges

Legal Wiki statt blindem RAG

8. April 2026

Die aktuelle Diskussion rund um Legal AI, Akten-Wikis und wissensbasierte Systeme zeigt sehr deutlich: Es geht längst nicht mehr nur...

Mehr lesenDetails
Epic Games‘ Sieg im Kartellrechtsstreit gegen Google Play Store: Ein Wendepunkt für die App-Ökonomie?

EuGH zu Spielgold und In-Game-Assets

27. März 2026
Ein Bleistift im Influencer-Stil.

Kommentarspalten als Haftungsfalle: Welche rechtlichen Risiken Influencer bei Pornospam, Scam und strafbaren Inhalten eingehen

23. März 2026
Achtung vor Fake-Streamingangeboten

Christian Ulmen, KI-Deepfakes und „digitale Vergewaltigung“

21. März 2026
Wegweisendes Urteil zu KI-Trainingsdaten - LG Hamburg setzt Maßstäbe

Forschungszulage und Erfolgsprovision: Wann Unternehmen sechsstellige Forderungen nicht zahlen müssen

20. März 2026

Produkte

  • Kanzlei-Digitalisierung 2025: Effizienz, KI und Sichtbarkeit – Das Praxis-Bundle für moderne Anwält:innen Kanzlei-Digitalisierung 2025: Effizienz, KI und Sichtbarkeit – Das Praxis-Bundle für moderne Anwält:innen 89,99 €

    inkl. MwSt.

  • Von der Kanzlei zur KI-Quelle – LLM-SEO für Rechtsanwälte Von der Kanzlei zur KI-Quelle – LLM-SEO für Rechtsanwälte 9,99 €

    inkl. MwSt.

  • Verschwiegenheitserklärung / NDA – Muster mit Alternativen Verschwiegenheitserklärung / NDA – Muster mit Alternativen 0,00 €

    inkl. MwSt.

  • Videoberatung via Microsoft Teams 30 Minuten – Schnell, unkompliziert und fokussiert Videoberatung via Microsoft Teams 30 Minuten – Schnell, unkompliziert und fokussiert 163,63 €

    inkl. MwSt.

  • 120 Minuten: Videoberatung via Microsoft Teams 120 Minuten – Ausführlich, vertieft und individuell 120 Minuten: Videoberatung via Microsoft Teams 120 Minuten – Ausführlich, vertieft und individuell 535,50 €

    inkl. MwSt.

Podcastfolge

Die Romantisierung des Prinzips ‚Fail Fast‘ in Startups – Wann wird Scheitern zur Täuschung gegenüber Beteiligten?

Die Romantisierung des Prinzips ‚Fail Fast‘ in Startups – Wann wird Scheitern zur Täuschung gegenüber Beteiligten?

20. April 2025

In diese Episode wird die komplexe Beziehung zwischen dem 'Fail Fast'-Prinzip und den Verantwortlichkeiten der Gründer gegenüber Investoren und Mitarbeitern...

Mehr lesenDetails
„Digitales Recht Entschlüsselt“ mit Rechtsanwalt Marian Härtel

„Digitales Recht Entschlüsselt“ mit Rechtsanwalt Marian Härtel

25. September 2024
Der unkonventionelle Anwalt: Ein Nerd im Dienste des Rechts

Der unkonventionelle Anwalt: Ein Nerd im Dienste des Rechts

25. September 2024
Leben als IT-Anwalt, Work-Life Balance, Familie und meine Karriere

Leben als IT-Anwalt, Work-Life Balance, Familie und meine Karriere

25. September 2024
Blick in die Zukunft: Wie Technologie das Recht verändert

Blick in die Zukunft: Wie Technologie das Recht verändert

18. Februar 2025

Video

Mein transparente Abrechnung

Mein transparente Abrechnung

10. Februar 2025

In diesem Video rede ich ein wenig über transparente Abrechnung und wie ich kommuniziere, was es kostet, wenn man mit...

Mehr lesenDetails
Faszination zwischen und Recht und Technologie

Faszination zwischen und Recht und Technologie

10. Februar 2025
Meine zwei größten Herausforderungen sind?

Meine zwei größten Herausforderungen sind?

10. Februar 2025
Was mich wirklich freut

Was mich wirklich freut

10. Februar 2025
Was ich an meinem Job liebe!

Was ich an meinem Job liebe!

10. Februar 2025
  • Datenschutzerklärung
  • Impressum
  • Kontaktaufnahme
  • Über Rechtsanwalt Marian Härtel
Marian Härtel, Rathenaustr. 58a, 14612 Falkensee, info@itmedialaw.com

Marian Härtel - Rechtsanwalt für IT-Recht, Medienrecht und Startups, mit einem Fokus auf innovative Geschäftsmodelle, Games, KI und Finanzierungsberatung.

Willkommen zurück!

Loggen Sie sich unten in Ihr Konto ein

Haben Sie Ihr Passwort vergessen? Anmeldung

Neues Konto erstellen!

Füllen Sie die nachstehenden Formulare aus, um sich zu registrieren

Alle Felder sind erforderlich. Einloggen

Ihr Passwort abrufen

Bitte geben Sie Ihren Benutzernamen oder Ihre E-Mail-Adresse ein, um Ihr Passwort zurückzusetzen.

Einloggen
  • Informationen
    • Leistungen
      • Betreuung und Beratung von Agenturen
      • Vertragsprüfung- und erstellung
      • Beratung zum Games-Recht
      • Beratung für Influencer und Streamer
      • Beratung im E-Commerce
      • Beratung zu DLT und Blockchain
      • Rechtsberatung im Gesellschaftsrecht
      • Legal Compliance und Gutachten
      • Outsourcing – für Unternehmen oder Kanzleien
      • Buchung als Speaker
    • Schwerpunkte
      • Focus auf Startups
      • Investmentberatung
      • Unternehmensrecht
      • Kryptowährungen, Blockchain und Games
      • KI und SaaS
      • Streamer und Influencer
      • Games- und Esportrecht
      • IT/IP-Recht
      • Kanzlei für GMBH,UG, GbR
      • Kanzlei für IT/IP und Medienrecht
    • Idealer Partner
    • Über Rechtsanwalt Marian Härtel
    • Schnell und flexibel erreichbar
    • Prinzipien als Rechtsanwalt
    • Warum Rechtsanwalt und Unternehmensberater?
    • Der Alltag eines IT-Rechtsanwalts
    • Wie kann ich Mandanten helfen?
    • Testimonials
    • Team: Saskia Härtel – WER BIN ICH?
    • Agile und leane Kanzlei
    • Preisübersicht
    • Sonstiges
      • AGB
      • Datenschutzerklärung
      • Widerrufserklärung
      • Impressum
  • News
    • Glosse / Meinung
    • Recht im Internet
    • Onlinehandel
    • Recht und Computerspiele
    • Recht und Esport
    • Blockchain und Web 3 Recht
    • Datenschutzrecht
    • Urheberrecht
    • Arbeitsrecht
    • Wettbewerbsrecht
    • Gesellschaftsrecht
    • EU-Recht
    • Jugendschutzrecht
    • Steuerrecht
    • Sonstiges
    • Intern
  • Podcast
    • ITMediaLaw Kurz-Podcast
    • ITMediaLaw Podcast
  • Wissen
    • Gesetze
    • Juristische Begriffe
    • Vertragstypen
    • Klauseltypen
    • Finanzierungsformen und Begriffe
    • Juristische Mittel
    • Behörden / Institutionen
    • Gesellschaftsformen
    • Steuerrecht
    • Konzepte
  • Videos
    • Informationsvideos – über Marian Härtel
    • Videos – über mich (Couch)
    • Blogpost – einzelne Videos
    • Videos zu Dienstleistungen
    • Shorts
    • Podcast Format
    • Drittanbietervideos
    • Sonstige Videos
  • Kontaktaufnahme
  • Shop / Downloads / Community
    • Downloads und Dienstleistungen
      • Beratung
      • Seminare
      • E-Books
      • Freebies
      • Vertragsmuster
      • Bundle
    • Profil / Verwaltung
      • Bestellungen
      • Downloads
      • Rechnungsadresse
      • Zahlungsarten
    • Kasse
    • Warenkorb
    • Support
    • FAQ Shop
  • en English
  • de Deutsch
Kostenlose Kurzberatung