Legal Wiki statt blindem RAG

Die aktuelle Diskussion rund um Legal AI, Akten-Wikis und wissensbasierte Systeme zeigt sehr deutlich: Es geht längst nicht mehr nur darum, möglichst viele PDFs in ein System zu kippen und anschließend mit Retrieval-Augmented Generation, also RAG, ein paar brauchbare Antworten herauszubekommen. Die bessere Frage lautet heute: Wie baut man ein belastbares, skalierbares und rechtlich sauberes Wissenssystem, das für Startups, Agenturen und digitale Geschäftsmodelle wirklich funktioniert?

Inhaltsverzeichnis Verbergen

1. 1. Warum das Wiki-Konzept gerade jetzt stärker wird

2. 2. Was ein Legal Wiki von einer Dokumentensammlung unterscheidet

3. 3. Warum Legal AI ohne saubere Daten- und Quellenlogik gefährlich wird

4. 4. Scraping, Crawling und Botnutzung: Die eigentliche Baustelle hinter vielen KI-Projekten

5. 5. Was darf ich eigentlich „scrollen“ und was darf ich speichern?

6. 6. Interne Wikis sind nicht dasselbe wie öffentliche Wikis

7. 7. Wie ein Startup sein internes Wiki rechtssicher aufbaut

8. 8. Was beim öffentlichen Legal Wiki zusätzlich zu beachten ist

9. 9. SEO für Legal Wikis: Sichtbarkeit aufbauen, ohne fremde Inhalte zu ersetzen

10. 10. Was Startups beim Einsatz von Open Models, APIs und Toolchains beachten müssen

11. 11. Agenturverträge: Der unterschätzte Hebel für rechtssichere KI-Projekte

12. 12. Welche Punkte in einem Agenturvertrag für Legal-AI- oder Wiki-Projekte nicht fehlen dürfen

13. 13. Warum gerade hier Mandate entstehen

14. 14. Wie ein belastbares Setup in der Praxis aussehen kann

15. 15. Fazit: Nicht die KI allein ist der Hebel, sondern die Wissensarchitektur

15.1. Author: Marian Härtel

Genau hier wird das Konzept des Wikis spannender als die klassische Dateiliste und oft auch wertvoller als ein rein technisch gedachtes RAG-Setup. Ein gut gebautes Wiki ist kein Dokumentenfriedhof. Es ist ein strukturierter Wissensraum mit Quellen, Beziehungen, Zuständigkeiten, Rechten, Statuslogiken und Versionen. Und genau diese Struktur ist der Punkt, an dem sich die rechtlichen Fragen mit der Produktfrage verbinden.

Denn sobald Startups anfangen, mit KI interne Wissenssysteme aufzubauen, externe Inhalte zu verarbeiten, Bots einzusetzen, Websites zu crawlen, Daten für ein öffentliches oder internes Wiki zu strukturieren oder Agenturen mit dem Aufbau solcher Systeme zu beauftragen, tauchen sofort eine Reihe juristischer Folgefragen auf. Was darf ich scrapen? Was ist beim Crawling erlaubt? Welche Inhalte darf ich in ein internes Wiki übernehmen? Welche Unterschiede gibt es zwischen einem internen Wissenssystem und einem öffentlichen Legal Wiki? Was darf ich mit SEO machen, wenn Inhalte maschinell angereichert oder systematisch strukturiert werden? Und was muss vertraglich geregelt sein, wenn Agenturen, Freelancer oder externe Entwickler an so einem System arbeiten?

Dieser Beitrag verbindet genau diese Ebenen. Er soll nicht nur ein technischer oder juristischer Überblick sein, sondern eine strategische Einordnung für Unternehmen, die mit KI, Open-Source-Modellen, Bot-Infrastrukturen oder externen Datensammlungen arbeiten und daraus ein funktionierendes Wissensprodukt machen wollen.

1. Warum das Wiki-Konzept gerade jetzt stärker wird

Viele Teams starten beim Thema Legal AI oder Wissensmanagement mit einem sehr einfachen Gedankengang: Wir haben Dateien, also brauchen wir eine Suche. Danach kommt meist die nächste Stufe: Wir haben eine Suche, also koppeln wir ein Sprachmodell daran. Das Ergebnis ist dann ein klassisches RAG-System.

Das Problem daran ist nicht, dass RAG technisch schlecht wäre. Das Problem ist, dass RAG oft als Lösung für ein Problem eingesetzt wird, das eigentlich woanders liegt. Die eigentliche Herausforderung ist nämlich fast nie nur der Zugriff auf Text. Die eigentliche Herausforderung ist die Organisation von Wissen.

Eine Dateiliste ist aus juristischer und organisatorischer Sicht fast immer ein schwaches Modell. Dateien sagen nichts über Priorität, Gültigkeit, Aktualität, Verantwortlichkeit, Zusammenhang oder zulässige Nutzung aus. Ein PDF kann hochrelevant, veraltet, intern vertraulich, öffentlich frei nutzbar oder rechtlich problematisch sein. In einer Dateiliste sehen diese Zustände häufig gleich aus. In einem Wiki hingegen lassen sie sich systematisch abbilden.

Ein Wiki ist damit nicht einfach eine Sammlung von Seiten. Es ist ein Kontrollsystem für Wissen. Es ordnet Inhalte, trennt Rohmaterial von freigegebenen Inhalten, macht Quellenbezüge sichtbar und schafft dadurch eine Struktur, die nicht nur für Menschen besser lesbar ist, sondern auch für KI-Systeme deutlich belastbarer wird.

Der große Vorteil für Startups ist: Wer früh mit einem Wiki-orientierten Modell arbeitet, baut nicht nur einen schlauen Bot, sondern eine Wissensarchitektur. Und genau diese Wissensarchitektur entscheidet später darüber, ob das System skalierbar, investorenfähig, compliance-tauglich und mandatsfähig ist.

2. Was ein Legal Wiki von einer Dokumentensammlung unterscheidet

Im Alltag wird oft unterschätzt, wie groß der Unterschied zwischen abgelegten Dokumenten und strukturiertem Wissen tatsächlich ist. Eine Dokumentensammlung ist zunächst nur ein Speicherort. Ein Wiki ist ein Beziehungsraum.

In einer Dokumentensammlung werden Inhalte meistens nach Ordnerlogik abgelegt. Das kann für eine kleine Arbeitsgruppe noch funktionieren, scheitert aber sehr schnell, wenn mehrere Personen parallel arbeiten, Inhalte versioniert werden müssen oder KI auf diese Inhalte zugreifen soll. Denn dann stellt sich sofort die Frage, welche Version gilt, welche Inhalte freigegeben sind, welche Aussagen nur Entwürfe sind, welche Texte aus externen Quellen stammen und welche Daten intern nicht öffentlich verwendet werden dürfen.

Ein Legal Wiki löst dieses Problem, indem es Informationen nicht nur speichert, sondern qualifiziert. Ein Eintrag ist dann nicht einfach ein Text, sondern eine Aussage mit Herkunft, Status, Zusammenhang und Verantwortlichkeit. Genau das ist für juristische oder compliance-nahe Systeme zentral.

Für Startups bedeutet das: Wer ein internes Wissenssystem baut, sollte nicht primär fragen, welches Modell am besten antwortet. Die bessere erste Frage lautet: Welche Struktur geben wir unserem Wissen, damit ein Modell später überhaupt belastbar damit arbeiten kann?

3. Warum Legal AI ohne saubere Daten- und Quellenlogik gefährlich wird

Der Markt rund um Legal AI entwickelt sich derzeit mit enormer Geschwindigkeit. Überall wird versprochen, dass KI Recherche, Vertragsprüfung, Wissensaufbau, Inhaltszusammenfassung und interne Organisation schneller und billiger macht. Das stimmt zum Teil auch. Aber Geschwindigkeit ist nicht dasselbe wie Qualität. Und rechtlich zulässig ist das technisch Machbare ohnehin nicht automatisch.

Sobald Inhalte in ein System eingespeist werden, stellt sich die Frage nach der Herkunft. Sobald eine Maschine Zusammenfassungen erzeugt, stellt sich die Frage nach der Qualität. Sobald Inhalte angezeigt, verlinkt, indiziert oder weiterverwendet werden, stellt sich die Frage nach Nutzungsrechten, Urheberrecht, Datenbankschutz, Datenschutz und Wettbewerbsrecht.

Gerade bei Startups entsteht hier oft ein gefährlicher Denkfehler. Viele Gründer gehen davon aus, dass ein internes Tool schon deshalb rechtlich harmlos sei, weil es nicht sofort öffentlich sichtbar ist. Das ist zu kurz gedacht. Auch interne Systeme können problematisch sein, wenn sie personenbezogene Daten falsch verarbeiten, fremde Inhalte ohne Grundlage kopieren oder Datenquellen so nutzen, dass spätere externe Nutzung bereits angelegt ist.

Das heißt nicht, dass man kein internes AI-Wiki bauen darf. Im Gegenteil. Es heißt nur, dass man den Aufbau nicht wie ein Bastelprojekt behandeln sollte. Wer Legal AI ernsthaft als Produkt oder Prozess einsetzt, braucht eine klare Trennung zwischen Datengewinnung, Datenaufbereitung, Wissensfreigabe und öffentlicher Darstellung.

4. Scraping, Crawling und Botnutzung: Die eigentliche Baustelle hinter vielen KI-Projekten

Einer der sensibelsten Bereiche bei modernen Wissenssystemen ist die Frage, wie Daten überhaupt in das System gelangen. Viele Projekte scheitern rechtlich nicht an der KI, sondern an der Datenerhebung davor.

In der Praxis geht es meist um drei Dinge: Scraping, Crawling und Botnutzung.

Scraping meint typischerweise das automatisierte Auslesen von Inhalten aus Websites oder Plattformen. Crawling beschreibt das systematische Durchlaufen von Seiten, um Inhalte zu erfassen oder zu indexieren. Botnutzung meint technische Prozesse, die automatisiert auf Inhalte zugreifen, sei es über Browser-Simulation, Requests, APIs oder andere Schnittstellen.

Juristisch kommt es dabei nicht nur auf die Technik an, sondern auf die konkrete Art der Nutzung. Eine Website zu lesen, ist nicht dasselbe wie eine Website automatisiert in großem Stil zu erfassen. Eine Quelle anzusehen, ist nicht dasselbe wie eine eigene Datenbank daraus aufzubauen. Eine Information zu referenzieren, ist nicht dasselbe wie Inhalte zu kopieren, umzuschreiben und als Teil eines eigenen Angebots bereitzustellen.

Besonders heikel wird es dort, wo technische Maßnahmen umgangen werden. Wenn Paywalls, Logins, Sperren, Rate-Limits, Zugriffsbeschränkungen oder Schutzmechanismen bewusst umgangen werden, steigt das Risiko deutlich. Auch dort, wo fremde Inhalte in einer Form übernommen werden, die das Original wirtschaftlich ersetzt, wird es regelmäßig problematisch.

Startups sollten sich daher von der Illusion verabschieden, dass alles frei nutzbar sei, was öffentlich im Netz steht. Öffentlich sichtbar bedeutet nicht automatisch frei kopierbar, frei indizierbar oder frei zur Weiterverarbeitung in Bots und Wikis geeignet.

5. Was darf ich eigentlich „scrollen“ und was darf ich speichern?

Die Frage klingt banal, ist aber in vielen Projekten zentral. Denn technisch verschwimmt die Grenze zwischen normalem Nutzen und automatisiertem Auslesen oft sehr schnell.

Rein faktisch darf ein Mensch Websites anschauen, lesen und durchscrollen. Problematisch wird es dort, wo aus einem Lesevorgang ein Erfassungsvorgang wird. Sobald Inhalte automatisiert geladen, strukturiert, gespeichert, analysiert und in einem neuen System wiedergegeben werden, ist man nicht mehr bei bloßem Konsum, sondern bei Weiterverarbeitung.

Für die rechtliche Bewertung ist deshalb entscheidend, was mit dem abgerufenen Inhalt passiert. Wer Informationen lediglich zur Kenntnis nimmt, steht anders da als jemand, der dieselben Informationen automatisiert in eine eigene Wissensdatenbank überführt. Noch einmal anders liegt der Fall, wenn diese Daten später öffentlich durchsuchbar gemacht oder in einem Bot ausgespielt werden.

Die zentrale Leitlinie für Unternehmen lautet daher: Lesen ist nicht gleich Verwerten. Und Verwerten ist nicht gleich Veröffentlichen. Jede zusätzliche Stufe erhöht die rechtlichen Anforderungen.

6. Interne Wikis sind nicht dasselbe wie öffentliche Wikis

Ein ganz wesentlicher Unterschied liegt darin, ob ein Wiki rein intern genutzt wird oder ob es öffentlich oder halböffentlich zugänglich ist. Viele Gründer vermischen diese Ebenen zu schnell.

Ein internes Wiki dient in erster Linie dem Wissensaufbau im Unternehmen. Hier geht es um Prozesse, Notizen, interne Leitfäden, Projektwissen, Vertragsmuster, Marktanalysen, Produktinformationen oder auch rechtliche Einordnungen. Ein solches System kann rechtlich leichter beherrschbar sein, wenn sauber dokumentiert wird, welche Inhalte hineinfließen und welche Zugriffsrechte gelten.

Ein öffentliches Wiki ist etwas anderes. Sobald externe Nutzer Inhalte abrufen können, entsteht eine ganz andere Risikolage. Dann geht es nicht nur um interne Nutzungslogik, sondern um öffentliche Zugänglichmachung, urheberrechtliche Relevanz, Wettbewerbsfragen, Persönlichkeitsrechte, Transparenzpflichten und gegebenenfalls auch um Plattformverantwortung.

Wer also ein internes KI-Wiki baut und mittelfristig daraus ein öffentliches Wissensprodukt machen will, sollte das von Anfang an mitdenken. Die saubere Lösung besteht darin, Inhalte von Beginn an nach Freigabestatus zu trennen. Es muss klar sein, was nur intern nutzbar ist, was extern zitiert werden darf und was tatsächlich als öffentliches Wissensangebot erscheinen soll.

7. Wie ein Startup sein internes Wiki rechtssicher aufbaut

Ein funktionierendes internes Wiki braucht kein perfektes Großkonzept, aber es braucht klare Grundregeln. In der Praxis sollte jedes Startup, das mit KI und Wissensstrukturen arbeitet, zumindest folgende Fragen sauber beantworten:

Erstens: Welche Quellen fließen überhaupt in das System ein?
Zweitens: Wer darf Inhalte importieren, ändern und freigeben?
Drittens: Welche Inhalte sind sensibel, personenbezogen oder vertraulich?
Viertens: Welche Inhalte dürfen in KI-Antworten verwendet werden und welche nicht?
Fünftens: Welche Inhalte können später öffentlich gemacht werden?

Sobald diese Fragen nicht beantwortet sind, entsteht ein typisches Risiko: Das Team baut schnell ein leistungsfähiges System, aber niemand weiß mehr genau, was darin steckt. Spätestens wenn Investoren, Kunden, Partner oder Anwälte darauf schauen, wird aus einem technologischen Vorsprung plötzlich ein Haftungsthema.

Die bessere Lösung ist ein einfaches Governance-Modell. Jede Seite oder jedes Wissenselement bekommt mindestens einen Quellennachweis, einen Bearbeitungsstatus und eine Freigabestufe. Außerdem sollte nachvollziehbar sein, wann Inhalte zuletzt geprüft wurden und durch wen. So entsteht eine Struktur, die sowohl menschlich nutzbar als auch KI-fähig ist.

8. Was beim öffentlichen Legal Wiki zusätzlich zu beachten ist

Sobald Inhalte nicht nur intern verwendet, sondern auch nach außen dargestellt werden, treten weitere Rechtsfragen in den Vordergrund. Dazu gehören unter anderem die Zulässigkeit der öffentlichen Wiedergabe, die Reichweite von Zitaten, die Frage der urheberrechtlichen Schutzfähigkeit, die Nutzung fremder Datenbanken und die Darstellung personenbezogener Informationen.

Öffentliche Legal Wikis sind deshalb nur dann ein starkes Geschäftsmodell, wenn sie klar auf eigener Leistung beruhen. Das heißt praktisch: nicht einfach fremde Inhalte spiegeln, sondern eigene Aufbereitung, eigene Analyse, eigene Systematik, eigene Einordnung und eine nachvollziehbare Quellenkultur schaffen.

Für SEO und Markenaufbau ist genau das ohnehin die bessere Strategie. Ein öffentliches Wiki wird dann stark, wenn es nicht nur Informationen reproduziert, sondern Komplexität reduziert. Nutzer wollen nicht die hundertste Sammlung von Textbausteinen. Sie wollen Orientierung, Systematik und Vertrauenswürdigkeit. Genau das ist der Punkt, an dem Produktdenken und Rechtsdenken zusammenlaufen.

9. SEO für Legal Wikis: Sichtbarkeit aufbauen, ohne fremde Inhalte zu ersetzen

SEO ist für solche Systeme ein riesiger Hebel. Gleichzeitig ist SEO dort besonders riskant, wo Unternehmen versuchen, Reichweite durch massenhafte Übernahme fremder Inhalte zu gewinnen.

Die sichere und langfristig ohnehin bessere Strategie lautet: Sichtbarkeit entsteht durch eigene Strukturleistung, nicht durch bloße Wiederholung. Ein Legal Wiki kann SEO-stark sein, wenn es Begriffe erklärt, Zusammenhänge herstellt, klare Seitenstrukturen anbietet, häufige Fragen beantwortet, Standards einordnet und technische sowie rechtliche Themen verständlich macht.

Problematisch wird es dort, wo das System fremde Seiten faktisch ersetzt. Wer fremde Inhalte systematisch übernimmt, in eine neue Suchlogik packt und dann mit Suchmaschinenreichweite monetarisiert, bewegt sich in einer deutlich heikleren Zone.

Das bedeutet nicht, dass man keine Quellen nutzen darf. Im Gegenteil. Quellen sind wichtig. Aber Quellen sollten als Quellen erkennbar bleiben. Der Mehrwert muss in der eigenen Verarbeitung liegen. Wer das sauber macht, stärkt nicht nur seine rechtliche Position, sondern baut auch die bessere Marke auf.

10. Was Startups beim Einsatz von Open Models, APIs und Toolchains beachten müssen

Viele Teams bauen ihr System heute modular. Statt einer monolithischen Plattform nutzen sie Open-Source-Modelle, APIs, Vektordatenbanken, Browser-Tools, Crawler, Automatisierungsplattformen und eigene Skripte. Technisch ist das effizient. Rechtlich bedeutet es aber auch: Die Verantwortung verteilt sich nicht automatisch auf die Anbieter.

Ein häufiger Fehler ist die Annahme, dass der Einsatz einer API oder eines bekannten Tools bereits rechtliche Sicherheit erzeugt. Das stimmt so nicht. Auch wenn der technische Zugriff bequem ist, muss weiter geprüft werden, welche Daten verarbeitet werden, welche Lizenzbedingungen gelten, ob Daten zu Trainingszwecken weiterverwendet werden, ob personenbezogene Daten im Spiel sind und welche Zugriffsrechte tatsächlich bestehen.

Je modularer das Setup, desto wichtiger ist deshalb eine klare Dokumentation der Datenflüsse. Es muss nachvollziehbar sein, welche Daten woher stammen, wohin sie übertragen werden, wie lange sie gespeichert werden und wer auf sie zugreifen kann. Nur so lässt sich später verlässlich beantworten, ob ein System datenschutzkonform, urheberrechtlich sauber und vertraglich ausreichend abgesichert ist.

11. Agenturverträge: Der unterschätzte Hebel für rechtssichere KI-Projekte

Spätestens wenn externe Entwickler, Agenturen oder Freelancer an Bord kommen, entscheidet der Vertrag darüber, ob ein Projekt tragfähig ist oder nicht. Gerade bei KI-, Wiki- und Datenprojekten sind Agenturverträge oft erschreckend oberflächlich. Es wird über Features gesprochen, aber nicht über Datenherkunft. Es wird über UX gesprochen, aber nicht über Rechte. Es wird über Launch-Termine gesprochen, aber nicht über Haftung, Dokumentation und Freigabelogik.

Ein sauberer Vertrag für ein solches Projekt muss deutlich mehr abdecken als nur die technische Umsetzung. Er sollte klar regeln, welche Leistungen geschuldet sind, welche Datenquellen verwendet werden dürfen, wer die Rechte an importierten oder erzeugten Inhalten trägt, wie mit personenbezogenen Daten umzugehen ist, welche Dokumentation zu liefern ist und wie mit unklaren oder problematischen Quellen umgegangen wird.

Besonders wichtig ist dabei die Frage, wer die Verantwortung für die Rechtmäßigkeit der Datenbasis trägt. Wenn eine Agentur Datenquellen auswählt, Crawler einrichtet oder Content-Importe organisiert, muss vertraglich geklärt sein, nach welchen Regeln das geschieht. Genauso wichtig ist umgekehrt, dass der Auftraggeber nicht stillschweigend davon ausgeht, alles werde schon rechtlich in Ordnung sein, nur weil es technisch funktioniert.

12. Welche Punkte in einem Agenturvertrag für Legal-AI- oder Wiki-Projekte nicht fehlen dürfen

Wer ein solches Projekt beauftragt, sollte in Verträgen zumindest die folgenden Themen sauber regeln:

Zunächst braucht es eine präzise Leistungsbeschreibung. Es muss klar sein, ob nur ein internes Tool gebaut wird, ob ein öffentliches Wiki entstehen soll, ob Scraping-Komponenten integriert sind, ob SEO-Strukturen mitgedacht werden und ob KI-Antworten auf externe oder nur interne Inhalte zugreifen.

Danach muss geregelt sein, welche Datenquellen zulässig sind. Hier gehört hinein, ob nur kundenseitig freigegebene Quellen genutzt werden dürfen, ob öffentliche Websites einbezogen werden, ob APIs bevorzugt werden sollen und ob technische Schutzmaßnahmen tabu sind.

Außerdem muss vertraglich festgelegt werden, wie Rechte und Lizenzen behandelt werden. Wer haftet dafür, dass importierte Inhalte genutzt werden dürfen? Wer stellt sicher, dass keine unzulässigen Volltextkopien entstehen? Wer prüft, ob ein öffentliches Wiki rechtlich freigegeben werden kann?

Wenn personenbezogene Daten verarbeitet werden, gehört zwingend ein Datenschutzblock dazu, häufig auch eine saubere Rollenverteilung und gegebenenfalls ein AV-Vertrag. Gerade bei KI-Projekten mit Nutzerinteraktionen, Mandantendaten, Bewerberdaten oder Supportinformationen ist das nicht optional.

Nicht weniger wichtig sind Haftung, Freistellung und Dokumentationspflichten. Wer ein komplexes Wissenssystem baut, sollte am Ende nicht nur Quellcode bekommen, sondern auch nachvollziehbare Informationen darüber, welche Datenkategorien verwendet wurden, wie die Importlogik funktioniert, welche Systeme angebunden wurden und wie Änderungen dokumentiert werden.

13. Warum gerade hier Mandate entstehen

Genau an dieser Stelle entsteht übrigens das, was für Kanzleien, spezialisierte Berater und legal-tech-nahe Angebote wirtschaftlich interessant ist. Denn Unternehmen und Agenturen merken oft erst spät, dass technische Projekte rechtlich nicht nur ein Begleitproblem haben, sondern eine eigene Struktur brauchen.

Startups, die mit KI experimentieren, unterschätzen regelmäßig die Tragweite von Datenherkunft, Nutzungsrechten, Bot-Infrastruktur und öffentlicher Bereitstellung. Agenturen wiederum fokussieren sich häufig auf Performance, UX und technische Machbarkeit, ohne den rechtlichen Unterbau ausreichend zu dokumentieren. Das führt zwangsläufig zu Konflikten, Nachbesserungsbedarf und Beratungsbedarf.

Wer sich hier gut positioniert, kann genau diese Lücke schließen: nicht gegen Innovation, sondern als Ermöglicher rechtssicherer Innovation. Das ist auch der Grund, warum die Verbindung von Legal AI, Wiki-Logik, SEO, Scraping und Vertragsgestaltung so interessant ist. Es handelt sich nicht um fünf getrennte Themen, sondern um ein zusammenhängendes Marktsegment.

14. Wie ein belastbares Setup in der Praxis aussehen kann

Ein sinnvolles Setup für Startups beginnt nicht mit maximaler Automatisierung, sondern mit Klarheit. Zuerst sollte feststehen, welche Wissensbereiche intern organisiert werden sollen und welche Inhalte überhaupt rechtlich tragfähig importierbar sind. Danach wird die Struktur festgelegt: Welche Seitentypen gibt es? Welche Quellenfelder? Welche Statusstufen? Welche Rollen? Welche Zugriffsrechte?

Erst wenn diese Grundlage existiert, sollte die KI darübergelegt werden. Denn die KI ist nur so belastbar wie der Wissensraum, auf den sie zugreift. Wenn ungeprüfte, widersprüchliche oder rechtlich problematische Inhalte in einem gemeinsamen Pool landen, macht das Sprachmodell das Projekt nicht besser, sondern nur schneller riskant.

Parallel dazu braucht es ein sauberes Trennmodell zwischen internem und öffentlichem Bereich. Interne Inhalte sollten standardmäßig nicht öffentlich indexierbar sein. Öffentliche Inhalte sollten nur aus freigegebenen, sauber dokumentierten Quellen und eigener Bearbeitung bestehen. SEO sollte auf die eigene Aufbereitungsleistung setzen, nicht auf fremde Inhalte als Reichweitenvehikel.

Und wenn externe Dienstleister beteiligt sind, müssen Scope, Rechte, Datenschutz, Dokumentation und Haftung vertraglich so geregelt werden, dass die technische Umsetzung nicht später zur juristischen Baustelle wird.

15. Fazit: Nicht die KI allein ist der Hebel, sondern die Wissensarchitektur

Die Debatte um RAG, Legal AI und Wissenssysteme wird häufig zu technisch geführt. Dabei liegt der eigentliche Hebel woanders. Der entscheidende Unterschied entsteht nicht dadurch, welches Modell antwortet, sondern dadurch, wie Wissen organisiert, qualifiziert, freigegeben und genutzt wird.

Ein Akten-Wiki oder Legal Wiki ist deshalb kein Trendbegriff, sondern ein sinnvoller nächster Schritt. Es ersetzt nicht jede KI-Technik, aber es gibt ihr einen belastbaren Rahmen. Und genau dieser Rahmen entscheidet darüber, ob ein Startup nur eine interessante Demo baut oder ein tragfähiges Produkt. Er entscheidet darüber, ob ein internes Tool beherrschbar bleibt oder später im Chaos endet. Und er entscheidet darüber, ob externe Sichtbarkeit über SEO und öffentliche Inhalte zur Marke wird oder zum Risiko.

Wer heute mit KI arbeitet, braucht deshalb nicht nur Modelle, sondern Regeln. Nicht nur Daten, sondern Datenherkunft. Nicht nur Bots, sondern Nutzungsgrenzen. Nicht nur Agenturen, sondern belastbare Verträge. Nicht nur Content, sondern Struktur.

Genau darin liegt die eigentliche Stärke des Wiki-Ansatzes. Er bringt Ordnung in ein Feld, das technisch immer mächtiger, aber rechtlich und organisatorisch auch immer komplexer wird. Für Startups ist das kein Nachteil, sondern eine Chance. Denn wer diese Ordnung früh etabliert, schafft nicht nur Compliance, sondern einen echten strategischen Vorsprung.

Author: Marian Härtel

Marian Härtel ist Rechtsanwalt und Fachanwalt für IT-Recht mit einer über 25-jährigen Erfahrung als Unternehmer und Berater in den Bereichen Games, E-Sport, Blockchain, SaaS und Künstliche Intelligenz. Seine Beratungsschwerpunkte umfassen neben dem IT-Recht insbesondere das Urheberrecht, Medienrecht sowie Wettbewerbsrecht. Er betreut schwerpunktmäßig Start-ups, Agenturen und Influencer, die er in strategischen Fragen, komplexen Vertragsangelegenheiten sowie bei Investitionsprojekten begleitet. Dabei zeichnet sich seine Beratung durch einen interdisziplinären Ansatz aus, der juristische Expertise und langjährige unternehmerische Erfahrung miteinander verbindet. Ziel seiner Tätigkeit ist stets, Mandanten praxisorientierte Lösungen anzubieten und rechtlich fundierte Unterstützung bei der Umsetzung innovativer Geschäftsmodelle zu gewährleisten.