Was ist eine Knowledge Base?
Die KI-Wissensdatenbank, auch Knowledge Base genannt, bildet den KI-gestützten Hub für die Organisation, Speicherung und Bereitstellung von relevanten Ressourcen zur Nutzung der KI. Diese Informationen können z.B. FAQs, Anleitungen oder Produktdokumentationen sein und sind meist einem bestimmten Thema zugeordnet. Mithilfe von maschinellem Lernen und der natürlichen Sprachverarbeitung (NLP) erhält die KI Zugriff auf die Inhalte.
Die moinAI Knowledge Base: Wissen und KI gezielt im Einsatz
Die Knowledge Base ist das Herzstück unseres Chatbots, denn man muss sich bewusst sein, dass KI gerne sehr viel Wissen verwendet und auch weiß, aber eine KI, die kontrolliert ist, das ist die beste KI!
– Johannes Hehr, moinAI
Die Knowledge Base stellt bei moinAI somit die zentrale Wissensbibliothek des moinAI-Chatbots dar. Als Herzstück der moinAI-Lösung werden hier Ressourcen für KI-Agenten hinzugefügt und verwaltet. Diese werden dann von KI-Agenten genutzt, um die passenden und auf den Fall zugeschnittenen Antworten in der Kundenkommunikation zu geben.

Warum ist die Knowledge Base so wichtig?
Die Knowledge-Base ist der Schlüssel zur optimierten Chatbot-Performance, denn ohne eine geprüfte Datenbasis kann die künstliche Intelligenz halluzinieren oder veraltete Informationen ausgeben. Was Halluzinationen im Kontext von KI genau sind, erklären wir in unserem Artikel hier genauer. Fehlausgaben wirken sich negativ auf die Automatisierungsrate und Kundenzufriedenheit im Unternehmen aus. Im Gegensatz zu generellen KI-Anwendungen, die häufig als „Blackbox“ wahrgenommen werden, arbeitet die KI von moinAI nur mit explizit hinterlegtem Wissen. Konkrete Vorteile einer Knowledge Base als Rückgrat sind folgende:
- Aktualität und Kontrolle: Wissen kann jederzeit angepasst oder entfernt werden, unabhängig vom KI-Modell selbst.
- Höhere Automatisierungsrate: Präzise Antworten reduzieren Eskalationen an menschliche Agenten, sog. Human Takeover.
- Konsistenz: Alle Nutzer erhalten eine unternehmensgeprüfte Antwort, zu jeder Zeit und unabhängig von der Anzahl eingehender Anfragen.
- Markenkonforme Kommunikation; Tonalität und Sprache der Ausgaben spiegeln die Unternehmensidentität wider.
- Skalierbarkeit: Die Knowledge Base kann neue Themen oder Produkte durch einfache Erweiterung schnell abdecken, dafür ist kein neues Training notwendig.
- Messbarkeit: Mögliche Wissenslücken werden sichtbar und können so gezielt optimiert werden.
Kurz gesagt: Eine gepflegte Knowledge Base bildet die wichtigste Grundlage für einen zuverlässigen KI-Chatbot im Einsatz im Unternehmen. Sie sichert Qualität und Vertrauenswürdigkeit in der automatisierten Kundenkommunikation!
Welche Inhaltstypen werden in der Knowledge Base hinterlegt?
In der Knowledge Base können Inhaltstypen wie PDFs, Webseiten und CSV-Dateien auf einfache Weise bereitgestellt werden, damit der KI-Agent die richtigen Informationen als Ausgabe bereitstellen kann. Die Formate und deren Verwendung sind hier einmal zusammengefasst:

PDFs werden direkt in die Knowledge Base hochgeladen und eingebunden, ohne dass Inhalte manuell übertragen werden müssen. Dabei sind textbasierte PDFs zu bevorzugen, da stark layoutorientierte PDFs mit Spalten oder Tabellen fehlerhafte Textextraktion verursachen können.
Websites können per URL eingebunden und automatisch ausgelesen werden. Bestehende FAQ-Seiten oder Help-Center-Inhalte lassen sich so ohne Doppelarbeit direkt nutzen. Tipp: Bei aktivierter automatischer Aktualisierung bleibt die Knowledge Base stets synchron mit der Live-Seite. Schlecht geeignete Seiten sind solche mit viel Navigation, Werbung oder dynamisch geladenen JavaScript-Inhalten. Sie liefern oft unbrauchbare Scraping-Ergebnisse. Am besten schlichte, textlastige Seiten einbinden und das Ergebnis prüfen.
Dokumente sind formatierte Texte mit Absätzen, Überschriften, Aufzählungen und Tabellen. Sie werden direkt im moinAI-Hub erstellt und bearbeitet und sind ideal für erklärungsintensive Inhalte wie Anleitungen und Prozessbeschreibungen. Zu beachten ist: Immer möglichst nur ein Dokument pro Thema, klar gegliedert und ohne redundante Inhalte, zu erstellen.
Frage-Antwort-Paare verknüpfen eine konkrete Frage mit einer strukturierten Antwort. Die KI erkennt diese direkte Beziehung und liefert so besonders präzise Treffer. Entscheidend ist, Fragen nicht zu allgemein zu formulieren. Je näher die hinterlegte Frage an der echten Sprache der Nutzer ist, desto besser das Match.
CSV-Dateien sind vor allem strukturierte Datensätze wie Produktlisten und Preistabellen und bilden große Mengen strukturierter Informationen für die KI ab. Sie kann direkt darauf zugreifen, ohne dass eine Aufbereitung nötig ist. Saubere Datenhygiene ist hier allerdings die Voraussetzung: Fehlende definierte Kopfzeile, inkonsistente Spaltenbezeichnungen oder gemischte Datenformate innerhalb einer Spalte können zu Interpretationsfehlern führen.
Übrigens: Auch externe Artikel können zu der Knowledge Base hinzugefügt werden, die Anbindung erfolgt allerdings über eine API!
.png)
Schritt für Schritt: die Knowledge Base füllen
1. Bestandsaufnahme
Bevor erste Ressourcen angelegt werden, lohnt es sich, einen Blick in die eigene Datenlage zu werfen: Welche Fragen stellen Kunden am häufigsten und über welchen Kanal? Dazu zählen Live-Chat, E-Mail und der Telefon-Support. Am wertvollsten für die interne Analyse sind bestehende Support-Tickets und Chat-Logs, um Kundenanliegen zu identifizieren. Die eigene FAQ-Seite ist auch eine wichtige Quelle für Hinweise.
Das Ergebnis der Analyse sollte eine Prioritätenliste sein, d. h., idealerweise lassen sich die Top-20-Fragen, die den größten Anteil am täglichen Anfragevolumen ausmachen, identifizieren. Sie bilden den Kern der Knowledge Base und stellen von Beginn an eine hohe Automatisierungsrate sicher. In einem zweiten Schritt werden daraufhin weniger frequente oder komplexere Themen ergänzt.
2. Inhalte aufbereiten
Für die Aufbereitung der Inhalte gilt eine Faustregel: Die KI ist nur so gut wie die Inhalte, die sie bekommt! Das heißt, das Wissen, das in der Knowledge Base erfasst wird, sollte klar verfasst und strukturiert sein. Qualität steht dabei vor Quantität, wobei besonders Folgendes beachtet werden muss:
- Deutlich formulieren: Floskeln und mehrdeutige Formulierungen verwirren die KI. Kurze, direkte Sätze mit konkreten Informationen liefern die besten Ergebnisse, ausschweifende Produkttexte sind problematisch.
- Thematisch gliedern: Ein Dokument pro Thema ist besser als ein langes Dokument zu vielen Themen gleichzeitig. Je Dokument-Ressource wird dabei automatisch eine Zusammenfassung erstellt, die der RAG-Agent analysiert. Auf Basis dessen entscheidet er, ob der vollständige Inhalt für eine Antwort herangezogen wird. Unscharf formulierte oder thematisch überladene Dokumente werden seltener korrekt gefunden.
- Frage-Antwort-Paare gezielt nutzen: Das präziseste Format für wiederkehrende Standardfragen sind Frage-Antwort-Paare. Je näher die gespeicherte Frage an der echten Sprache der Nutzer ist, desto besser passt die Antwort. Formulierungen direkt aus Chat-Protokollen eignen sich hier am besten, nicht die Begriffe aus dem Fachbereich.
3. Qualitätssicherung vor Veröffentlichung
Vor dem Live-Gang des KI-Chatbots sollten hinterlegte Inhalte unter realen Bedingungen getestet werden. Bei moinAI steht dafür im moinAI Hub der KI-Playground zur Verfügung: Hier können echte Kundenfragen direkt gegen die Knowledge Base getestet werden, die Antworten sowie die genutzten Quellen werden genau überprüft. Besonders zwei Einstellungen sollten vor dem Go-live richtig gesetzt werden:
- Wissensprüfung aktivieren: Damit werden die Kriterien für die Antwortgenerierung verschärft. Nur wenn die hinterlegten Quellen eine eindeutige und belegbare Antwort zulassen, gibt der KI-Agent eine Antwort aus. In kritischen Fällen wird die Antwortgenerierung sogar absichtlich unterdrückt, um Halluzinationen vorzubeugen. Verhindert Halluzinationen.
- Guardrails konfigurieren: Einige grundlegende Sicherheitsmechanismen wie Inhaltsbeschränkungen, Themenrestriktionen und Schutz vor Prompt-Injections sind standardmäßig aktiv. Zusätzlich dazu kann optional der Wettbewerbsschutz aktiviert werden. Er blockiert Anfragen zu Konkurrenzprodukten oder leitet diese auf das eigene Angebot um. Bei besonders sensiblen Angelegenheiten steht zudem eine Compliance-Kontrolle zur Verfügung, um eine zweite explizite Prüfung aller Anfragen durchzuführen.
4. Laufende Pflege
Damit keine veralteten Inhalte und schlechte Ausgaben vorliegen, muss die Knowledge Base aktuell gehalten werden. Die laufende Pflege ist aber nicht ausschließlich manueller Aufwand, sondern kann mithilfe einiger Features automatisiert ablaufen:
- Automatische Aktualisierung nutzen: Im Hub kann ein festes Aktualisierungsintervall gesetzt werden, zur Auswahl stehen 7, 14 oder 30 Tage. Für besonders volatile Inhalte wie Preise, Öffnungszeiten oder Verfügbarkeiten gibt es zusätzlich die
- Echtzeit-Aktualisierung: Wenn auf aktiv gesetzt, prüft das System bei jeder Anfrage, ob der gespeicherte Inhalt noch innerhalb der definierten Gültigkeitsdauer liegt. Bei Bedarf erfolgt direkt ein neues Scraping der Seite. Zu beachten ist, dass kürzere Intervalle kurzweilig die Antwortzeit erhöhen, der Trade-off ist es aber wert!
- MCP-Server für automatisiertes Content-Management: Über den moinAI MCP-Server können Inhalte per Befehl abgerufen, erstellt und bearbeitet bzw. gelöscht werden. Dadurch wird die Knowledge Base in eine bestehende KI-Umgebung eingebunden – ohne manuellen Aufwand im Hub. Dies ist vor allem von Vorteil, wenn Inhalte regelmäßig aus externen Systemen synchronisiert werden sollen.
- Wissenslücken systematisch schließen: Im Hub gibt es den Bereich fehlendes Wissen. Alle Anfragen, zu denen der Chatbot keine passende Antwort liefern konnte, werden hier aufgelistet. Das kann aufgrund einer fehlenden Ressource zu einem bestimmten Thema passieren oder weil vorhandene Quellen unzureichend vorlagen. Per Klick auf die Sprechblase lässt sich der gesamte Chatverlauf öffnen, um die Liste aller Lücken zu inspizieren. Diese Customer Insights sind die direkteste und wertvollste Quelle für die kontinuierliche Weiterentwicklung der Knowledge Base.
Technische Kriterien für eine optimale Knowledge Base-Performance
Grundvoraussetzung für die optimale Knowledge Base Performance ist eine klare Datenhierarchie und eine hohe Qualität der Eingabedaten. Wie zuvor beschrieben, müssen Inhalte eindeutig kategorisiert vorliegen, um widersprüchliche Ausgaben zu vermeiden. Unstrukturierte oder veraltete Quellen erhöhen die Fehlerquote. Zusammengefasst benötigt die KI Folgendes, um wirklich gut zu werden:
- Eindeutigkeit: Keine widersprüchlichen Informationen in verschiedenen Dokumenten
- Granularität: Lieber mehrere spezifische Dokumente als ein langes, generisches
- Aktualität: Pflegeprozesse, also eine kontinuierliche Monitoring-Infrastruktur, sind essenziell, denn veraltete Inhalte verschlechtern die Trefferquote
- Sprache und Tonalität: Inhalte sollten die Sprache der Nutzer widerspiegeln
- CSV-Struktur: Header-Zeilen sind Pflicht und eine saubere Datenhygiene ist entscheidend
- PDF-Qualität: Nur textbasierte PDFs (keine gescannten Bilder ohne OCR)
Bei moinAI sind Änderungen in Echtzeit, ohne Modell-Retraining, möglich, sodass eine dauerhaft hohe Antwortqualität bei minimalem Wartungsaufwand gewährleistet werden kann.
Der RAG-Agent macht aus Wissen Antworten
Retrieval heißt Abgriff von Informationen, Augmented heißt, ich erweitere mein Wissen, und Generate bedeutet dann, ich generiere eine Antwort. Das heißt, die KI bei moinAI ist in der Lage zu sagen: Ich suche zusätzliche Informationen, die mir der Nutzer in der Knowledge Base zur Verfügung stellt, ich erweitere mein Wissen darum und aus Quelle und meinem Wissen eine Antwort. Dadurch wird die Antwort präziser, sicherer und viel gehaltvoller für den Nutzer.
– Johannes Hehr, moinAI
RAG ist ein strukturierter Prozess für das Knowledge Base Management, der diverse Einstellungsmöglichkeiten bietet, um die Antworten der KI-Agenten bzw. die generative KI zu steuern. Stellt ein Nutzer eine Frage, durchsucht der KI-Agent gezielt die hinterlegten Quellen nach relevanten Inhalten. Das RAG-System ruft dynamisch relevante Informationen ab, die Quellenauswahl erfolgt in zwei Stufen: Zunächst wird die Zusammenfassung einer Ressource geprüft, schließlich wird nur bei erkannter Relevanz der vollständige Inhalt zur Generierung der Antworten verwendet. Kein Raten, sondern auf die Anfrage angepasste, belegte Antworten. Über Instruktionen können inhaltsbezogene Vorgaben für die Antwortgenerierung des Agenten hinterlegt werden. Tonalität und Kommunikationsrichtlinien hingegen werden separat über Richtlinien und Persona gesteuert. Das Large-Language-Modell wird passend zu den bestmöglichen anwendungsbezogenen Funktionalitäten der KI-Agenten ausgewählt. Zur Auswahl stehen aktuelle Modelle der GPT-Serie über Microsoft Azure sowie Open-Weight-Modelle.
Besonders hilfreich für die Falllösung sind KI-Aktionen für KI-Agenten: Sie ermöglichen dem Agenten, über die reine Antwortgenerierung hinaus zu agieren und automatische Folgefragen zu stellen oder Aktionen in Drittsystemen anzustoßen. Hier der RAG-Prozess auf einen Blick:

Sicherheitsmaßnahmen
Die Zuverlässigkeit der extrahierten Daten wird durch Guardrails gesichert: fest verankerte Sicherheitsmechanismen, die Halluzinationen reduzieren und Themenrestriktionen durchsetzen. Guardrails blockieren aktiv Manipulationsversuche wie z. B. das gezielte Aushebeln von Sicherheitsregeln oder Identitätsanmaßungen. Sie sind immer aktiv und erhöhen die Sicherheit:
- Keine schädlichen oder vertraulichen Inhalte
- Themen bleiben auf definierte Bereiche beschränkt
- Halluzinationen werden durch ausschließliche Nutzung geprüfter Quellen reduziert
- Spam oder unleserliche Anfragen werden ignoriert
- Systeminterne Informationen (z. B. Prompts) sind nicht abfragbar
- Identitätsanmaßungen (z. B. Phishing) werden unterbunden
- Beleidigende oder missbräuchliche Sprache wird gefiltert
Zusätzlich kann die Wissensprüfung verschärft werden: Wenn aktiviert, generiert der KI-Agent nur bei eindeutiger Faktenlage in der Knowledge Base die Ausgabe, bei Unsicherheit bleibt die Anfrage lieber unbeantwortet. Mit der Aktivierung des Wettbewerbsschutzes werden Anfragen zu Konkurrenzprodukten entweder blockiert oder automatisch in eine Anfrage zum eigenen Produkt umgewandelt. Der Agent bleibt so konsequent auf die eigene Marke fokussiert.
Häufige Fehler – und wie du sie vermeidest
Typische Knowledge-Base-Stolperfallen lassen sich mit den richtigen Maßnahmen gezielt vermeiden. Wir zeigen dir einige typische Fehler und was du tun kannst, damit die Knowledge Base korrekt aufgesetzt ist:
Datenschutz & DSGVO-Konformität
Die Datenkontrolle bleibt vollständig beim Unternehmen, denn moinAI arbeitet ausschließlich mit explizit hinterlegtem Wissen: Kein unkontrolliertes Lernen aus externen Quellen, keine Weitergabe sensibler Informationen in fremde Trainingsdatensätze. Alle Daten werden auf Servern in Deutschland gespeichert und sind SSL-verschlüsselt. Ohne vorherige Nutzereinwilligung erfasst moinAI keine personalisierten Daten. Zudem ist die manuelle Löschung von Gesprächsdaten auf Anfrage immer möglich. Der rollenbasierte Zugriff im moinAI Hub erlaubt es, interne Datenzugriffe gezielt zu steuern.
Fazit
Damit die Qualität des KI-Chatbots im Einsatz gesichert ist, muss die Wissensbasis, also die Knowledge Base, als Fundament an sich strukturiert aufgesetzt und kontinuierlich aktualisiert sein. Eine saubere Knowledge-Base verbessert die Automatisierungsraten und erhöht die Kundenzufriedenheit nachhaltig. Das Besondere an moinAI: Die KI arbeitet ausschließlich mit dem Wissen, das du und dein Unternehmen bereitstellt. Die Verarbeitung und Nutzung sind transparent und DSGVO-konform. Denn Unternehmen und Nutzer müssen gleichermaßen der KI vertrauen können, damit der Einsatz erfolgreich ist und das volle Potenzial der Automatisierung genutzt werden kann.
[[CTA headline="Weniger Support-Tickets, bessere Antworten!" subline="Mit einer gut gepflegten Knowledge Base automatisiert moinAI bis zu 80 % der wiederkehrenden Kundenanfragen. Jetzt starten."]]




