Knowledge Base: Tipps und Best Practices von moinAI

Über diesen Guide

Eine gut aufgebaute Knowledge-Base ist entscheidend für eine gute Performance des KI-Chatbots im Unternehmen. In diesem Guide zeigt moinAI, welche Inhaltstypen in die Knowledge Base gehören und wie der RAG-Prozess im Wissensmanagement funktioniert. Worauf kommt es beim Aufbau, der Qualitätssicherung und der laufenden Pflege an? Wir erklären die wichtigsten Einstellungen, inklusive Best Practices und typischen Fehlern und wie du sie vermeidest!

moinAI-Features, die im Artikel vorkommen:

Was ist eine Knowledge Base?

Die KI-Wissensdatenbank, auch Knowledge Base genannt, bildet den KI-gestützten Hub für die Organisation, Speicherung und Bereitstellung von relevanten Ressourcen zur Nutzung der KI. Diese Informationen können z.B. FAQs, Anleitungen oder Produktdokumentationen sein und sind meist einem bestimmten Thema zugeordnet. Mithilfe von maschinellem Lernen und der natürlichen Sprachverarbeitung (NLP) erhält die KI Zugriff auf die Inhalte. 

Die moinAI Knowledge Base: Wissen und KI gezielt im Einsatz

Die Knowledge Base ist das Herzstück unseres Chatbots, denn man muss sich bewusst sein, dass KI gerne sehr viel Wissen verwendet und auch weiß, aber eine KI, die kontrolliert ist, das ist die beste KI!

– Johannes Hehr, moinAI 

Die Knowledge Base stellt bei moinAI somit die zentrale Wissensbibliothek des moinAI-Chatbots dar. Als Herzstück der moinAI-Lösung werden hier Ressourcen für KI-Agenten hinzugefügt und verwaltet. Diese werden dann von KI-Agenten genutzt, um die passenden und auf den Fall zugeschnittenen Antworten in der Kundenkommunikation zu geben.

Screenshot der Benutzeroberfläche des „moin AI HUB“ Dashboards für das „Knowledge Base Management“. Das Interface ist auf Deutsch eingestellt. Im oberen Bereich ist eine RAG (Retrieval Augmented Generation) Pipeline mit fünf aufeinanderfolgenden Schritten dargestellt: Wissensabruf, Wissensprüfung, Instruktionen, Antwortgenerierung (mit ausgewähltem LLM „GPT-4o mini“) und Datenextraktion. Mehrere Bereiche sind mit roten Rechtecken hervorgehoben: der Navigationspunkt „Knowledge Base“ in der linken Menüleiste, der „RAG“-Tab oben rechts sowie zwei Buttons mit der Aufschrift „+ NEUE RESSOURCE“ – einer im ersten Schritt des RAG-Prozesses und ein weiterer rechts im Bereich „Alle Inhalte“.

Warum ist die Knowledge Base so wichtig?

Die Knowledge-Base ist der Schlüssel zur optimierten Chatbot-Performance, denn ohne eine geprüfte Datenbasis kann die künstliche Intelligenz halluzinieren oder veraltete Informationen ausgeben. Was Halluzinationen im Kontext von KI genau sind, erklären wir in unserem Artikel hier genauer.  Fehlausgaben wirken sich negativ auf die Automatisierungsrate und Kundenzufriedenheit im Unternehmen aus. Im Gegensatz zu generellen KI-Anwendungen, die häufig als „Blackbox“ wahrgenommen werden, arbeitet die KI von moinAI nur mit explizit hinterlegtem Wissen. Konkrete Vorteile einer Knowledge Base als Rückgrat sind folgende: 

  1. Aktualität und Kontrolle: Wissen kann jederzeit angepasst oder entfernt werden, unabhängig vom KI-Modell selbst.
  2. Höhere Automatisierungsrate: Präzise Antworten reduzieren Eskalationen an menschliche Agenten, sog. Human Takeover. 
  3. Konsistenz: Alle Nutzer erhalten eine unternehmensgeprüfte Antwort, zu jeder Zeit und unabhängig von der Anzahl eingehender Anfragen. 
  4. Markenkonforme Kommunikation; Tonalität und Sprache der Ausgaben spiegeln die Unternehmensidentität wider.
  5. Skalierbarkeit: Die Knowledge Base kann neue Themen oder Produkte durch einfache Erweiterung schnell abdecken, dafür ist kein neues Training notwendig.
  6. Messbarkeit: Mögliche Wissenslücken werden sichtbar und können so gezielt optimiert werden. 

Kurz gesagt: Eine gepflegte Knowledge Base bildet die wichtigste Grundlage für einen zuverlässigen KI-Chatbot im Einsatz im Unternehmen. Sie sichert Qualität und Vertrauenswürdigkeit in der automatisierten Kundenkommunikation!

Welche Inhaltstypen werden in der Knowledge Base hinterlegt?

In der Knowledge Base können Inhaltstypen wie PDFs, Webseiten und CSV-Dateien auf einfache Weise bereitgestellt werden, damit der KI-Agent die richtigen Informationen als Ausgabe bereitstellen kann. Die Formate und deren Verwendung sind hier einmal zusammengefasst: 

Format Wann geeignet? Beispiel
PDFs Handbücher, Produktblätter Technisches Datenblatt
Websites (URL) Bestehende FAQ-Seiten Eingebundene Support-Seite
Dokumente Strukturierte Anleitungen, Policies Fehlerbehebungs-Guide
Frage-Antwort-Paare Hochfrequente Standardfragen „Wie resette ich mein Passwort?“
CSV-Dateien Strukturierte Datensätze Produktkatalog mit Preisen
Ein Screenshot, der zwei verschiedene Suchmodi im Bereich „Alle Inhalte“ einer Knowledge-Base-Benutzeroberfläche zeigt. Im oberen Bereich ist die Standardsuche zu sehen: Das Feld „Name“ ist rot umrahmt, und die Suchleiste zeigt den Platzhaltertext „Suche nach Titel / URL / Name“. Im unteren Bereich ist die Inhaltssuche aktiv: Hier ist das Feld „Inhalt“ rot umrahmt. Die Suchleiste hat nun einen lila Rahmen mit einem Funkeln-Icon und dem Platzhaltertext „Abfrage oder Inhalt, z.B. ‚Wie viel kostet es?‘“. Direkt darunter erscheint ein gelber Hinweisbalken mit der Meldung „Auch 1 nicht verwendete Ressource gefunden ANZEIGEN“, auf den ein roter Pfeil zeigt. Unter beiden Suchleisten befinden sich Filter-Buttons für Dateitypen wie PDF, Webseite und Dokumente.
Alle Inhalte immer im Blick in der moinAI Knowledge Base
Schon gewusst? Das Ressourcenmanagement und die Steuerung der Agenten erfolgen im moinAI Hub

PDFs werden direkt in die Knowledge Base hochgeladen und eingebunden, ohne dass Inhalte manuell übertragen werden müssen. Dabei sind textbasierte PDFs zu bevorzugen, da stark layoutorientierte PDFs mit Spalten oder Tabellen fehlerhafte Textextraktion verursachen können. 

Websites können per URL eingebunden und automatisch ausgelesen werden. Bestehende FAQ-Seiten oder Help-Center-Inhalte lassen sich so ohne Doppelarbeit direkt nutzen. Tipp: Bei aktivierter automatischer Aktualisierung bleibt die Knowledge Base stets synchron mit der Live-Seite. Schlecht geeignete Seiten sind solche mit viel Navigation, Werbung oder dynamisch geladenen JavaScript-Inhalten. Sie liefern oft unbrauchbare Scraping-Ergebnisse. Am besten schlichte, textlastige Seiten einbinden und das Ergebnis prüfen. 

Dokumente sind formatierte Texte mit Absätzen, Überschriften, Aufzählungen und Tabellen. Sie werden direkt im moinAI-Hub erstellt und bearbeitet und sind ideal für erklärungsintensive Inhalte wie Anleitungen und Prozessbeschreibungen. Zu beachten ist: Immer möglichst nur ein Dokument pro Thema, klar gegliedert und ohne redundante Inhalte, zu erstellen. 

Zusammenfassungen für die KI: Für die Ressourcentypen Webseite und Dokument erstellt die KI automatisch eine Zusammenfassung der Inhalte. Diese Abstracts dienen dem KI-Agenten als primäre Entscheidungsgrundlage im Wissensabruf.

Frage-Antwort-Paare verknüpfen eine konkrete Frage mit einer strukturierten Antwort. Die KI erkennt diese direkte Beziehung und liefert so besonders präzise Treffer. Entscheidend ist, Fragen nicht zu allgemein zu formulieren. Je näher die hinterlegte Frage an der echten Sprache der Nutzer ist, desto besser das Match. 

CSV-Dateien sind vor allem strukturierte Datensätze wie Produktlisten und Preistabellen und bilden große Mengen strukturierter Informationen für die KI ab. Sie kann direkt darauf zugreifen, ohne dass eine Aufbereitung nötig ist. Saubere Datenhygiene ist hier allerdings die Voraussetzung: Fehlende definierte Kopfzeile, inkonsistente Spaltenbezeichnungen oder gemischte Datenformate innerhalb einer Spalte können zu Interpretationsfehlern führen. 

Übrigens: Auch externe Artikel können zu der Knowledge Base hinzugefügt werden, die Anbindung erfolgt allerdings über eine API! 

Schritt für Schritt: die Knowledge Base füllen

1. Bestandsaufnahme

Bevor erste Ressourcen angelegt werden, lohnt es sich, einen Blick in die eigene Datenlage zu werfen: Welche Fragen stellen Kunden am häufigsten und über welchen Kanal? Dazu zählen Live-Chat, E-Mail und der Telefon-Support. Am wertvollsten für die interne Analyse sind bestehende Support-Tickets und Chat-Logs, um Kundenanliegen zu identifizieren. Die eigene FAQ-Seite ist auch eine wichtige Quelle für Hinweise. 

Das Ergebnis der Analyse sollte eine Prioritätenliste sein, d. h., idealerweise lassen sich die Top-20-Fragen, die den größten Anteil am täglichen Anfragevolumen ausmachen, identifizieren. Sie bilden den Kern der Knowledge Base und stellen von Beginn an eine hohe Automatisierungsrate sicher. In einem zweiten Schritt werden daraufhin weniger frequente oder komplexere Themen ergänzt.

2. Inhalte aufbereiten

Für die Aufbereitung der Inhalte gilt eine Faustregel: Die KI ist nur so gut wie die Inhalte, die sie bekommt! Das heißt, das Wissen, das in der Knowledge Base erfasst wird, sollte klar verfasst und strukturiert sein. Qualität steht dabei vor Quantität, wobei besonders Folgendes beachtet werden muss: 

  • Deutlich formulieren: Floskeln und mehrdeutige Formulierungen verwirren die KI. Kurze, direkte Sätze mit konkreten Informationen liefern die besten Ergebnisse, ausschweifende Produkttexte sind problematisch. 
  • Thematisch gliedern: Ein Dokument pro Thema ist besser als ein langes Dokument zu vielen Themen gleichzeitig. Je Dokument-Ressource wird dabei automatisch eine Zusammenfassung erstellt, die der RAG-Agent analysiert. Auf Basis dessen entscheidet er, ob der vollständige Inhalt für eine Antwort herangezogen wird. Unscharf formulierte oder thematisch überladene Dokumente werden seltener korrekt gefunden.
  • Frage-Antwort-Paare gezielt nutzen: Das präziseste Format für wiederkehrende Standardfragen sind Frage-Antwort-Paare. Je näher die gespeicherte Frage an der echten Sprache der Nutzer ist, desto besser passt die Antwort. Formulierungen direkt aus Chat-Protokollen eignen sich hier am besten, nicht die Begriffe aus dem Fachbereich.

3. Qualitätssicherung vor Veröffentlichung

Vor dem Live-Gang des KI-Chatbots sollten hinterlegte Inhalte unter realen Bedingungen getestet werden. Bei moinAI steht dafür im moinAI Hub der KI-Playground zur Verfügung: Hier können echte Kundenfragen direkt gegen die Knowledge Base getestet werden, die Antworten sowie die genutzten Quellen werden genau überprüft. Besonders zwei Einstellungen sollten vor dem Go-live richtig gesetzt werden: 

  1. Wissensprüfung aktivieren: Damit werden die Kriterien für die Antwortgenerierung verschärft. Nur wenn die hinterlegten Quellen eine eindeutige und belegbare Antwort zulassen, gibt der KI-Agent eine Antwort aus. In kritischen Fällen wird die Antwortgenerierung sogar absichtlich unterdrückt, um Halluzinationen vorzubeugen. Verhindert Halluzinationen. 
  2. Guardrails konfigurieren: Einige grundlegende Sicherheitsmechanismen wie Inhaltsbeschränkungen, Themenrestriktionen und Schutz vor Prompt-Injections sind standardmäßig aktiv. Zusätzlich dazu kann optional der Wettbewerbsschutz aktiviert werden. Er blockiert Anfragen zu Konkurrenzprodukten oder leitet diese auf das eigene Angebot um. Bei besonders sensiblen Angelegenheiten steht zudem eine Compliance-Kontrolle zur Verfügung, um eine zweite explizite Prüfung aller Anfragen durchzuführen.
Sicherheit geht vor: Mit der Wissensprüfung gibt das System nur eine Antwort aus, wenn die KI sich sicher ist. Das senkt zwar die Automatisierungsrate, verhindert aber Fehler!

4. Laufende Pflege

Damit keine veralteten Inhalte und schlechte Ausgaben vorliegen, muss die Knowledge Base aktuell gehalten werden. Die laufende Pflege ist aber nicht ausschließlich manueller Aufwand, sondern kann mithilfe einiger Features automatisiert ablaufen:

  • Automatische Aktualisierung nutzen: Im Hub kann ein festes Aktualisierungsintervall gesetzt werden,  zur Auswahl stehen 7, 14 oder 30 Tage. Für besonders volatile Inhalte wie Preise, Öffnungszeiten oder Verfügbarkeiten gibt es zusätzlich die
  • Echtzeit-Aktualisierung: Wenn auf aktiv gesetzt, prüft das System bei jeder Anfrage, ob der gespeicherte Inhalt noch innerhalb der definierten Gültigkeitsdauer liegt. Bei Bedarf erfolgt direkt ein neues Scraping der Seite. Zu beachten ist, dass kürzere Intervalle kurzweilig die Antwortzeit erhöhen, der Trade-off ist es aber wert! 
  • MCP-Server für automatisiertes Content-Management: Über den moinAI MCP-Server können Inhalte per Befehl abgerufen, erstellt und bearbeitet bzw. gelöscht werden. Dadurch wird die Knowledge Base in eine bestehende KI-Umgebung eingebunden – ohne manuellen Aufwand im Hub. Dies ist vor allem von Vorteil, wenn Inhalte regelmäßig aus externen Systemen synchronisiert werden sollen.
  • Wissenslücken systematisch schließen: Im Hub gibt es den Bereich fehlendes Wissen. Alle Anfragen, zu denen der Chatbot keine passende Antwort liefern konnte, werden hier aufgelistet. Das kann aufgrund einer fehlenden Ressource zu einem bestimmten Thema passieren oder weil vorhandene Quellen unzureichend vorlagen. Per Klick auf die Sprechblase lässt sich der gesamte Chatverlauf öffnen, um die Liste aller Lücken zu inspizieren. Diese Customer Insights sind die direkteste und wertvollste Quelle für die kontinuierliche Weiterentwicklung der Knowledge Base. 

Technische Kriterien für eine optimale Knowledge Base-Performance

Grundvoraussetzung für die optimale Knowledge Base Performance ist eine klare Datenhierarchie und eine hohe Qualität der Eingabedaten. Wie zuvor beschrieben, müssen Inhalte eindeutig kategorisiert vorliegen, um widersprüchliche Ausgaben zu vermeiden. Unstrukturierte oder veraltete Quellen erhöhen die Fehlerquote. Zusammengefasst benötigt die KI Folgendes, um wirklich gut zu werden:

  • Eindeutigkeit: Keine widersprüchlichen Informationen in verschiedenen Dokumenten
  • Granularität: Lieber mehrere spezifische Dokumente als ein langes, generisches
  • Aktualität: Pflegeprozesse, also eine kontinuierliche Monitoring-Infrastruktur, sind essenziell, denn veraltete Inhalte verschlechtern die Trefferquote
  • Sprache und Tonalität: Inhalte sollten die Sprache der Nutzer widerspiegeln
  • CSV-Struktur: Header-Zeilen sind Pflicht und eine saubere Datenhygiene ist entscheidend
  • PDF-Qualität: Nur textbasierte PDFs (keine gescannten Bilder ohne OCR)

Bei moinAI sind Änderungen in Echtzeit, ohne Modell-Retraining, möglich, sodass eine dauerhaft hohe Antwortqualität bei minimalem Wartungsaufwand gewährleistet werden kann. 

Der RAG-Agent macht aus Wissen Antworten 

Retrieval heißt Abgriff von Informationen, Augmented heißt, ich erweitere mein Wissen, und Generate bedeutet dann, ich generiere eine Antwort. Das heißt, die KI bei moinAI ist in der Lage zu sagen: Ich suche zusätzliche Informationen, die mir der Nutzer in der Knowledge Base zur Verfügung stellt, ich erweitere mein Wissen darum und aus Quelle und meinem Wissen eine Antwort. Dadurch wird die Antwort präziser, sicherer und viel gehaltvoller für den Nutzer.

– Johannes Hehr, moinAI

RAG ist ein strukturierter Prozess für das Knowledge Base Management, der diverse Einstellungsmöglichkeiten bietet, um die Antworten der KI-Agenten bzw. die generative KI zu steuern. Stellt ein Nutzer eine Frage, durchsucht der KI-Agent gezielt die hinterlegten Quellen nach relevanten Inhalten. Das RAG-System ruft dynamisch relevante Informationen ab, die Quellenauswahl erfolgt in zwei Stufen: Zunächst wird die Zusammenfassung einer Ressource geprüft, schließlich wird nur bei erkannter Relevanz der vollständige Inhalt zur Generierung der Antworten verwendet. Kein Raten, sondern auf die Anfrage angepasste, belegte Antworten. Über Instruktionen können inhaltsbezogene Vorgaben für die Antwortgenerierung des Agenten hinterlegt werden. Tonalität und Kommunikationsrichtlinien hingegen werden separat über Richtlinien und Persona gesteuert. Das Large-Language-Modell wird passend zu den bestmöglichen anwendungsbezogenen Funktionalitäten der KI-Agenten ausgewählt. Zur Auswahl stehen aktuelle Modelle der GPT-Serie über Microsoft Azure sowie Open-Weight-Modelle.

Du hast Fragen zur Knowledge Base oder zum Wissensmanagement? Dein festes Customer-Success-Team bei moinAI ist immer für dich da, mit einem persönlichen Ansprechpartner, der dich und dein Set-up kennt!

Besonders hilfreich für die Falllösung sind KI-Aktionen für KI-Agenten: Sie ermöglichen dem Agenten, über die reine Antwortgenerierung hinaus zu agieren und automatische Folgefragen zu stellen oder Aktionen in Drittsystemen anzustoßen. Hier der RAG-Prozess auf einen Blick: 

Sicherheitsmaßnahmen 

Die Zuverlässigkeit der extrahierten Daten wird durch Guardrails gesichert: fest verankerte Sicherheitsmechanismen, die Halluzinationen reduzieren und Themenrestriktionen durchsetzen. Guardrails blockieren aktiv Manipulationsversuche wie z. B. das gezielte Aushebeln von Sicherheitsregeln oder Identitätsanmaßungen. Sie sind immer aktiv und erhöhen die Sicherheit: 

  • Keine schädlichen oder vertraulichen Inhalte
  • Themen bleiben auf definierte Bereiche beschränkt
  • Halluzinationen werden durch ausschließliche Nutzung geprüfter Quellen reduziert
  • Spam oder unleserliche Anfragen werden ignoriert
  • Systeminterne Informationen (z. B. Prompts) sind nicht abfragbar
  • Identitätsanmaßungen (z. B. Phishing) werden unterbunden
  • Beleidigende oder missbräuchliche Sprache wird gefiltert

Zusätzlich kann die Wissensprüfung verschärft werden: Wenn aktiviert, generiert der KI-Agent nur bei eindeutiger Faktenlage in der Knowledge Base die Ausgabe, bei Unsicherheit bleibt die Anfrage lieber unbeantwortet. Mit der Aktivierung des Wettbewerbsschutzes werden Anfragen zu Konkurrenzprodukten entweder blockiert oder automatisch in eine Anfrage zum eigenen Produkt umgewandelt. Der Agent bleibt so konsequent auf die eigene Marke fokussiert.

Häufige Fehler – und wie du sie vermeidest

Typische Knowledge-Base-Stolperfallen lassen sich mit den richtigen Maßnahmen gezielt vermeiden. Wir zeigen dir einige typische Fehler und was du tun kannst, damit die Knowledge Base korrekt aufgesetzt ist: 

Checkliste: Darauf kommt es bei einem Chatbot an
  • ⚠️ Zu generische DokumenteInhalte sollten in granulare, themenspezifische Einheiten aufgeteilt werden, die jeweils eine klare Fragestellung abdecken
  • ⚠️ Widersprüchliche Informationen aus verschiedenen Quellen:Mehrere Ressourcen, gleiches Thema, abweichende Aussagen: Regelmäßige Quellen-Audits stellen sicher, dass veraltete oder redundante Inhalte entfernt oder zusammengeführt werden.
  • ⚠️ Fehlende Guardrail-Konfiguration:Wettbewerbsschutz und Compliance-Kontrolle sollten je nach Unternehmenskontext bewusst aktiviert oder deaktiviert werden, Guardrails sind immer aktiv, sollten aber aktiv geprüft werden.
  • ⚠️ PDFs mit gescanntem Text:Eingescannte Dokumente werden wie ein Bild behandelt und können nicht ausgelesen werden, textbasierte Formate sind essenziell in der Ressourcenverwaltung!
  • ⚠️ Knowledge Base wird nicht aktualisiert:Einmal befüllt und vergessen: Regelmäßige Überprüfung und Aktualisierung der Ressourcen ist Pflicht, damit die Qualität der Antworten auch über die Zeit erhalten bleibt.

Datenschutz & DSGVO-Konformität

Die Datenkontrolle bleibt vollständig beim Unternehmen, denn moinAI arbeitet ausschließlich mit explizit hinterlegtem Wissen: Kein unkontrolliertes Lernen aus externen Quellen, keine Weitergabe sensibler Informationen in fremde Trainingsdatensätze. Alle Daten werden auf Servern in Deutschland gespeichert und sind SSL-verschlüsselt. Ohne vorherige Nutzereinwilligung erfasst moinAI keine personalisierten Daten. Zudem ist die manuelle Löschung von Gesprächsdaten auf Anfrage immer möglich. Der rollenbasierte Zugriff im moinAI Hub erlaubt es, interne Datenzugriffe gezielt zu steuern.

Fazit 

Damit die Qualität des KI-Chatbots im Einsatz gesichert ist, muss die Wissensbasis, also die Knowledge Base, als Fundament an sich strukturiert aufgesetzt und kontinuierlich aktualisiert sein. Eine saubere Knowledge-Base verbessert die Automatisierungsraten und erhöht die Kundenzufriedenheit nachhaltig. Das Besondere an moinAI: Die KI arbeitet ausschließlich mit dem Wissen, das du und dein Unternehmen bereitstellt. Die Verarbeitung und Nutzung sind transparent und DSGVO-konform. Denn Unternehmen und Nutzer müssen gleichermaßen der KI vertrauen können, damit der Einsatz erfolgreich ist und das volle Potenzial der Automatisierung genutzt werden kann.

[[CTA headline="Weniger Support-Tickets, bessere Antworten!" subline="Mit einer gut gepflegten Knowledge Base automatisiert moinAI bis zu 80 % der wiederkehrenden Kundenanfragen. Jetzt starten."]]

Zufriedenere Kunden durch schnellere Antworten.

Überzeuge dich selbst und erstelle deinen eigenen Chatbot. Kostenlos und unverbindlich.