Ein Large Language Model ist ein KI-Modell, das auf riesigen Textmengen trainiert wurde und Sprache erzeugt sowie versteht. Es ist die Basis von Assistenten wie Copilot.
Ein Large Language Model wurde auf riesigen Textmengen trainiert und sagt zu jeder Eingabe das jeweils wahrscheinlichste nächste Textstück voraus. Aus dieser Wort-für-Wort-Vorhersage entstehen vollständige, sinnvoll wirkende Antworten.
Das Modell zerlegt Texte dafür in kleine Einheiten, sogenannte Tokens, und verarbeitet diese. Begrenzt ist dabei das Kontextfenster, also wie viele Tokens es gleichzeitig berücksichtigen kann.
Ein Large Language Model versteht Inhalte nicht im menschlichen Sinn. Es rechnet mit Wahrscheinlichkeiten aus dem Training. Deshalb kann es flüssig formulieren und dennoch falsch liegen.
Sprachmodelle sind die Basis vieler praktischer Werkzeuge. Sie bilden den Motor hinter Assistenten wie Microsoft 365 Copilot und vielen Chatbots.
Typische Aufgaben im Arbeitsalltag:
Die Qualität hängt stark von der Eingabe ab. Ein klar formulierter Prompt führt zu deutlich brauchbareren Ergebnissen.
Eine klassische Suche liefert eine Liste von Treffern, also Verweise auf vorhandene Dokumente. Die Bewertung und Auswahl übernimmt der Mensch.
Ein Large Language Model formuliert stattdessen eine zusammenhängende Antwort in eigenen Worten. Das ist bequem, birgt aber das Risiko der Halluzination, also einer überzeugend klingenden, aber falschen Aussage.
Für nachprüfbare Auskünfte aus eigenen Quellen kombiniert man beides: Die Suche findet die richtigen Dokumente, das Modell formuliert die Antwort daraus. Genau das leistet Retrieval-Augmented Generation.
FAQ
Kurz und konkret beantwortet.
Das Kontextfenster gibt an, wie viele Tokens ein Modell gleichzeitig berücksichtigen kann, also Eingabe und Antwort zusammen. Ist ein Dokument länger als das Fenster, kann das Modell nicht alles auf einmal sehen. Größere Fenster erlauben längere Texte, kosten aber mehr Rechenleistung und damit mehr.
Nur eingeschränkt. Ein Modell kennt von sich aus den Wissensstand seines Trainings und hat danach keine neuen Informationen. Aktuelles oder firmeneigenes Wissen kommt erst durch angebundene Quellen hinzu, etwa über eine Websuche oder über Retrieval-Augmented Generation auf eigene Dokumente.
Weil es Sprache nach Wahrscheinlichkeit erzeugt und nicht auf eine geprüfte Wissensdatenbank zugreift. Fehlt eine Information, füllt das Modell die Lücke mit dem plausibelsten Text, der falsch sein kann. Diese Halluzinationen lassen sich durch angebundene Quellen verringern, aber nicht vollständig ausschließen.
Technisch ähnlich, beim Datenschutz aber sehr unterschiedlich. Kostenlose Verbraucher-Versionen können Eingaben zum Training nutzen. Geschäftliche Angebote sichern dagegen vertraglich zu, dass Inhalte abgeschottet bleiben und nicht zum Training verwendet werden. Für Firmendaten ist das ein entscheidender Unterschied.
Verwandte Begriffe
Noch Fragen?
Ob KI & Daten oder ein anderes Thema — wir schauen uns Ihre Situation an und sagen Ihnen ehrlich, was sinnvoll ist.
Kontakt aufnehmenKostenlose Erstberatung
Unverbindlich und ohne Fachchinesisch. Wählen Sie den Weg, der Ihnen am liebsten ist.
4,7 ★ GoogleAntwort in unter 4 Stundenpersönlich seit 2002
Rückruf anfordern
Innerhalb von 4 Stunden — kostenlos und unverbindlich.
Wir melden uns innerhalb von 4 Stunden bei Ihnen.