Large Language Model

Kurz erklärt

Ein Large Language Model ist ein KI-Modell, das auf riesigen Textmengen trainiert wurde und Sprache erzeugt sowie versteht. Es ist die Basis von Assistenten wie Copilot.

Wie funktioniert ein Large Language Model?

Ein Large Language Model wurde auf riesigen Textmengen trainiert und sagt zu jeder Eingabe das jeweils wahrscheinlichste nächste Textstück voraus. Aus dieser Wort-für-Wort-Vorhersage entstehen vollständige, sinnvoll wirkende Antworten.

Das Modell zerlegt Texte dafür in kleine Einheiten, sogenannte Tokens, und verarbeitet diese. Begrenzt ist dabei das Kontextfenster, also wie viele Tokens es gleichzeitig berücksichtigen kann.

Ein Large Language Model versteht Inhalte nicht im menschlichen Sinn. Es rechnet mit Wahrscheinlichkeiten aus dem Training. Deshalb kann es flüssig formulieren und dennoch falsch liegen.

Wofür setzen Unternehmen ein Large Language Model ein?

Sprachmodelle sind die Basis vieler praktischer Werkzeuge. Sie bilden den Motor hinter Assistenten wie Microsoft 365 Copilot und vielen Chatbots.

Typische Aufgaben im Arbeitsalltag:

Texte entwerfen, kürzen oder umformulieren
Lange Dokumente und Protokolle zusammenfassen
Inhalte übersetzen und Stil anpassen
Fragen zu firmeneigenen Unterlagen über Retrieval-Augmented Generation beantworten

Die Qualität hängt stark von der Eingabe ab. Ein klar formulierter Prompt führt zu deutlich brauchbareren Ergebnissen.

Large Language Model vs. klassische Suche

Eine klassische Suche liefert eine Liste von Treffern, also Verweise auf vorhandene Dokumente. Die Bewertung und Auswahl übernimmt der Mensch.

Ein Large Language Model formuliert stattdessen eine zusammenhängende Antwort in eigenen Worten. Das ist bequem, birgt aber das Risiko der Halluzination, also einer überzeugend klingenden, aber falschen Aussage.

Für nachprüfbare Auskünfte aus eigenen Quellen kombiniert man beides: Die Suche findet die richtigen Dokumente, das Modell formuliert die Antwort daraus. Genau das leistet Retrieval-Augmented Generation.

FAQ

Häufige Fragen

Kurz und konkret beantwortet.

Was bedeutet das Kontextfenster bei einem LLM?+

Das Kontextfenster gibt an, wie viele Tokens ein Modell gleichzeitig berücksichtigen kann, also Eingabe und Antwort zusammen. Ist ein Dokument länger als das Fenster, kann das Modell nicht alles auf einmal sehen. Größere Fenster erlauben längere Texte, kosten aber mehr Rechenleistung und damit mehr.

Kennt ein LLM aktuelle Informationen?+

Nur eingeschränkt. Ein Modell kennt von sich aus den Wissensstand seines Trainings und hat danach keine neuen Informationen. Aktuelles oder firmeneigenes Wissen kommt erst durch angebundene Quellen hinzu, etwa über eine Websuche oder über Retrieval-Augmented Generation auf eigene Dokumente.

Warum erfindet ein LLM manchmal Antworten?+

Weil es Sprache nach Wahrscheinlichkeit erzeugt und nicht auf eine geprüfte Wissensdatenbank zugreift. Fehlt eine Information, füllt das Modell die Lücke mit dem plausibelsten Text, der falsch sein kann. Diese Halluzinationen lassen sich durch angebundene Quellen verringern, aber nicht vollständig ausschließen.

Sind kostenlose und geschäftliche LLM-Dienste gleich?+

Technisch ähnlich, beim Datenschutz aber sehr unterschiedlich. Kostenlose Verbraucher-Versionen können Eingaben zum Training nutzen. Geschäftliche Angebote sichern dagegen vertraglich zu, dass Inhalte abgeschottet bleiben und nicht zum Training verwendet werden. Für Firmendaten ist das ein entscheidender Unterschied.

Verwandte Begriffe

Künstliche Intelligenz Machine Learning Generative KI Prompt Chatbot

Noch Fragen?

Sprechen wir über Ihre IT.

Ob KI & Daten oder ein anderes Thema — wir schauen uns Ihre Situation an und sagen Ihnen ehrlich, was sinnvoll ist.

Kontakt aufnehmen