Token

Kurz erklärt

Ein Token ist die kleinste Texteinheit, die ein Sprachmodell verarbeitet. Die Zahl der Tokens bestimmt mit, wie viel Text ein Modell auf einmal verarbeiten kann und was es kostet.

Wie funktioniert ein Token in einem Sprachmodell?

Ein Token ist die kleinste Texteinheit, die ein Sprachmodell verarbeitet. Ein Modell sieht keine Buchstaben oder ganzen Wörter, sondern zerlegt Text in solche Tokens und rechnet mit ihnen.

Ein Token entspricht oft einem kurzen Wort oder einem Wortteil. Als grobe Faustregel gelten im Deutschen rund 100 Tokens für etwa 60 bis 80 Wörter, abhängig vom Text.

Bei der Antwort sagt das Large Language Model Token für Token das jeweils wahrscheinlichste nächste voraus. So entsteht aus vielen kleinen Schritten der vollständige Text.

Warum sind Tokens für Kosten und Kontext wichtig?

Tokens sind die Recheneinheit der Sprachmodelle. Sie bestimmen sowohl die Kosten als auch die Grenze dessen, was ein Modell auf einmal verarbeiten kann.

Zwei Punkte hängen direkt an den Tokens:

Kosten: Viele Dienste rechnen pro verarbeitetem Token ab, für Eingabe und Antwort zusammen.
Kontextfenster: Es begrenzt die Tokenzahl, die Eingabe und Antwort gemeinsam nicht überschreiten dürfen.

Lange Eingaben kosten daher mehr und können das Kontextfenster sprengen. Knappe, präzise Prompts sparen Tokens und damit Geld.

FAQ

Häufige Fragen

Kurz und konkret beantwortet.

Wie viele Tokens sind ein Wort?+

Es gibt kein festes Verhältnis, weil ein Token oft nur ein Wortteil ist. Als grobe Orientierung entsprechen im Deutschen rund 100 Tokens etwa 60 bis 80 Wörtern. Kurze, häufige Wörter sind meist ein Token, lange oder seltene Wörter werden in mehrere Tokens zerlegt.

Warum begrenzt das Kontextfenster die Tokenzahl?+

Das Modell kann nur eine bestimmte Anzahl Tokens gleichzeitig berücksichtigen, das ist das Kontextfenster. Eingabe und Antwort teilen sich dieses Budget. Ist ein Dokument länger, passt nicht alles hinein und das Modell verliert den Anfang. Größere Fenster erlauben mehr, kosten aber mehr Rechenleistung.

Wie spart man Tokens und damit Kosten?+

Hilfreich sind kurze, präzise Eingaben ohne überflüssigen Ballast, das gezielte Übergeben nur der relevanten Dokumentteile sowie kompakt gehaltene Antwortvorgaben. Auch das Begrenzen der gewünschten Antwortlänge senkt den Verbrauch. So bleibt man im Kontextfenster und reduziert die abgerechneten Tokens.

Verwandte Begriffe

Künstliche Intelligenz Machine Learning Large Language Model Generative KI Prompt

Noch Fragen?

Sprechen wir über Ihre IT.

Ob KI & Daten oder ein anderes Thema — wir schauen uns Ihre Situation an und sagen Ihnen ehrlich, was sinnvoll ist.

Kontakt aufnehmen

Wie funktioniert ein Token in einem Sprachmodell?

Warum sind Tokens für Kosten und Kontext wichtig?

Häufige Fragen

Sprechen wir über Ihre IT.

Wie möchten Sie starten?

Wir rufen Sie zurück.

Vielen Dank!