Modell-Parameter, der steuert wie zufällig die Ausgabe beim Sampling ist. Temperature 0 lässt das Modell an jeder Stelle den wahrscheinlichsten nächsten Token wählen; höhere Werte führen zu mehr Variation. Für Reproduzierbarkeit auf 0 fixieren, für Exploration erhöhen.
Definition: Modell-Parameter, der steuert wie zufällig die Ausgabe beim Sampling ist. Temperature 0 lässt das Modell an jeder Stelle den wahrscheinlichsten nächsten Token wählen; höhere Werte führen zu mehr Variation. Für Reproduzierbarkeit auf 0 fixieren, für Exploration erhöhen.
Temperature formt die Wahrscheinlichkeits-Verteilung des Modells beim Sampling. Bei Temperature 0 wählt das Modell deterministisch den wahrscheinlichsten nächsten Token; bei höheren Werten bekommen weniger wahrscheinliche Tokens mehr Chance. Übliche Defaults liegen bei 0.7 bis 1.0, wo das Modell kreativ aber kohärent ist.
Für Research-Aufgaben mit konsistentem Output gehört Temperature auf 0. Reproduzierbarkeit, strukturierte Extraktion, Code-Generierung und audit-pflichtige Aufgaben profitieren alle davon. Für Exploration, Brainstorming oder das Generieren mehrerer Kandidaten-Formulierungen den Wert erhöhen.
Häufiges Missverständnis: Temperature 0 garantiert keinen identischen Output zwischen Läufen. Modell-Tausch durch den Anbieter, Floating-Point-Nicht-Determinismus auf GPUs und Batching-Effekte führen trotzdem zu Drift. Temperature 0 plus fixer Seed plus fixe Modellversion kommen nahe an Determinismus heran, sind aber nicht bit-genau identisch.
Dieser Begriff wird in den folgenden Artikeln referenziert: