Alles ueber KI-Modell-Einstellungen
Uber die KI
Modelleinstellungen sind eine Funktion in Questsmith, mit der du anpassen und steuern kannst, wie KI-Antworten während des Spiels generiert werden. Diese Optionen können je nach Modell variieren.
Erweiterte Modellarchitektur und Generierungsparameter
Die Engine-Einstellungen von Questsmith ermöglichen Autoren und Spielern, präzise zu kalibrieren, wie die künstliche Intelligenz Textgenerierungen berechnet. Diese Einstellungen verändern die zugrunde liegenden Formeln zur Token-Auswahl und balancieren kreative Volatilität mit narrativer Kohärenz.
In jedem Zug erstellt die KI eine dynamische Wahrscheinlichkeitsverteilung möglicher Tokens, also der grundlegenden alphanumerischen Fragmente, aus denen Wörter aufgebaut werden. Die Engine verarbeitet diese Wahrscheinlichkeiten mit statistischen Gewichtungen, die über das erweiterte Kontrollfeld verfeinert werden können.
Kontextlänge
Kontextlänge definiert das maximale Volumen an Tokens, das während eines einzelnen Generierungszyklus an die KI-Engine übertragen wird. Um tiefe narrative Kontinuität zu erhalten, wird empfohlen, diesen Wert zu maximieren.
Die Kontextladung wird hierarchisch aus den folgenden aktiven Elementen zusammengestellt:
- Kernkonfiguration der Plot Essentials
- Dynamisch ausgelöste Story Cards
- Aktive Autorennotizen und Umgebungs-Gedächtnismatrizen
- Globale Systemanweisungen
- Die unmittelbare Spielereingabe und aktuelle Verlaufsprotokolle
Jede verbleibende Bandbreite innerhalb der zugewiesenen Kontextlänge wird mit vorheriger Abenteuerhistorie aufgefüllt. Das Maximieren dieses Fensters gewährleistet strukturelle Ausrichtung und logische Stabilität über längere Kampagnen hinweg. Die gesamte Kontextzuweisung skaliert basierend auf deiner Premium-Kontostufe.
Antwortlänge
Antwortlänge bestimmt die absolute Token-Obergrenze für jede einzelne programmatische Ausgabe. Dieser Parameter kann angepasst werden, um unterschiedlichen Gameplay-Architekturen zu dienen. Autoren, die schnelle taktische Interaktionen suchen, bevorzugen möglicherweise kurze strukturelle Ausgaben, während Spieler, die tiefe narrative Immersion verfolgen, diesen Schwellenwert erhöhen können, um umfangreiche filmische Beschreibungen zu ermöglichen.
Temperatur
Temperatur steuert die stochastische Volatilität oder Zufälligkeit der Generierungs-Engine. Das Erhöhen des Werts erweitert die operative Varianz und veranlasst das Modell, Tokens mit niedriger Wahrscheinlichkeit auszuwählen. Dies führt zu stark abweichenden, kreativen und unvorhersehbaren Handlungsvektoren, die ideal für spekulativen Weltenbau sind.
Das Senken des Werts komprimiert die Varianz und zwingt die KI, nur Tokens mit der höchsten Wahrscheinlichkeit auszuwählen. Dies erzwingt strikte Einhaltung etablierter Logik und erhält strenge Handlungskonformität. Standardkonfigurationen verwenden eine Basis von 0,8. Eine Anpassung unter 0,6 führt zu extremer narrativer Disziplin, während Werte über 1,2 strukturellen Abbau oder fragmentierte Ausgaben verursachen können.
Top K
Top K legt eine harte numerische Obergrenze für den Token-Auswahlpool fest und beschränkt die Engine-Auswahl ausschließlich auf die angegebene Anzahl der wahrscheinlichsten nächsten Tokens. Durch das Entfernen des langen Ausläufers unwahrscheinlicher Optionen garantiert Top K semantische Relevanz und hält die Generierung innerhalb der logischen Grenzen der laufenden Erzählung.
Beispielsweise zwingt eine Top K-Einstellung von 20 die KI, nur die 20 optimalsten Optionen zu bewerten und erratische kreative Sprünge zu unterdrücken.
Top P
Top P wendet einen dynamischen kumulativen Wahrscheinlichkeitsfilter an, um strukturelle Kohäsion sicherzustellen. Anstatt eine feste Anzahl von Tokens auszuwählen, sammelt Top P die höchstrangigen Tokens, bis ihre gemeinsame Wahrscheinlichkeit dem Zielschwellenwert entspricht, etwa 90%.
Dies funktioniert als wichtige Sicherheitsmatrix neben Top K. Während Top K eine konstante Poolgröße sicherstellt, kürzt Top P bei Momenten hoher Sicherheit äußerst unwahrscheinliche Optionen innerhalb dieses Pools, sodass das Modell entschlossen handeln kann, wenn es sicher ist, und expansiv bleibt, wenn es mehrdeutige Szenarien erkundet. Standardmäßige Betriebsschwellen liegen zwischen 0,90 und 0,95.
Präsenzstrafe
Präsenzstrafe führt einen flachen mathematischen Abschlag auf die Auswahlwahrscheinlichkeit jedes Tokens ein, das bereits im aktuellen Generierungsfenster erschienen ist. Dieser Parameter unterdrückt direkt redundante Schleifen und verhindert, dass das Modell seine unmittelbaren Ausgaben wiederholt. Wenn ein Objekt oder eine Phrase einmal eingeführt wurde, sucht die Engine aktiv nach alternativen sprachlichen Wegen, sofern die Grundwahrscheinlichkeit des ursprünglichen Wortes nicht außergewöhnlich hoch ist.
Häufigkeitsstrafe
Häufigkeitsstrafe funktioniert ähnlich wie Präsenzstrafe, skaliert jedoch proportional mit der Nutzung. Die Strafe kumuliert quadratisch, je häufiger ein bestimmtes Token im Verlauf der Generierung erscheint. Obwohl dies sehr wirksam ist, um vielfältiges Vokabular zu erzwingen, bestrafen übermäßige Werte wesentliche strukturelle Tokens, einschließlich Pronomen und häufiger Artikel, was schweren syntaktischen Zusammenbruch und grammatische Entfremdung verursacht. Dieser Parameter ist standardmäßig bei einem Wert von null deaktiviert.
Operative Paradigmen
Null-Risiko-Latenz: Es gibt keine dauerhaften architektonischen Folgen beim Ändern dieser Parameter. Die gesamte Questsmith-Umgebung bleibt vollständig veränderbar und editierbar. Wenn eine experimentelle Konfiguration anomalen Text generiert, kann die Ausgabe gelöscht, die Werte neu geordnet und die Generierung sofort neu initialisiert werden.
Fehlen universeller Normen: Obwohl Werkseinstellungen für ausgewogene narrative Prosa optimiert sind, stellen sie keinen absoluten Standard dar. Die Oberfläche ist ausdrücklich darauf ausgelegt, benutzerdefinierte Einsatzstile zu unterstützen. Autoren werden ermutigt, eigene Profile zu entwickeln, die zu ihren spezifischen narrativen Rhythmen und Weltmechaniken passen.