Wszystko o ustawieniach modelu AI
O AI
Ustawienia modelu to funkcja w Questsmith, która pozwala dostosować i kontrolować sposób generowania odpowiedzi sztucznej inteligencji podczas rozgrywki. Opcje te mogą różnić się między modelami.
Zaawansowana architektura modelu i parametry generowania
Ustawienia silnika Questsmith pozwalają autorom i graczom precyzyjnie kalibrować sposób, w jaki sztuczna inteligencja oblicza generowanie tekstu. Ustawienia te modyfikują podstawowe formuły wyboru tokenów, równoważąc twórczą zmienność ze spójnością narracyjną.
W każdej turze sztuczna inteligencja tworzy dynamiczny rozkład prawdopodobieństwa potencjalnych tokenów, czyli podstawowych fragmentów alfanumerycznych używanych do budowania słów. Silnik przetwarza te prawdopodobieństwa, używając wag statystycznych, które można dopracować w zaawansowanym panelu sterowania.
Długość kontekstu
Długość kontekstu określa maksymalną objętość tokenów przesyłanych do silnika sztucznej inteligencji podczas jednego cyklu generowania. Aby utrzymać głęboką ciągłość narracyjną, zaleca się maksymalizowanie tej wartości.
Ładunek kontekstu jest kompilowany hierarchicznie z następujących aktywnych elementów:
- Podstawowa konfiguracja Elementów Kluczowych Fabuły
- Dynamicznie uruchamiane Karty Historii
- Aktywne Notatki Autora i macierze pamięci środowiskowej
- Globalne instrukcje systemowe
- Bezpośredni wpis gracza i najnowsze dzienniki historii
Każda pozostała przepustowość w przydzielonej długości kontekstu jest uzupełniana wcześniejszą historią przygody. Maksymalizacja tego okna zapewnia strukturalne wyrównanie i logiczną stabilność w długich kampaniach. Całkowity przydział kontekstu skaluje się zależnie od poziomu konta premium.
Długość odpowiedzi
Długość odpowiedzi określa absolutny limit tokenów dla pojedynczego wyjścia programowego. Parametr ten można dostosować do różnych architektur rozgrywki. Autorzy szukający szybkich interakcji taktycznych mogą preferować krótkie wyjścia strukturalne, podczas gdy gracze pragnący głębokiego zanurzenia narracyjnego mogą zwiększyć ten próg, aby pozwolić na rozbudowane opisy filmowe.
Temperatura
Temperatura reguluje stochastyczną zmienność lub losowość silnika generowania. Zwiększenie wartości rozszerza wariancję operacyjną, skłaniając model do wybierania tokenów o niskim prawdopodobieństwie. Powoduje to bardzo rozbieżne, kreatywne i nieprzewidywalne wektory fabuły, idealne do spekulatywnego budowania świata.
Obniżenie wartości kompresuje wariancję, zmuszając sztuczną inteligencję do wybierania tylko tokenów o najwyższym prawdopodobieństwie. Wymusza to ścisłe trzymanie się ustalonej logiki i utrzymuje rygorystyczną zgodność fabuły. Standardowe konfiguracje używają poziomu bazowego 0,8. Zejście poniżej 0,6 wprowadza ekstremalną dyscyplinę narracyjną, a przekroczenie 1,2 może spowodować degradację strukturalną lub fragmentaryczne wyjścia.
Top K
Top K ustanawia twardy liczbowy limit puli wyboru tokenów, ograniczając wybory silnika wyłącznie do wskazanej liczby najbardziej prawdopodobnych następnych tokenów. Usuwając długi ogon wyborów o niskim prawdopodobieństwie, Top K gwarantuje trafność semantyczną i utrzymuje generowanie w logicznych granicach trwającej narracji.
Na przykład ustawienie Top K na 20 zmusza sztuczną inteligencję do oceny tylko 20 najbardziej optymalnych wyborów, tłumiąc nieregularne skoki kreatywne.
Top P
Top P stosuje dynamiczny filtr skumulowanego prawdopodobieństwa, aby zapewnić spójność strukturalną. Zamiast wybierać stałą liczbę tokenów, Top P agreguje najwyżej ocenione tokeny, aż ich łączne prawdopodobieństwo osiągnie docelowy próg, taki jak 90%.
Działa to jako ważna matryca bezpieczeństwa obok Top K. Podczas gdy Top K zapewnia stały rozmiar puli, Top P odcina wysoce nieprawdopodobne wybory w tej puli w chwilach dużej pewności, pozwalając modelowi być zdecydowanym, gdy jest pewny, i szerokim, gdy bada niejednoznaczne scenariusze. Standardowe progi operacyjne mieszczą się między 0,90 a 0,95.
Kara obecności
Kara obecności wprowadza płaski matematyczny rabat do prawdopodobieństwa wyboru każdego tokenu, który już pojawił się w bieżącym oknie generowania. Ten parametr bezpośrednio tłumi redundantne pętle i zapobiega powtarzaniu przez model natychmiastowych wyjść. Jeśli zasób lub fraza zostały wprowadzone raz, silnik aktywnie szuka alternatywnych ścieżek językowych, chyba że bazowe prawdopodobieństwo oryginalnego słowa jest wyjątkowo wysokie.
Kara częstotliwości
Kara częstotliwości działa podobnie do kary obecności, ale skaluje się proporcjonalnie z użyciem. Kara kumuluje się kwadratowo im częściej określony token pojawia się w historii generowania. Chociaż jest bardzo skuteczna w wymuszaniu różnorodnego słownictwa, nadmierne wartości będą karać podstawowe tokeny strukturalne, w tym zaimki i częste rodzajniki, powodując poważny rozpad składniowy i gramatyczną obcość. Ten parametr jest domyślnie wyłączony przy wartości zero.
Paradygmaty operacyjne
Opóźnienie bez ryzyka: Nie ma trwałych konsekwencji architektonicznych przy modyfikowaniu tych parametrów. Całe środowisko Questsmith pozostaje w pełni zmienne i edytowalne. Jeśli eksperymentalna konfiguracja wygeneruje anomalny tekst, wyjście można wyczyścić, wartości uporządkować ponownie, a generowanie natychmiast zainicjować od nowa.
Brak uniwersalnych norm: Chociaż ustawienia fabryczne są zoptymalizowane pod kątem zrównoważonej prozy narracyjnej, nie stanowią absolutnego standardu. Interfejs został wyraźnie zaprojektowany do obsługi niestandardowych stylów wdrożenia. Autorzy są zachęcani do tworzenia własnych profili pasujących do ich konkretnych rytmów narracyjnych i mechanik świata.