Jak generowane sa odpowiedzi AI?
O AI
Nie musisz tego rozumieć, aby używać Questsmith.
Ten artykuł ma być wyjaśnieniem technicznym i może być nieco mylący dla większości osób. Umieściliśmy go tutaj, aby pomóc użytkownikom zrozumieć ustawienia modelu, eksperymentować ze sztuczną inteligencją i wykonywać bardziej zaawansowane rozwiązywanie problemów.
Chociaż zrozumienie podstawowych mechanizmów dużych modeli językowych nie jest wymagane do tworzenia narracji w Questsmith, ten techniczny opis wyjaśnia sekwencję zdarzeń zachodzących za kulisami za każdym razem, gdy inicjowana jest akcja.
Przejście od wejścia użytkownika do w pełni ukształtowanej, spójnej sekwencji historii obejmuje pięć odrębnych faz obliczeniowych:
Pięć faz generowania
Kompilacja pakietu danych
Twój interfejs przesyła twoją najnowszą akcję na nasze bezpieczne serwery. System natychmiast agreguje to wejście z twoimi aktywnymi podstawami fabuły, uruchomionymi kartami historii, blokami pamięci i wcześniejszą historią narracyjną, aby skompilować jeden, zunifikowany pakiet danych.
Tokenizacja
Duże modele językowe nie przetwarzają surowego tekstu. Wyspecjalizowany program nazywany tokenizatorem rozkłada twój tekst na jednostki liczbowe zwane tokenami. Średnio jeden token odpowiada mniej więcej czterem znakom. Twoje zaawansowane ustawienia konfiguracji bezpośrednio kontrolują te surowe limity tokenów.
Przetwarzanie sieci neuronowej
Tokeny liczbowe są wstrzykiwane do głębokiej macierzy sieci neuronowej zawierającej miliardy zmiennych statystycznych zwanych wagami. Te wagi przechowują wzorce językowe, których sztuczna inteligencja nauczyła się, analizując terabajty publicznej literatury, książek i scenariuszy. Sieć używa tych danych, aby przewidzieć, co powinno wydarzyć się dalej w twojej historii.
Próbkowanie statystyczne
Sztuczna inteligencja nie pisze po prostu zdania; oblicza ogromną listę rozkładu prawdopodobieństwa każdego możliwego następnego tokenu. Wybiera tokeny jeden po drugim przy użyciu równań statystycznych. Ta faza próbkowania jest silnie zależna od twoich własnych regulacji:
- Temperatura zwiększa kreatywność lub wymusza sztywną spójność logiczną.
- Top K i Top P odfiltrowują wysoce nieprawdopodobne słowa, aby utrzymać fabułę na ziemi.
Detokenizacja i dopracowanie
Gdy pętla generowania dobiega końca, tokeny liczbowe są tłumaczone z powrotem na tekst czytelny dla człowieka. Nasze serwery stosują końcowe algorytmy przetwarzania po generowaniu, aby upewnić się, że wynik kończy się czystym, zakończonym zdaniem, i zapisują alternatywne warianty w pamięci podręcznej, aby zasilać twoje kolejne opcje ponowienia. Tekst następnie wyświetla się na twoim urządzeniu, gotowy na twój następny ruch.