Tutto sulle impostazioni del modello AI
Informazioni sull'IA
Le impostazioni del modello sono una funzione di Questsmith che ti permette di personalizzare e controllare il modo in cui le risposte dell’intelligenza artificiale vengono generate durante il gioco. Queste opzioni possono variare tra modelli diversi.
Architettura avanzata del modello e parametri di generazione
Le impostazioni del motore Questsmith permettono ad autori e giocatori di calibrare con precisione il modo in cui l’intelligenza artificiale calcola le generazioni di testo. Queste impostazioni modificano le formule sottostanti di selezione dei token, bilanciando volatilità creativa e coerenza narrativa.
A ogni turno l’intelligenza artificiale costruisce una distribuzione dinamica di probabilità dei token potenziali, che sono i frammenti alfanumerici fondamentali usati per costruire le parole. Il motore elabora queste probabilità usando pesi statistici che possono essere raffinati tramite il pannello di controllo avanzato.
Lunghezza del contesto
La lunghezza del contesto definisce il volume massimo di token trasmessi al motore di intelligenza artificiale durante un singolo ciclo di generazione. Per mantenere una profonda continuità narrativa, si consiglia di massimizzare questo valore.
Il carico del contesto viene compilato gerarchicamente dai seguenti elementi attivi:
- Configurazione centrale degli Elementi Essenziali della Trama
- Schede Storia attivate dinamicamente
- Note dell’Autore attive e matrici di memoria ambientale
- Istruzioni globali di sistema
- L’input immediato del giocatore e i registri storici recenti
Qualsiasi larghezza residua entro la lunghezza del contesto assegnata viene riempita con la storia precedente dell’avventura. Massimizzare questa finestra assicura allineamento strutturale e stabilità logica nelle campagne estese. L’allocazione totale del contesto scala in base al livello del tuo account premium.
Lunghezza della risposta
La lunghezza della risposta impone il tetto assoluto di token per qualsiasi singolo output programmatico. Questo parametro può essere regolato per servire architetture di gioco distinte. Gli autori che cercano interazioni tattiche rapide possono preferire output strutturali brevi, mentre i giocatori che cercano immersione narrativa profonda possono aumentare questa soglia per consentire descrizioni cinematografiche ampie.
Temperatura
La temperatura governa la volatilità stocastica o casualità del motore di generazione. Aumentare il valore espande la varianza operativa, spingendo il modello a selezionare token a bassa probabilità. Questo produce vettori di trama molto divergenti, creativi e imprevedibili, ideali per il worldbuilding speculativo.
Abbassare il valore comprime la varianza, costringendo l’intelligenza artificiale a selezionare solo i token con la probabilità più alta. Questo impone rigida aderenza alla logica stabilita e mantiene una stretta conformità alla trama. Le configurazioni standard usano una base di 0,8. Scendere sotto 0,6 introduce disciplina narrativa estrema, mentre superare 1,2 può causare degrado strutturale o output frammentati.
Top K
Top K stabilisce un tetto numerico rigido sul gruppo di selezione dei token, limitando le scelte del motore esclusivamente al numero specificato dei prossimi token più probabili. Eliminando la lunga coda delle scelte a bassa probabilità, Top K garantisce rilevanza semantica e mantiene la generazione entro i confini logici della narrazione in corso.
Per esempio, un’impostazione Top K di 20 forza l’intelligenza artificiale a valutare solo le 20 scelte più ottimali, sopprimendo salti creativi erratici.
Top P
Top P applica un filtro dinamico di probabilità cumulativa per assicurare coesione strutturale. Invece di selezionare un numero fisso di token, Top P aggrega i token con rango più alto finché la loro probabilità collettiva raggiunge la soglia mirata, come 90%.
Questo funziona come una matrice di sicurezza vitale insieme a Top K. Mentre Top K assicura una dimensione costante del gruppo, Top P tronca le scelte altamente improbabili all’interno di quel gruppo durante i momenti di alta certezza, permettendo al modello di essere deciso quando è sicuro ed espansivo quando esplora scenari ambigui. Le soglie operative standard variano tra 0,90 e 0,95.
Penalità di presenza
La penalità di presenza introduce uno sconto matematico fisso alla probabilità di selezione di qualsiasi token già apparso nella finestra di generazione corrente. Questo parametro sopprime direttamente i cicli ridondanti e impedisce al modello di riecheggiare i suoi output immediati. Se una risorsa o una frase è stata introdotta una volta, il motore cerca attivamente percorsi linguistici alternativi, a meno che la probabilità base della parola originale non sia eccezionalmente alta.
Penalità di frequenza
La penalità di frequenza opera in modo simile alla penalità di presenza ma scala proporzionalmente all’uso. La penalità si compone quadraticamente quanto più spesso uno specifico token appare nella storia della generazione. Pur essendo molto efficace nel forzare un vocabolario vario, valori eccessivi penalizzeranno token strutturali essenziali, inclusi pronomi e articoli comuni, causando grave rottura sintattica e alienazione grammaticale. Questo parametro è disattivato per impostazione predefinita a valore zero.
Paradigmi operativi
Latenza a rischio zero: Non ci sono conseguenze architetturali permanenti quando si modificano questi parametri. L’intero ambiente Questsmith rimane completamente mutabile e modificabile. Se una configurazione sperimentale genera testo anomalo, l’output può essere eliminato, i valori riordinati e la generazione reinizializzata all’istante.
Assenza di norme universali: Sebbene le impostazioni di fabbrica siano ottimizzate per una prosa narrativa equilibrata, non rappresentano uno standard assoluto. L’interfaccia è progettata esplicitamente per supportare stili di distribuzione personalizzati. Gli autori sono incoraggiati a progettare profili su misura che corrispondano ai loro specifici ritmi narrativi e alle meccaniche del mondo.