Todo sobre los ajustes del modelo de IA
Sobre la IA
La configuración del modelo es una función de Questsmith que te permite personalizar y controlar cómo se generan las respuestas de la inteligencia artificial durante el juego. Estas opciones pueden variar entre distintos modelos.
Arquitectura avanzada del modelo y parámetros de generación
Los ajustes del motor de Questsmith permiten a autores y jugadores calibrar con precisión cómo la inteligencia artificial calcula las generaciones de texto. Estos ajustes modifican las fórmulas subyacentes de selección de tokens, equilibrando la volatilidad creativa con la coherencia narrativa.
En cada turno, la inteligencia artificial construye una distribución dinámica de probabilidad de posibles tokens, que son los fragmentos alfanuméricos fundamentales usados para construir palabras. El motor procesa estas probabilidades utilizando pesos estadísticos que pueden refinarse mediante el panel de control avanzado.
Longitud de contexto
La longitud de contexto define el volumen máximo de tokens transmitidos al motor de inteligencia artificial durante un solo ciclo de generación. Para mantener una continuidad narrativa profunda, se recomienda maximizar este valor.
La carga de contexto se compila jerárquicamente a partir de los siguientes elementos activos:
- Configuración central de Elementos Esenciales de Trama
- Tarjetas de Historia activadas dinámicamente
- Notas de Autor activas y matrices de memoria ambiental
- Instrucciones globales del sistema
- La entrada inmediata del jugador y registros históricos recientes
Cualquier ancho de banda residual dentro de la longitud de contexto asignada se rellena con historial anterior de la aventura. Maximizar esta ventana asegura alineación estructural y estabilidad lógica en campañas extendidas. La asignación total de contexto escala según tu nivel de cuenta prémium.
Longitud de respuesta
La longitud de respuesta dicta el techo absoluto de tokens para cualquier salida programática individual. Este parámetro puede ajustarse para servir distintas arquitecturas de juego. Los autores que busquen interacciones tácticas rápidas pueden preferir salidas estructurales breves, mientras que los jugadores que busquen inmersión narrativa profunda pueden ampliar este umbral para permitir descripciones cinematográficas expansivas.
Temperatura
La temperatura gobierna la volatilidad estocástica o aleatoriedad del motor de generación. Aumentar el valor expande la varianza operativa, haciendo que el modelo seleccione tokens de baja probabilidad. Esto produce vectores de trama muy divergentes, creativos e impredecibles, ideales para construcción especulativa de mundos.
Reducir el valor comprime la varianza, obligando a la inteligencia artificial a seleccionar solo los tokens de mayor probabilidad. Esto impone una adhesión rígida a la lógica establecida y mantiene un cumplimiento estricto de la trama. Las configuraciones estándar usan una base de 0.8. Ajustar por debajo de 0.6 introduce disciplina narrativa extrema, mientras que superar 1.2 puede causar degradación estructural o salidas fragmentadas.
Top K
Top K establece un techo numérico rígido sobre el conjunto de selección de tokens, restringiendo las opciones del motor exclusivamente al número especificado de tokens siguientes más probables. Al eliminar la larga cola de opciones de baja probabilidad, Top K garantiza relevancia semántica y mantiene la generación dentro de los límites lógicos de la narrativa en curso.
Por ejemplo, una configuración Top K de 20 obliga a la inteligencia artificial a evaluar solo las 20 opciones más óptimas, suprimiendo saltos creativos erráticos.
Top P
Top P aplica un filtro dinámico de probabilidad acumulativa para asegurar cohesión estructural. En lugar de seleccionar un número fijo de tokens, Top P agrega los tokens mejor clasificados hasta que su probabilidad colectiva alcanza el umbral objetivo, como 90%.
Esto funciona como una matriz de seguridad vital junto a Top K. Mientras Top K asegura un tamaño de conjunto constante, Top P recorta las opciones altamente improbables dentro de ese conjunto durante momentos de alta certeza, permitiendo que el modelo sea decisivo cuando tiene confianza y expansivo al explorar escenarios ambiguos. Los umbrales operativos estándar oscilan entre 0.90 y 0.95.
Penalización de presencia
La penalización de presencia introduce un descuento matemático plano a la probabilidad de selección de cualquier token que ya haya aparecido dentro de la ventana de generación actual. Este parámetro suprime directamente los bucles redundantes y evita que el modelo repita sus salidas inmediatas. Si un recurso o frase se ha introducido una vez, el motor busca activamente rutas lingüísticas alternativas salvo que la probabilidad base de la palabra original sea excepcionalmente alta.
Penalización de frecuencia
La penalización de frecuencia funciona de forma similar a la penalización de presencia, pero escala proporcionalmente con el uso. La penalización se acumula cuadráticamente cuanto más aparece un token específico en el historial de generación. Aunque es muy eficaz para forzar vocabulario diverso, los valores excesivos penalizarán tokens estructurales esenciales, incluidos pronombres y artículos comunes, causando una ruptura sintáctica severa y alienación gramatical. Este parámetro está desactivado por defecto con valor cero.
Paradigmas operativos
Latencia de riesgo cero: No hay consecuencias arquitectónicas permanentes al modificar estos parámetros. Todo el entorno de Questsmith permanece completamente mutable y editable. Si una configuración experimental genera texto anómalo, la salida puede purgarse, los valores reordenarse y la generación reiniciarse al instante.
Ausencia de normas universales: Aunque los valores predeterminados de fábrica están optimizados para una prosa narrativa equilibrada, no representan un estándar absoluto. La interfaz está diseñada explícitamente para admitir estilos de implementación personalizados. Se anima a los autores a crear perfiles propios que coincidan con sus ritmos narrativos específicos y las mecánicas de sus mundos.