AI モデル設定のすべて
AIについて
Model Settings は、Questsmith でゲームプレイ中の AI 応答の生成方法をカスタマイズして制御できる機能です。これらのオプションはモデルごとに異なる場合があります。
AI は、次に来る可能性があるトークンの一覧を作成し、それぞれが次に来る確率を見積もることで、冒険の次の部分を生成します。その後、ランダムな数値と少しの計算でその一覧からトークンを選びます。Advanced Settings では、その計算の中でランダムではない数値を変更できます。
かなり複雑なので、各設定を実際に試すか、Discord で相談することを強くおすすめします。
また、AI 応答がどのように生成されるかについての、より詳しい記事を読むと、これらの設定が裏側でどう機能しているかを理解しやすくなります。
Model Settings は現在、すべての Questsmith プレイヤーが利用できます。
Context Length
Context Length は、各ターンで AI モデルに送信できるトークンの最大数を決めます。できるだけ高く設定して、AI が冒険についてできるだけ多くのコンテキストを受け取れるようにするのが通常は最適です。
コンテキストには、Memory、発動した Story Card、Author's Note、各種 Memories、モデル指示、最新のプレイヤー入力、最新の AI 出力が含まれます。選択した Context Length に残りスペースがあれば冒険テキストで埋められるので、コンテキストを最大化すると、AI はより一貫した応答を生成しやすくなります。
Context Length は最終的にメンバーシップ階層で決まりますが、すべてのモデルが大きなコンテキストサイズをサポートしているわけではありません。
サブスク加入者は、特定のモデルで 1 回のアクションにつき 1 Credit を使って、コンテキスト長を一時的に増やすこともできます。
Response Length
Response Length は、AI が各ターンで出力する最大トークン数を決めます。これは主に好みの問題です。すぐ読んで次の行動を決められる短い応答がよい人もいれば、じっくり読める長い応答がよい人もいます。自分のプレイスタイルに合うものを使ってください。
Temperature
Temperature は AI の応答のランダム性を制御します。値を高くすると予測不能性が増して、より多様で創造的な出力になります。低くすると、より一貫して予測しやすい応答になります。Temperature を調整すると、ゲーム体験のランダムさを細かく調整できます。
デフォルト値は 0.8 のことが多いですが、AI が少し常識から外れすぎると感じるなら 0.6 を試したり、かなり珍しいテキストを見たいなら 0.95 や 1.2 を試すのもよいでしょう。
Temperature を上げすぎると、とんでもないトークンや意味不明なトークンにつながることがあります。
Top-K
Top-K は、AI の選択肢を応答内の上位 K 個の最有力トークンに絞ります。候補を狭めることで、Top-K は応答の関連性と一貫性を保ち、より安定して予測しやすいストーリー展開に役立ちます。
Top-K を 20 にすると、AI は各ターンで最有力な 20 個のトークンだけから選ぶことになります。これにより、新しい出力を生成するときに可能性の低い選択肢が除外され、ランダム性が減ります。
Top-P
Top-P は、可能性の低いトークンを除外して、AI の出力を一貫性があり関連性の高いものにします。たとえば 90% のような確率しきい値を設定し、その合計確率がその値に達するまで最有力トークンを選びます。これにより、より関連性の高いトークンに絞られ、出力が話題から外れにくくなります。
これは Top-K と組み合わせることで安全網のように働きます。Top-K が 50 だとすると、極端にありそうにないトークンでも 50 個は常に選ばれてしまいます。Top-P はそうした可能性の低いトークンを切り落としますが、Top-K の候補がすべて十分ありそうなときには、より多くの選択肢も残します。つまり、AI は確信しているときは確信を持って選び、そうでないときは創造的になります。
Top-P が低すぎると、応答が反復的で面白みのないものになることがあります。高すぎると、応答が飛び飛びで一貫性がなく、文法的にもおかしくなることがあります。
多くのプレイヤーには 0.90 から 0.95 の Top-P が最適ですが、他の設定によって変わることがあります。Top-K が高い場合は、Top-P を低めにするほうがよいかもしれませんし、その逆もあります。
Presence Penalty
Presence Penalty は、すでに応答内に出た単語に一度だけ重みのペナルティを与えます。Dog という単語が 1 回使われた場合、Presence Penalty は即時の繰り返しを防ぐためにそれを罰します。ただし、その単語の基本確率が十分高ければ、ペナルティを上回ることがあります。
ただし、この設定を上げすぎると、意図とは逆に繰り返しが増えることがあります。すべての単語が罰せられるなら、何も残りません。
Frequency Penalty
Frequency Penalty は Presence Penalty に似ていますが、ペナルティが累積します。単語が使われるほど、次の応答でより強く罰せられます。よさそうに見えますが、キャラクター名や you、I、and、a のような一般的な単語も強く罰せられることを忘れないでください。そのため、値を高くしすぎると、普通のトークンがあまりに珍しいものに置き換わり、文法的にもおかしくなることがあります。
Frequency Penalty は通常 0 が初期値で、かなり高く設定することもできますが、1 を大きく超えると AI は奇妙な出力に寄り始めます。
Tips & Tricks
これらの設定にルールはありません。
感覚をつかむ一番の方法は試してみることですし、試してもペナルティはありません。少しずつ変更して、冒険で何が起きるか見てみてください。自分がどう感じるかに合わせて調整でき、気に入るかもしれませんし、元に戻すかもしれません。AI の応答が変で派手になることもありますが、それも Questsmith を遊ぶ楽しさの一部です。
これらの設定を変えても、実質的な不利益はありません。
Top-P、Temperature、Repetition Penalty を最大まで上げて AI が振り回される様子を見ることにも、すべてをゼロにして AI が壊れたレコードのようになるのを見ることにも、特に不利益はありません。
結局のところ、Questsmith のすべては消去も編集もできます。新しい設定で AI の書き方が気に入らないなら、消してもう一度試せばよいだけです。
これらの設定に、万人共通の「最適値」はありません。
既定値は私たちの実験でうまく機能しましたが、あなたの遊び方には合わないかもしれません。それで問題ありません。私たちは、Questsmith の体験を自分に合うようにカスタマイズし、制御できるようにこれらの設定を用意しました。誰も使っていない設定が気に入ったなら、それは素晴らしいことです。最終的には、あなたの冒険であり、あなたのゲームであり、あなたの体験です。好きなように楽しんでください。
Happy Adventuring!