Add truncation to exllama

2025-02-04 16:03:54 +01:00 · 2023-07-07 09:09:23 -07:00 · 2023-07-07 09:09:23 -07:00 · 1ba2e88551
commit 1ba2e88551
parent c21b73ff37
1 changed files with 5 additions and 1 deletions
--- a/modules/exllama.py
+++ b/modules/exllama.py
@ -1,10 +1,10 @@
-import sys
 from pathlib import Path

 from torch import version as torch_version

 from modules import shared
 from modules.logging_colors import logger
+from modules.text_generation import get_max_prompt_length

 try:
    from exllama.generator import ExLlamaGenerator
@ -90,7 +90,11 @@ class ExllamaModel:
            self.generator.disallow_tokens(None)

        self.generator.end_beam_search()
+
+        # Tokenizing the input
        ids = self.generator.tokenizer.encode(prompt)
+        ids = ids[:, -get_max_prompt_length(state):]
+
        self.generator.gen_begin_reuse(ids)
        initial_len = self.generator.sequence[0].shape[0]
        has_leading_space = False