diff --git a/llama.cpp b/llama.cpp index 31b5ce9a4..5679c7050 100644 --- a/llama.cpp +++ b/llama.cpp @@ -1629,6 +1629,7 @@ static void llama_kv_cache_clear(struct llama_kv_cache & cache) { cache.cells[i].seq_id.clear(); } cache.head = 0; + cache.used = 0; } static void llama_kv_cache_seq_rm(