server : fix crash with multimodal models without BOS token (#4904)

2024-12-24 13:28:50 +01:00 · 2024-01-13 14:16:11 +00:00 · 2024-01-13 14:16:11 +00:00 · ee8243adaa
commit ee8243adaa
parent 15ebe59210
1 changed files with 1 additions and 1 deletions
--- a/examples/server/server.cpp
+++ b/examples/server/server.cpp
@ -1835,7 +1835,7 @@ struct llama_server_context

                    slot.cache_tokens = prompt_tokens;

-                    if (slot.n_past == slot.num_prompt_tokens)
+                    if (slot.n_past == slot.num_prompt_tokens && slot.n_past > 0)
                    {
                        // we have to evaluate at least 1 token to generate logits.
                        LOG_TEE("slot %d : we have to evaluate at least 1 token to generate logits\n", slot.id);