diff --git a/common/common.cpp b/common/common.cpp index 313821375..f72f1b84d 100644 --- a/common/common.cpp +++ b/common/common.cpp @@ -770,7 +770,7 @@ std::tuple llama_init_from_gpt_par { LOG("warming up the model with an empty run\n"); - const std::vector tmp = { llama_token_bos(lctx), }; + const std::vector tmp = { llama_token_bos(lctx), llama_token_eos(lctx), }; llama_eval(lctx, tmp.data(), tmp.size(), 0, params.n_threads); llama_reset_timings(lctx); }