cuda : fix LLAMA_CUDA_F16 build (#6298)

2025-01-23 09:59:18 +01:00 · 2024-03-25 15:43:22 +01:00 · 2024-03-25 15:43:22 +01:00 · 2f34b865b6
commit 2f34b865b6
parent ae1f211ce2
1 changed files with 1 additions and 0 deletions
--- a/ggml-cuda/dmmv.cu
+++ b/ggml-cuda/dmmv.cu
@ -1,5 +1,6 @@
 #include "dmmv.cuh"
 #include "dequantize.cuh"
 #include "convert.cuh"
 // dmmv = dequantize_mul_mat_vec
 #ifndef GGML_CUDA_DMMV_X