llama.cpp/scale.comp at c4ded1a8fb3648f555f292479524a150bd03aa91 - llama.cpp - Gitea: Git with a cup of tea

Mirrors/llama.cpp

mirror of https://github.com/ggerganov/llama.cpp.git synced 2024-12-27 06:39:25 +01:00

0cc4m 7c7836d9d4

Vulkan Shader Refactor, Memory Debugging Option (#7947 )

* Refactor shaders, extract GLSL code from ggml_vk_generate_shaders.py into vulkan-shaders directory

* Improve debug log code

* Add memory debug output option

* Fix flake8

* Fix unnecessary high llama-3 VRAM use

2024-06-16 07:17:31 +02:00

13 lines

300 B

Plaintext

Raw Blame History

 #version 450
 #include "types.comp"
 #include "generic_unary_head.comp"
 void main() {
     if (gl_GlobalInvocationID.x >= p.ne) {
         return;
     }
     data_d[p.d_offset + dst_idx(gl_GlobalInvocationID.x)] = D_TYPE(FLOAT_TYPE(data_a[src0_idx(gl_GlobalInvocationID.x)]) * FLOAT_TYPE(p.param1));
 }