llama.cpp

mirror of https://github.com/ggerganov/llama.cpp.git synced 2025-01-31 06:03:11 +01:00

History

fj-y-saito c67cc9837d ggml: aarch64: implement SVE kernels for q4_K_q8_K vector dot (#11227 ) * Add SVE support for q4_K_q8_K * Update ggml/src/ggml-cpu/ggml-cpu-quants.c change to use K_SCALE_SIZE Co-authored-by: Georgi Gerganov <ggerganov@gmail.com> --------- Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>		2025-01-16 11:11:49 +02:00
..
include	RoPE: fix back, CUDA support for back + noncont. (#11240 )	2025-01-15 12:51:37 +01:00
src	ggml: aarch64: implement SVE kernels for q4_K_q8_K vector dot (#11227 )	2025-01-16 11:11:49 +02:00
.gitignore	vulkan : cmake integration (#8119 )	2024-07-13 18:12:39 +02:00
CMakeLists.txt	fix: ggml: fix vulkan-shaders-gen build (#10448 )	2025-01-15 14:17:42 +01:00