llama.cpp

mirror of https://github.com/ggerganov/llama.cpp.git synced 2025-01-27 12:33:06 +01:00

History

xctan fc83a9e584 ggml : add Q4_0_8_8 RISC-V GEMV and GEMM kernels (#10029 ) * ggml : RISC-V vector gemv for q4_0_8x8 * ggml : Added WIP rvv q4_0_8x8 gemm * ggml : Added initial implementation of rvv gemm * ggml : optimize gemm to avoid register spillover * ggml : Fix GCC rvv load alignment issue * ggml : Format gemm rvv code * ggml : Fix a typo in RVV q4_0_8_8 GEMM		2024-10-30 09:00:40 +02:00
..
cmake	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
include	llama : refactor model loader with backend registry (#10026 )	2024-10-30 02:01:23 +01:00
src	ggml : add Q4_0_8_8 RISC-V GEMV and GEMM kernels (#10029 )	2024-10-30 09:00:40 +02:00
.gitignore	vulkan : cmake integration (#8119 )	2024-07-13 18:12:39 +02:00
CMakeLists.txt	add amx kernel for gemm (#8998 )	2024-10-18 13:34:36 +08:00