llama.cpp

mirror of https://github.com/ggerganov/llama.cpp.git synced 2025-01-12 05:17:21 +01:00

History

Deduplicate q4 quantization functions (#383 )

* Deduplicate q4 quantization functions

* Use const; add basic test

* Re-enable quantization test

* Disable AVX2 flags in CI

---------

Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>

2023-03-22 19:29:06 +02:00

CMakeLists.txt

Deduplicate q4 quantization functions (#383 )

2023-03-22 19:29:06 +02:00

test-quantize.c

Deduplicate q4 quantization functions (#383 )

2023-03-22 19:29:06 +02:00

test-tokenizer-0.cpp

Introduce C-style API (#370 )

2023-03-22 07:32:36 +02:00