llama.cpp/ggml-cuda/quantize.cuh