llama.cpp

mirror of https://github.com/ggerganov/llama.cpp.git synced 2025-01-10 12:30:50 +01:00

History

* seperate lower precision GEMM from the main files

* fix workgroup size hardcode

2024-06-19 09:11:51 +08:00

2024-06-15 14:05:10 +08:00

backend.hpp

[SYCL] refactor (#6408 )

2024-06-19 09:11:51 +08:00

common.cpp

2024-06-15 14:05:10 +08:00

common.hpp

2024-06-15 14:05:10 +08:00

convert.cpp

[SYCL] refactor (#6408 )

2024-06-19 09:11:51 +08:00

convert.hpp

[SYCL] refactor (#6408 )

2024-06-19 09:11:51 +08:00

dequantize.hpp

[SYCL] refactor (#6408 )

2024-06-19 09:11:51 +08:00

dmmv.cpp

[SYCL] refactor (#6408 )

2024-06-19 09:11:51 +08:00

dmmv.hpp

[SYCL] refactor (#6408 )

2024-06-19 09:11:51 +08:00

mmq.cpp

[SYCL] refactor (#6408 )

2024-06-19 09:11:51 +08:00

mmq.hpp

[SYCL] refactor (#6408 )

2024-06-19 09:11:51 +08:00

mmvq.cpp

[SYCL] refactor (#6408 )

2024-06-19 09:11:51 +08:00

mmvq.hpp

[SYCL] refactor (#6408 )

2024-06-19 09:11:51 +08:00

presets.hpp

[SYCL] refactor (#6408 )

2024-06-19 09:11:51 +08:00

vecdotq.hpp

[SYCL] refactor (#6408 )

2024-06-19 09:11:51 +08:00