llama.cpp

mirror of https://github.com/ggerganov/llama.cpp.git synced 2025-01-13 05:42:22 +01:00

History

Ondřej Čertík 3ca23481dd

gguf-py : add support for I8, I16 and I32 (#6045 )

* Refactor dtype handling to be extensible

This code is equivalent as before, but now it is prepared to easily add
more NumPy dtypes.

* Add support for I8, I16 and I32

These types are allowed in the GGUF specification.

* Add support for I8, I16 and I32 to gguf_writer

* Add support for I8, I16, I32 to gguf_reader

2024-03-14 12:40:14 +02:00

__init__.py

gguf-py: Refactor and allow reading/modifying existing GGUF files (#3981 )

2023-11-11 08:04:50 +03:00

constants.py

gguf-py : add support for I8, I16 and I32 (#6045 )

2024-03-14 12:40:14 +02:00

gguf_reader.py

gguf-py : add support for I8, I16 and I32 (#6045 )

2024-03-14 12:40:14 +02:00

gguf_writer.py

gguf-py : add support for I8, I16 and I32 (#6045 )