llama.cpp/src at b4419 - llama.cpp - Gitea: Git with a cup of tea

Mirrors/llama.cpp

mirror of https://github.com/ggerganov/llama.cpp.git synced 2025-01-12 21:37:19 +01:00

History

fairydreaming 9394bbd484

llama : Add support for DeepSeek V3 (#11049 )

* convert : extend DEEPSEEK2 model architecture to support DeepseekV3ForCausalLM by adding EXPERT_WEIGHTS_NORM and EXPERT_GATING_FUNC model parameters and FFN_EXP_PROBS_B tensor type

* vocab : add DeepSeek V3 pre-tokenizer regexes

* unicode : handle ACCENT_MARK and SYMBOL categories in regex

* llama : add DeepSeek V3 chat template, handle new model parameters and tensor types

---------

Co-authored-by: Stanisław Szymczyk <sszymczy@gmail.com>

2025-01-04 21:06:11 +01:00

..

CMakeLists.txt

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-adapter.cpp

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-adapter.h

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-arch.cpp

llama : Add support for DeepSeek V3 (#11049 )

2025-01-04 21:06:11 +01:00

llama-arch.h

llama : Add support for DeepSeek V3 (#11049 )

2025-01-04 21:06:11 +01:00

llama-batch.cpp

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-batch.h

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-chat.cpp

llama : Add support for DeepSeek V3 (#11049 )

2025-01-04 21:06:11 +01:00

llama-chat.h

llama : Add support for DeepSeek V3 (#11049 )

2025-01-04 21:06:11 +01:00

llama-context.cpp

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-context.h

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-cparams.cpp

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-cparams.h

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-grammar.cpp

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-grammar.h

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-hparams.cpp

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-hparams.h

llama : Add support for DeepSeek V3 (#11049 )

2025-01-04 21:06:11 +01:00

llama-impl.cpp

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-impl.h

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-kv-cache.cpp

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-kv-cache.h

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-mmap.cpp

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-mmap.h

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-model-loader.cpp

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-model-loader.h

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-model.cpp

llama : Add support for DeepSeek V3 (#11049 )

2025-01-04 21:06:11 +01:00

llama-model.h

llama : Add support for DeepSeek V3 (#11049 )

2025-01-04 21:06:11 +01:00

llama-quant.cpp

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-quant.h

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-sampling.cpp

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama-sampling.h

llama : add DRY sampler (#9702 )

2024-10-25 19:07:34 +03:00

llama-vocab.cpp

llama : Add support for DeepSeek V3 (#11049 )

2025-01-04 21:06:11 +01:00

llama-vocab.h

llama : refactor src/llama.cpp (#10902 )

2025-01-03 10:18:53 +02:00

llama.cpp

llama : Add support for DeepSeek V3 (#11049 )

2025-01-04 21:06:11 +01:00

unicode-data.cpp

server : better security control for public deployments (#9776 )

2024-10-08 13:27:04 +02:00

unicode-data.h

llama : reduce compile time and binary size (#9712 )

2024-10-02 15:49:55 +02:00

unicode.cpp

llama : Add support for DeepSeek V3 (#11049 )

2025-01-04 21:06:11 +01:00

unicode.h

unicode : improve naming style (#10838 )

2024-12-16 12:31:45 +02:00