text-generation-webui

mirror of https://github.com/oobabooga/text-generation-webui.git synced 2024-11-22 16:17:57 +01:00

Author	SHA1	Message	Date
oobabooga	7a3ca2c68f	Better detect EXL2 models	2023-09-23 13:05:55 -07:00
oobabooga	37e2980e05	Recommend mul_mat_q for llama.cpp	2023-09-17 08:27:11 -07:00
kalomaze	7c9664ed35	Allow full model URL to be used for download (#3919 ) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com>	2023-09-16 10:06:13 -03:00
Johan	fdcee0c215	Allow custom tokenizer for llamacpp_HF loader (#3941 )	2023-09-15 12:38:38 -03:00
oobabooga	9331ab4798	Read GGUF metadata (#3873 )	2023-09-11 18:49:30 -03:00
oobabooga	ed86878f02	Remove GGML support	2023-09-11 07:44:00 -07:00
oobabooga	4affa08821	Do not impose instruct mode while loading models	2023-09-02 11:31:33 -07:00
missionfloyd	787219267c	Allow downloading single file from UI (#3737 )	2023-08-29 23:32:36 -03:00
oobabooga	0c9e818bb8	Update truncation length based on max_seq_len/n_ctx	2023-08-26 23:10:45 -07:00
oobabooga	3361728da1	Change some comments	2023-08-26 22:24:44 -07:00
oobabooga	5c7d8bfdfd	Detect CodeLlama settings	2023-08-25 07:06:57 -07:00
oobabooga	52ab2a6b9e	Add rope_freq_base parameter for CodeLlama	2023-08-25 06:55:15 -07:00
oobabooga	d6934bc7bc	Implement CFG for ExLlama_HF (#3666 )	2023-08-24 16:27:36 -03:00
oobabooga	ee964bcce9	Update a comment about RoPE scaling	2023-08-20 07:01:43 -07:00
oobabooga	7cba000421	Bump llama-cpp-python, +tensor_split by @shouyiwang, +mul_mat_q (#3610 )	2023-08-18 12:03:34 -03:00
Chris Lefever	0230fa4e9c	Add the --disable_exllama option for AutoGPTQ	2023-08-12 02:26:58 -04:00
cal066	7a4fcee069	Add ctransformers support (#3313 ) --------- Co-authored-by: cal066 <cal066@users.noreply.github.com> Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> Co-authored-by: randoentity <137087500+randoentity@users.noreply.github.com>	2023-08-11 14:41:33 -03:00
jllllll	d6765bebc4	Update installation documentation	2023-08-10 00:53:48 -05:00
jllllll	bee73cedbd	Streamline GPTQ-for-LLaMa support	2023-08-09 23:42:34 -05:00
oobabooga	d8fb506aff	Add RoPE scaling support for transformers (including dynamic NTK) https://github.com/huggingface/transformers/pull/24653	2023-08-08 21:25:48 -07:00
Gennadij	0e78f3b4d4	Fixed a typo in "rms_norm_eps", incorrectly set as n_gqa (#3494 )	2023-08-08 00:31:11 -03:00
oobabooga	412f6ff9d3	Change alpha_value maximum and step	2023-08-07 06:08:51 -07:00
oobabooga	65aa11890f	Refactor everything (#3481 )	2023-08-06 21:49:27 -03:00

1 2

73 Commits