text-generation-webui

mirror of https://github.com/oobabooga/text-generation-webui.git synced 2024-11-25 17:29:22 +01:00

Author	SHA1	Message	Date
kalomaze	48327cc5c4	Dynamic Temperature HF loader support (#5174 ) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com>	2024-01-07 10:36:26 -03:00
oobabooga	248742df1c	Save extension fields to settings.yaml on "Save UI defaults"	2024-01-04 20:33:42 -08:00
oobabooga	c9d814592e	Increase maximum temperature value to 5	2024-01-04 17:28:15 -08:00
oobabooga	e4d724eb3f	Fix cache_folder bug introduced in `37eff915d6`	2024-01-04 07:49:40 -08:00
Alberto Cano	37eff915d6	Use --disk-cache-dir for all caches	2024-01-04 00:27:26 -03:00
Lounger	7965f6045e	Fix loading latest history for file names with dots (#5162 )	2024-01-03 22:39:41 -03:00
AstrisCantCode	b80e6365d0	Fix various bugs for LoRA training (#5161 )	2024-01-03 20:42:20 -03:00
oobabooga	7cce88c403	Rmove an unncecessary exception	2024-01-02 07:20:59 -08:00
oobabooga	94afa0f9cf	Minor style changes	2024-01-01 16:00:22 -08:00
oobabooga	cbf6f9e695	Update some UI messages	2023-12-30 21:31:17 -08:00
oobabooga	2aad91f3c9	Remove deprecated command-line flags (#5131 )	2023-12-31 02:07:48 -03:00
oobabooga	2734ce3e4c	Remove RWKV loader (#5130 )	2023-12-31 02:01:40 -03:00
oobabooga	0e54a09bcb	Remove exllamav1 loaders (#5128 )	2023-12-31 01:57:06 -03:00
oobabooga	8e397915c9	Remove --sdp-attention, --xformers flags (#5126 )	2023-12-31 01:36:51 -03:00
B611	b7dd1f9542	Specify utf-8 encoding for model metadata file open (#5125 )	2023-12-31 01:34:32 -03:00
oobabooga	c06f630bcc	Increase max_updates_second maximum value	2023-12-24 13:29:47 -08:00
oobabooga	8c60495878	UI: add "Maximum UI updates/second" parameter	2023-12-24 09:17:40 -08:00
zhangningboo	1b8b61b928	Fix output_ids decoding for Qwen/Qwen-7B-Chat (#5045 )	2023-12-22 23:11:02 -03:00
Yiximail	afc91edcb2	Reset the model_name after unloading the model (#5051 )	2023-12-22 22:18:24 -03:00
oobabooga	2706149c65	Organize the CMD arguments by group (#5027 )	2023-12-21 00:33:55 -03:00
oobabooga	c727a70572	Remove redundancy from modules/loaders.py	2023-12-20 19:18:07 -08:00
luna	6efbe3009f	let exllama v1 models load safetensor loras (#4854 )	2023-12-20 13:29:19 -03:00
oobabooga	bcba200790	Fix EOS being ignored in ExLlamav2 after previous commit	2023-12-20 07:54:06 -08:00
oobabooga	f0f6d9bdf9	Add HQQ back & update version This reverts commit `2289e9031e`.	2023-12-20 07:46:09 -08:00
oobabooga	b15f510154	Optimize ExLlamav2 (non-HF) loader	2023-12-20 07:31:42 -08:00
oobabooga	fadb295d4d	Lint	2023-12-19 21:36:57 -08:00
oobabooga	fb8ee9f7ff	Add a specific error if HQQ is missing	2023-12-19 21:32:58 -08:00
oobabooga	9992f7d8c0	Improve several log messages	2023-12-19 20:54:32 -08:00
oobabooga	23818dc098	Better logger Credits: vladmandic/automatic	2023-12-19 20:38:33 -08:00
oobabooga	95600073bc	Add an informative error when extension requirements are missing	2023-12-19 20:20:45 -08:00
oobabooga	d8279dc710	Replace character name placeholders in chat context (closes #5007 )	2023-12-19 17:31:46 -08:00
oobabooga	e83e6cedbe	Organize the model menu	2023-12-19 13:18:26 -08:00
oobabooga	f4ae0075e8	Fix conversion from old template format to jinja2	2023-12-19 13:16:52 -08:00
oobabooga	de138b8ba6	Add llama-cpp-python wheels with tensor cores support (#5003 )	2023-12-19 17:30:53 -03:00
oobabooga	0a299d5959	Bump llama-cpp-python to 0.2.24 (#5001 )	2023-12-19 15:22:21 -03:00
oobabooga	83cf1a6b67	Fix Yi space issue (closes #4996 )	2023-12-19 07:54:19 -08:00
oobabooga	9847809a7a	Add a warning about ppl evaluation without --no_use_fast	2023-12-18 18:09:24 -08:00
oobabooga	f6d701624c	UI: mention that QuIP# does not work on Windows	2023-12-18 18:05:02 -08:00
oobabooga	a23a004434	Update the example template	2023-12-18 17:47:35 -08:00
Water	674be9a09a	Add HQQ quant loader (#4888 ) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com>	2023-12-18 21:23:16 -03:00
oobabooga	1f9e25e76a	UI: update "Saved instruction templates" dropdown after loading template	2023-12-17 21:19:06 -08:00
oobabooga	da1c8d77ea	Merge remote-tracking branch 'refs/remotes/origin/dev' into dev	2023-12-17 21:05:10 -08:00
oobabooga	cac89df97b	Instruction templates: better handle unwanted bos tokens	2023-12-17 21:04:30 -08:00
oobabooga	f0d6ead877	llama.cpp: read instruction template from GGUF metadata (#4975 )	2023-12-18 01:51:58 -03:00
oobabooga	f1f2c4c3f4	Add --num_experts_per_token parameter (ExLlamav2) (#4955 )	2023-12-17 12:08:33 -03:00
oobabooga	12690d3ffc	Better HF grammar implementation (#4953 )	2023-12-17 02:01:23 -03:00
oobabooga	f8079d067d	UI: save the sent chat message on "no model is loaded" error	2023-12-16 10:52:41 -08:00
oobabooga	3bbf6c601d	AutoGPTQ: Add --disable_exllamav2 flag (Mixtral CPU offloading needs this)	2023-12-15 06:46:13 -08:00
oobabooga	2cb5b68ad9	Bug fix: when generation fails, save the sent message (#4915 )	2023-12-15 01:01:45 -03:00
Kim Jaewon	e53f99faa0	[OpenAI Extension] Add 'max_logits' parameter in logits endpoint (#4916 )	2023-12-15 00:22:43 -03:00

1 2 3 4 5 ...

1174 Commits