Make ExLlama_HF the new default for GPTQ

2025-01-12 21:37:35 +01:00 · 2023-07-14 14:03:56 -07:00 · 2023-07-14 14:03:56 -07:00 · b284f2407d
commit b284f2407d
parent 32f12b8bbf
2 changed files with 2 additions and 2 deletions
--- a/modules/models_settings.py
+++ b/modules/models_settings.py
@ -23,7 +23,7 @@ def infer_loader(model_name):
    if not path_to_model.exists():
        loader = None
    elif Path(f'{shared.args.model_dir}/{model_name}/quantize_config.json').exists() or ('wbits' in model_settings and type(model_settings['wbits']) is int and model_settings['wbits'] > 0):
-        loader = 'AutoGPTQ'
+        loader = 'ExLlama_HF'
    elif len(list(path_to_model.glob('*ggml*.bin'))) > 0:
        loader = 'llama.cpp'
    elif re.match('.*ggml.*\.bin', model_name.lower()):
--- a/server.py
+++ b/server.py
@ -204,7 +204,7 @@ def create_model_menus():

    with gr.Row():
        with gr.Column():
-            shared.gradio['loader'] = gr.Dropdown(label="Model loader", choices=["Transformers", "AutoGPTQ", "GPTQ-for-LLaMa", "ExLlama", "ExLlama_HF", "llama.cpp"], value=None)
+            shared.gradio['loader'] = gr.Dropdown(label="Model loader", choices=["Transformers", "ExLlama_HF", "AutoGPTQ", "llama.cpp", "ExLlama", "GPTQ-for-LLaMa"], value=None)
            with gr.Box():
                with gr.Row():
                    with gr.Column():