Fix safetensors kwarg usage in AutoAWQ

2024-11-22 16:17:57 +01:00 · 2023-10-10 19:03:09 -07:00 · 2023-10-10 19:03:09 -07:00 · f63361568c
commit f63361568c
parent 39f16ff83d
1 changed files with 13 additions and 13 deletions
--- a/modules/models.py
+++ b/modules/models.py
@ -277,14 +277,12 @@ def ctransformers_loader(model_name):
    model, tokenizer = ctrans.from_pretrained(model_file)
    return model, tokenizer
 def AutoAWQ_loader(model_name):
    from awq import AutoAWQForCausalLM
    model_dir = Path(f'{shared.args.model_dir}/{model_name}')
   if shared.args.deepspeed:
       logger.warn("AutoAWQ is incompatible with deepspeed")
    model = AutoAWQForCausalLM.from_quantized(
                quant_path=model_dir,
                max_new_tokens=shared.args.max_seq_len,
@ -292,10 +290,12 @@ def AutoAWQ_loader(model_name):
                fuse_layers=not shared.args.no_inject_fused_attention,
                max_memory=get_max_memory_dict(),
                batch_size=shared.args.n_batch,
-       safetensors=not shared.args.trust_remote_code)
+                safetensors=any(model_dir.glob('*.safetensors')),
            )
    return model
 def GPTQ_loader(model_name):
    # Monkey patch