Don't import PEFT unless necessary

2025-01-26 12:22:08 +01:00 · 2024-09-03 19:40:53 -07:00 · 2024-09-03 19:40:53 -07:00 · bba5b36d33
commit bba5b36d33
parent c5b40eb555
2 changed files with 13 additions and 9 deletions
--- a/modules/LoRA.py
+++ b/modules/LoRA.py
@ -1,7 +1,6 @@
 from pathlib import Path

 import torch
-from peft import PeftModel
 from transformers import is_torch_xpu_available

 import modules.shared as shared
@ -85,6 +84,9 @@ def add_lora_autogptq(lora_names):


 def add_lora_transformers(lora_names):
+
+    from peft import PeftModel
+
    prior_set = set(shared.lora_names)
    added_set = set(lora_names) - prior_set
    removed_set = prior_set - set(lora_names)
--- a/modules/training.py
+++ b/modules/training.py
@ -18,14 +18,6 @@ import gradio as gr
 import torch
 import transformers
 from datasets import Dataset, load_dataset
-from peft import (
-    LoraConfig,
-    get_peft_model,
-    prepare_model_for_kbit_training,
-    set_peft_model_state_dict
-)
-from peft.utils.other import \
-    TRANSFORMERS_MODELS_TO_LORA_TARGET_MODULES_MAPPING as model_to_lora_modules
 from transformers import is_torch_xpu_available
 from transformers.models.auto.modeling_auto import (
    MODEL_FOR_CAUSAL_LM_MAPPING_NAMES
@ -292,6 +284,16 @@ def calc_trainable_parameters(model):

 def do_train(lora_name: str, always_override: bool, q_proj_en: bool, v_proj_en: bool, k_proj_en: bool, o_proj_en: bool, gate_proj_en: bool, down_proj_en: bool, up_proj_en: bool, save_steps: int, micro_batch_size: int, batch_size: int, epochs: int, learning_rate: str, lr_scheduler_type: str, lora_rank: int, lora_alpha: int, lora_dropout: float, cutoff_len: int, dataset: str, eval_dataset: str, format: str, eval_steps: int, raw_text_file: str, overlap_len: int, newline_favor_len: int, higher_rank_limit: bool, warmup_steps: int, optimizer: str, hard_cut_string: str, train_only_after: str, stop_at_loss: float, add_eos_token: bool, min_chars: int, report_to: str):

+    from peft import (
+        LoraConfig,
+        get_peft_model,
+        prepare_model_for_kbit_training,
+        set_peft_model_state_dict
+    )
+    from peft.utils.other import \
+        TRANSFORMERS_MODELS_TO_LORA_TARGET_MODULES_MAPPING as \
+        model_to_lora_modules
+
    global WANT_INTERRUPT
    WANT_INTERRUPT = False