Add a note about RWKV loader

2024-11-25 17:29:22 +01:00 · 2023-09-26 17:43:39 -07:00 · 2023-09-26 17:43:39 -07:00 · 87ea2d96fd
commit 87ea2d96fd
parent 13a54729b1
2 changed files with 17 additions and 8 deletions
--- a/modules/RWKV.py
+++ b/modules/RWKV.py
@ -1,3 +1,8 @@
 '''
 This loader is not currently maintained as RWKV can now be loaded
 through the transformers library.
 '''
 import copy
 import os
 from pathlib import Path
--- a/modules/models.py
+++ b/modules/models.py
@ -211,14 +211,6 @@ def huggingface_loader(model_name):
    return model
 def RWKV_loader(model_name):
    from modules.RWKV import RWKVModel, RWKVTokenizer
    model = RWKVModel.from_pretrained(Path(f'{shared.args.model_dir}/{model_name}'), dtype="fp32" if shared.args.cpu else "bf16" if shared.args.bf16 else "fp16", device="cpu" if shared.args.cpu else "cuda")
    tokenizer = RWKVTokenizer.from_pretrained(Path(shared.args.model_dir))
    return model, tokenizer
 def llamacpp_loader(model_name):
    from modules.llamacpp_model import LlamaCppModel
@ -335,6 +327,18 @@ def ExLlamav2_HF_loader(model_name):
    return Exllamav2HF.from_pretrained(model_name)
 def RWKV_loader(model_name):
    '''
    This loader is not currently maintained as RWKV can now be loaded
    through the transformers library.
    '''
    from modules.RWKV import RWKVModel, RWKVTokenizer
    model = RWKVModel.from_pretrained(Path(f'{shared.args.model_dir}/{model_name}'), dtype="fp32" if shared.args.cpu else "bf16" if shared.args.bf16 else "fp16", device="cpu" if shared.args.cpu else "cuda")
    tokenizer = RWKVTokenizer.from_pretrained(Path(shared.args.model_dir))
    return model, tokenizer
 def get_max_memory_dict():
    max_memory = {}
    if shared.args.gpu_memory: