Update models_settings.py: add default alpha_value, add proper compress_pos_emb for newer GGUFs (#6111)

2024-11-25 09:19:23 +01:00 · 2024-06-27 06:17:56 +05:00 · 2024-06-27 06:17:56 +05:00 · a85749dcbe
commit a85749dcbe
parent b1187fc9a5
1 changed files with 3 additions and 0 deletions
--- a/modules/models_settings.py
+++ b/modules/models_settings.py
@ -16,6 +16,7 @@ def get_fallback_settings():
        'n_ctx': 2048,
        'rope_freq_base': 0,
        'compress_pos_emb': 1,
        'alpha_value': 1,
        'truncation_length': shared.settings['truncation_length'],
        'skip_special_tokens': shared.settings['skip_special_tokens'],
        'custom_stopping_strings': shared.settings['custom_stopping_strings'],
@ -58,6 +59,8 @@ def get_model_metadata(model):
                model_settings['rope_freq_base'] = metadata[k]
            elif k.endswith('rope.scale_linear'):
                model_settings['compress_pos_emb'] = metadata[k]
            elif k.endswith('rope.scaling.factor'):
                model_settings['compress_pos_emb'] = metadata[k]
            elif k.endswith('block_count'):
                model_settings['n_gpu_layers'] = metadata[k] + 1