py : also print the normalizers

2025-01-12 21:37:19 +01:00 · 2024-05-08 12:47:07 +03:00 · 2024-05-08 12:47:07 +03:00 · 7e0b6a7b3b
commit 7e0b6a7b3b
parent acdce3cdef
1 changed files with 2 additions and 0 deletions
--- a/convert-hf-to-gguf-update.py
+++ b/convert-hf-to-gguf-update.py
@ -151,6 +151,8 @@ for model in models:
    # print the "pre_tokenizer" content from the tokenizer.json
    with open(f"models/tokenizers/{name}/tokenizer.json", "r", encoding="utf-8") as f:
        cfg = json.load(f)
        normalizer = cfg["normalizer"]
        logger.info("normalizer: " + json.dumps(normalizer, indent=4))
        pre_tokenizer = cfg["pre_tokenizer"]
        logger.info("pre_tokenizer: " + json.dumps(pre_tokenizer, indent=4))