convert-llama-h5-to-gguf.py : fixes

2025-01-07 11:23:56 +01:00 · 2023-08-14 11:14:24 +02:00 · 2023-08-14 11:14:24 +02:00 · a7d226f871
commit a7d226f871
parent d753dfbcc8
1 changed files with 16 additions and 7 deletions
--- a/convert-llama-h5-to-gguf.py
+++ b/convert-llama-h5-to-gguf.py
@ -1,7 +1,7 @@
 # HF llama --> gguf conversion, GQA/70b not supported
 import gguf
-import gguf_tensor_map as tmap
+import gguf_namemap as tmap
 import os
 import sys
 import struct
@ -79,14 +79,23 @@ gguf_writer = gguf.GGUFWriter.open(fname_out)
 print("gguf: get model metadata")
 llm_arch = "llama"
 hf_repo = hparams["_name_or_path"]
 head_count = hparams["num_attention_heads"]
 head_count_kv = hparams["num_key_value_heads"]
 block_count = hparams["num_hidden_layers"]
 head_count = hparams["num_attention_heads"]
 if "num_key_value_heads" in hparams:
    head_count_kv = hparams["num_key_value_heads"]
 else:
    head_count_kv = head_count
 if "_name_or_path" in hparams:
    hf_repo = hparams["_name_or_path"]
 else:
    hf_repo=""
 gguf_writer.add_name(last_dir)
 gguf_writer.add_architecture(llm_arch)
-guff_writer.add_source_hf_repo(hf_repo)
+gguf_writer.add_name(last_dir)
 gguf_writer.add_file_type( "All tensors F32" if ftype == 0 else "Most tensors F16, some F32")
 gguf_writer.add_source_hf_repo(hf_repo)
 gguf_writer.add_context_length(llm_arch, hparams["max_position_embeddings"])
 gguf_writer.add_embedding_length(llm_arch, hparams["hidden_size"])
 gguf_writer.add_block_count(llm_arch, block_count)
@ -173,7 +182,7 @@ if Path(dir_model + "/tokenizer.json").is_file():
 # TENSORS
-tensor_map = tmap.get_tensor_map(block_count)
+tensor_map = tmap.get_tensor_namemap(block_count)
 # tensor info
 print("gguf: get tensor metadata")