convert-hf : check for unprocessed Jamba experts

2025-01-14 14:28:58 +01:00 · 2024-05-25 12:54:30 -04:00 · 2024-05-25 12:54:30 -04:00 · ea2e63e9d2
commit ea2e63e9d2
parent 61a88a1da3
1 changed files with 9 additions and 0 deletions
--- a/convert-hf-to-gguf.py
+++ b/convert-hf-to-gguf.py
@ -2470,6 +2470,15 @@ class JambaModel(Model):

        yield new_name, data_torch

+    def write_tensors(self):
+        super().write_tensors()
+
+        if self._experts is not None:
+            # flatten `list[dict[str, Tensor]]` into `list[str]`
+            experts = [k for d in self._experts for k in d.keys()]
+            if len(experts) > 0:
+                raise ValueError(f"Unprocessed experts: {experts}")
+
    # same as Mamba
    def extra_f32_tensors(self, name: str, new_name: str, bid: int | None, n_dims: int) -> bool:
        del n_dims  # unused