llama.cpp/gguf-py/gguf/utility.py

from __future__ import annotations

from typing import Literal


def fill_templated_filename(filename: str, output_type: str | None) -> str:
    # Given a file name fill in any type templates e.g. 'some-model-name.{ftype}.gguf'
    ftype_lowercase: str = output_type.lower() if output_type is not None else ""
    ftype_uppercase: str = output_type.upper() if output_type is not None else ""
    return filename.format(ftype_lowercase,
                           outtype=ftype_lowercase, ftype=ftype_lowercase,
                           OUTTYPE=ftype_uppercase, FTYPE=ftype_uppercase)


def model_weight_count_rounded_notation(model_params_count: int, min_digits: int = 2) -> str:
    if model_params_count > 1e12 :
        # Trillions Of Parameters
        scaled_model_params = model_params_count * 1e-12
        scale_suffix = "T"
    elif model_params_count > 1e9 :
        # Billions Of Parameters
        scaled_model_params = model_params_count * 1e-9
        scale_suffix = "B"
    elif model_params_count > 1e6 :
        # Millions Of Parameters
        scaled_model_params = model_params_count * 1e-6
        scale_suffix = "M"
    else:
        # Thousands Of Parameters
        scaled_model_params = model_params_count * 1e-3
        scale_suffix = "K"

    fix = max(min_digits - len(str(round(scaled_model_params)).lstrip('0')), 0)

    return f"{scaled_model_params:.{fix}f}{scale_suffix}"


def size_label(total_params: int, shared_params: int, expert_params: int, expert_count: int) -> str:

    if expert_count > 0:
        pretty_size = model_weight_count_rounded_notation(abs(shared_params) + abs(expert_params), min_digits=2)
        size_class = f"{expert_count}x{pretty_size}"
    else:
        size_class = model_weight_count_rounded_notation(abs(total_params), min_digits=2)

    return size_class


def naming_convention(model_name: str | None, base_name: str | None, finetune_string: str | None, version_string: str | None, size_label: str | None, output_type: str | None, model_type: Literal['vocab', 'LoRA'] | None = None) -> str:
    # Reference: https://github.com/ggerganov/ggml/blob/master/docs/gguf.md#gguf-naming-convention

    if base_name is not None:
        name = base_name.strip().title().replace(' ', '-').replace('/', '-')
    elif model_name is not None:
        name = model_name.strip().title().replace(' ', '-').replace('/', '-')
    else:
        name = "ggml-model"

    parameters = f"-{size_label}" if size_label is not None else ""

    finetune = f"-{finetune_string.strip().title().replace(' ', '-')}" if finetune_string is not None else ""

    version = f"-{version_string.strip().replace(' ', '-')}" if version_string is not None else ""

    encoding = f"-{output_type.strip().replace(' ', '-').upper()}" if output_type is not None else ""

    kind = f"-{model_type.strip().replace(' ', '-')}" if model_type is not None else ""

    return f"{name}{parameters}{finetune}{version}{encoding}{kind}"
convert-.py: GGUF Naming Convention Refactor and Metadata Override Refactor (#7499) Main thing is that the default output filename will take this form {name}{parameters}{finetune}{version}{encoding}{kind} In addition this add and remove some entries in the KV store and adds a metadata class with automatic heuristics capability to derive some values based on model card content No Change: - Internal GGUF Spec - `general.architecture` - `general.quantization_version` - `general.alignment` - `general.file_type` - General Model Details - `general.name` - `general.author` - `general.version` - `general.description` - Licensing details - `general.license` - Typically represents the converted GGUF repo (Unless made from scratch) - `general.url` - Model Source during conversion - `general.source.url` * Removed: - Model Source during conversion - `general.source.huggingface.repository` * Added: - General Model Details - `general.organization` - `general.finetune` - `general.basename` - `general.quantized_by` - `general.size_label` - Licensing details - `general.license.name` - `general.license.link` - Typically represents the converted GGUF repo (Unless made from scratch) - `general.doi` - `general.uuid` - `general.repo_url` - Model Source during conversion - `general.source.doi` - `general.source.uuid` - `general.source.repo_url` - Base Model Source - `general.base_model.count` - `general.base_model.{id}.name` - `general.base_model.{id}.author` - `general.base_model.{id}.version` - `general.base_model.{id}.organization` - `general.base_model.{id}.url` (Model Website/Paper) - `general.base_model.{id}.doi` - `general.base_model.{id}.uuid` - `general.base_model.{id}.repo_url` (Model Source Repository (git/svn/etc...)) - Array based KV stores - `general.tags` - `general.languages` - `general.datasets` --------- Co-authored-by: compilade <git@compilade.net> Co-authored-by: Xuan Son Nguyen <thichthat@gmail.com> 2024-07-18 12:40:15 +02:00			`from __future__ import annotations`

			`from typing import Literal`


			`def fill_templated_filename(filename: str, output_type: str \| None) -> str:`
			`# Given a file name fill in any type templates e.g. 'some-model-name.{ftype}.gguf'`
			`ftype_lowercase: str = output_type.lower() if output_type is not None else ""`
			`ftype_uppercase: str = output_type.upper() if output_type is not None else ""`
			`return filename.format(ftype_lowercase,`
			`outtype=ftype_lowercase, ftype=ftype_lowercase,`
			`OUTTYPE=ftype_uppercase, FTYPE=ftype_uppercase)`


			`def model_weight_count_rounded_notation(model_params_count: int, min_digits: int = 2) -> str:`
			`if model_params_count > 1e12 :`
			`# Trillions Of Parameters`
			`scaled_model_params = model_params_count * 1e-12`
			`scale_suffix = "T"`
			`elif model_params_count > 1e9 :`
			`# Billions Of Parameters`
			`scaled_model_params = model_params_count * 1e-9`
			`scale_suffix = "B"`
			`elif model_params_count > 1e6 :`
			`# Millions Of Parameters`
			`scaled_model_params = model_params_count * 1e-6`
			`scale_suffix = "M"`
			`else:`
			`# Thousands Of Parameters`
			`scaled_model_params = model_params_count * 1e-3`
			`scale_suffix = "K"`

			`fix = max(min_digits - len(str(round(scaled_model_params)).lstrip('0')), 0)`

			`return f"{scaled_model_params:.{fix}f}{scale_suffix}"`


			`def size_label(total_params: int, shared_params: int, expert_params: int, expert_count: int) -> str:`

			`if expert_count > 0:`
			`pretty_size = model_weight_count_rounded_notation(abs(shared_params) + abs(expert_params), min_digits=2)`
			`size_class = f"{expert_count}x{pretty_size}"`
			`else:`
			`size_class = model_weight_count_rounded_notation(abs(total_params), min_digits=2)`

			`return size_class`


			`def naming_convention(model_name: str \| None, base_name: str \| None, finetune_string: str \| None, version_string: str \| None, size_label: str \| None, output_type: str \| None, model_type: Literal['vocab', 'LoRA'] \| None = None) -> str:`
			`# Reference: https://github.com/ggerganov/ggml/blob/master/docs/gguf.md#gguf-naming-convention`

			`if base_name is not None:`
			`name = base_name.strip().title().replace(' ', '-').replace('/', '-')`
			`elif model_name is not None:`
			`name = model_name.strip().title().replace(' ', '-').replace('/', '-')`
			`else:`
			`name = "ggml-model"`

			`parameters = f"-{size_label}" if size_label is not None else ""`

			`finetune = f"-{finetune_string.strip().title().replace(' ', '-')}" if finetune_string is not None else ""`

			`version = f"-{version_string.strip().replace(' ', '-')}" if version_string is not None else ""`

			`encoding = f"-{output_type.strip().replace(' ', '-').upper()}" if output_type is not None else ""`

			`kind = f"-{model_type.strip().replace(' ', '-')}" if model_type is not None else ""`

			`return f"{name}{parameters}{finetune}{version}{encoding}{kind}"`