Model › Framework¶

Source path: AlphaBrain/model/framework/

Each framework is an independent VLA model implementation. Frameworks are registered via FRAMEWORK_REGISTRY in AlphaBrain.model.tools and constructed by the build_framework(cfg) factory based on cfg.framework.name.

Factory and registry¶

framework ¶

Framework factory utilities. Automatically builds registered framework implementations based on configuration.

Each framework module (e.g., M1.py, QwenFast.py) should register itself: from AlphaBrain.model.framework.framework_registry import FRAMEWORK_REGISTRY

@FRAMEWORK_REGISTRY.register("InternVLA-M1")
def build_model_framework(config):
    return InternVLA_M1(config=config)

build_framework ¶

build_framework(cfg)

Build a framework model from config. Args: cfg: Config object (OmegaConf / namespace) containing: cfg.framework.name: Identifier string (e.g. "InternVLA-M1") Returns: nn.Module: Instantiated framework model.

Source code in AlphaBrain/model/framework/__init__.py

def build_framework(cfg):
    """
    Build a framework model from config.
    Args:
        cfg: Config object (OmegaConf / namespace) containing:
             cfg.framework.name: Identifier string (e.g. "InternVLA-M1")
    Returns:
        nn.Module: Instantiated framework model.
    """

    if not hasattr(cfg.framework, "name"): 
        cfg.framework.name = cfg.framework.framework_py  # Backward compatibility for legacy config yaml

    if cfg.framework.name == "ToyVLA":
        from AlphaBrain.model.framework.ToyModel import ToyVLA
        return ToyVLA(config=cfg)
    elif cfg.framework.name == "QwenOFT":
        from AlphaBrain.model.framework.QwenOFT import Qwenvl_OFT
        return Qwenvl_OFT(cfg)
    elif cfg.framework.name == "QwenFast":
        from AlphaBrain.model.framework.QwenFast import Qwenvl_Fast
        return Qwenvl_Fast(cfg)
    elif cfg.framework.name == "NeuroVLA":
        from AlphaBrain.model.framework.NeuroVLA import NeuroVLA
        return NeuroVLA(cfg)
    elif cfg.framework.name == "QwenGR00T":
        from AlphaBrain.model.framework.QwenGR00T import Qwen_GR00T
        return Qwen_GR00T(cfg)
    elif cfg.framework.name == "ACT":
        from AlphaBrain.model.framework.ACT import ACTModel
        return ACTModel(config=cfg)
    elif cfg.framework.name == "CosmosPolicy":
        from AlphaBrain.model.framework.CosmosPolicy import CosmosPolicy
        return CosmosPolicy(config=cfg)
    elif cfg.framework.name == "PaliGemmaOFT":
        from AlphaBrain.model.framework.PaliGemmaOFT import PaliGemma_OFT
        return PaliGemma_OFT(cfg)
    elif cfg.framework.name in ("PaliGemmaPi05", "LlamaPi05"):
        # Pi0.5 framework. The registry name only picks defaults (e.g.
        # gripper_remap defaults to true under "PaliGemmaPi05").
        from AlphaBrain.model.framework.PaliGemmaPi import PaliGemmaPi
        return PaliGemmaPi(cfg)
    elif cfg.framework.name == "LlamaOFT":
        from AlphaBrain.model.framework.LlamaOFT import Llama_OFT
        return Llama_OFT(cfg)

    # auto detect from registry
    framework_id = cfg.framework.name
    if framework_id not in FRAMEWORK_REGISTRY._registry:
        raise NotImplementedError(f"Framework {cfg.framework.name} is not implemented. Plz, python yourframework_py to specify framework module.")

    MODEL_CLASS = FRAMEWORK_REGISTRY[framework_id]
    return MODEL_CLASS(cfg)

tools ¶

FRAMEWORK_REGISTRY `module-attribute` ¶

FRAMEWORK_REGISTRY = Registry('frameworks')

Base class and config utilities¶

base_framework ¶

Base framework abstraction providing: - Pretrained loading (config + normalization stats + weights) - Action space utilities (dimension, stats, (un)normalization) - Trainable module discovery helper Note: No device placement or optimizer concerns handled here (delegated to trainer).

BaseFramework ¶

BaseFramework(hf_config=PretrainedConfig())

Bases: PreTrainedModel

Lightweight base class for higher-level VLA model assemblies. Subclasses are expected to: - Accept a structured config - Register components in init - Use provided helpers for action normalization handling

Initialize base nn.Module. Subclasses add components.

Source code in AlphaBrain/model/framework/base_framework.py

def __init__(
    self,
    hf_config = PretrainedConfig()
) -> None:
    """
    Initialize base nn.Module. Subclasses add components.
    """

    super().__init__(hf_config)

trainable_module_keys `property` ¶

trainable_module_keys: List[str]

Enumerate trainable submodule names up to a depth.

Parameters:

Name	Type	Description	Default
`max_depth`		Descent depth when traversing module tree.	required

Returns:

Type	Description
`List[str]`	List[str]: Module path names considered trainable.

from_pretrained `classmethod` ¶

from_pretrained(pretrained_checkpoint: str, **kwargs) -> None

Restore a model instance from a saved checkpoint.

Workflow

Resolve checkpoint path
Load config + dataset normalization statistics
Build model with loaded config
Load state_dict strictly (reports missing/unexpected keys)
Attach normalization stats for later un-normalization

Parameters:

Name	Type	Description	Default
`pretrained_checkpoint`	`str`	Path to .pt/.safetensors file or self-contained checkpoint directory.	required
`**kwargs`		Extra constructor overrides passed to subclass.	`{}`

Returns:

Name	Type	Description
`BaseFramework`	`None`	Instantiated model (left on CPU; caller decides device).

Raises:

Type	Description
`RuntimeError`	If state_dict key mismatch occurs under strict=True.
`FileNotFoundError`	If underlying files are missing (surfaced earlier).

Source code in AlphaBrain/model/framework/base_framework.py

@classmethod
def from_pretrained(
    cls,
    pretrained_checkpoint: str,
    **kwargs,
) -> None:
    """
    Restore a model instance from a saved checkpoint.

    Workflow:
        1. Resolve checkpoint path
        2. Load config + dataset normalization statistics
        3. Build model with loaded config
        4. Load state_dict strictly (reports missing/unexpected keys)
        5. Attach normalization stats for later un-normalization

    Args:
        pretrained_checkpoint: Path to .pt/.safetensors file or self-contained checkpoint directory.
        **kwargs: Extra constructor overrides passed to subclass.

    Returns:
        BaseFramework: Instantiated model (left on CPU; caller decides device).

    Raises:
        RuntimeError: If state_dict key mismatch occurs under strict=True.
        FileNotFoundError: If underlying files are missing (surfaced earlier).
    """
    pretrained_checkpoint = Path(pretrained_checkpoint)

    # lpt0309: 支持自包含目录格式checkpoint（单一路径推断，无需base_vlm）
    if pretrained_checkpoint.is_dir():
        logger.info(f"[lpt0309] Loading from self-contained checkpoint directory: {pretrained_checkpoint}")
        model_config, norm_stats = read_mode_config(pretrained_checkpoint)  # lpt0309: 从目录读取config和norm_stats

        config = dict_to_namespace(model_config)
        config.trainer.pretrained_checkpoint = None

        # 单次加载优化 - 如果checkpoint目录包含vlm_pretrained/（兼容旧名qwen_pretrained/），
        # 直接从中加载tokenizer/config，用meta device创建模型骨架，由后续load_state_dict一次性加载所有权重
        vlm_pretrained_dir = pretrained_checkpoint / "vlm_pretrained"
        legacy_dir = pretrained_checkpoint / "qwen_pretrained"
        if not (vlm_pretrained_dir.is_dir() and any(vlm_pretrained_dir.iterdir())):
            # 兼容旧格式 qwen_pretrained/
            if legacy_dir.is_dir() and any(legacy_dir.iterdir()):
                vlm_pretrained_dir = legacy_dir

        if vlm_pretrained_dir.is_dir() and any(vlm_pretrained_dir.iterdir()):
            logger.info(f"Found {vlm_pretrained_dir.name}/ in checkpoint, using single-read loading")
            cfg_key = _detect_vlm_cfg_key(config.framework)
            if cfg_key is not None:
                vlm_block = getattr(config.framework, cfg_key)
                original_base_vlm = getattr(vlm_block, 'base_vlm', "") if not hasattr(vlm_block, 'get') else vlm_block.get('base_vlm', "")
                vlm_block.vlm_type = original_base_vlm
                vlm_block.base_vlm = str(vlm_pretrained_dir)
                vlm_block._meta_device_init = True
            else:
                logger.warning("vlm_pretrained/ found but no VLM config key detected, skipping single-read optimization")
        else:
            logger.warning(f"No vlm_pretrained/ found (or empty), falling back to two-read loading from original base_vlm")

        FrameworkModel = build_framework(cfg=config)
        FrameworkModel.norm_stats = norm_stats

        # lpt0309: 从目录中找到权重文件
        weights_path = pretrained_checkpoint / "model.safetensors"
        if not weights_path.exists():
            weights_path = pretrained_checkpoint / "pytorch_model.pt"
        assert weights_path.exists(), f"[lpt0309] No weights file found in {pretrained_checkpoint}"

        if weights_path.suffix == ".safetensors":
            from safetensors.torch import load_file
            model_state_dict = load_file(str(weights_path))
        else:
            model_state_dict = torch.load(weights_path, map_location="cpu")

        logger.info(f"[lpt0309] Loading weights from {weights_path}")

        # Key remapping: old checkpoints use 'vlm.' prefix, new model uses 'qwen_vl_interface.'
        remapped = {}
        for k, v in model_state_dict.items():
            new_k = k.replace('vlm.', 'qwen_vl_interface.', 1) if k.startswith('vlm.') else k
            remapped[new_k] = v
        if len(remapped) != len(model_state_dict):
            logger.warning(f"Key remapping changed key count: {len(model_state_dict)} -> {len(remapped)}")
        else:
            n_remapped = sum(1 for k in model_state_dict if k.startswith('vlm.'))
            if n_remapped > 0:
                logger.info(f"Remapped {n_remapped} keys from vlm.* to qwen_vl_interface.*")
        model_state_dict = remapped

        model_keys = set(FrameworkModel.state_dict().keys())
        checkpoint_keys = set(model_state_dict.keys())
        # Try strict first; fall back to non-strict if only non-critical keys mismatch
        try:
            FrameworkModel.load_state_dict(model_state_dict, strict=True)
        except RuntimeError as e:
            common_keys = model_keys.intersection(checkpoint_keys)
            missing_keys = model_keys - common_keys
            unexpected_keys = checkpoint_keys - common_keys
            if missing_keys:
                logger.warning(f"Missing keys in state_dict ({len(missing_keys)}): {missing_keys}")
            if unexpected_keys:
                logger.warning(f"Unexpected keys in state_dict ({len(unexpected_keys)}): {unexpected_keys}")
            # Fall back to non-strict loading for cross-framework weight loading (e.g. openpi → AlphaBrain)
            logger.warning(f"Strict loading failed, falling back to non-strict (missing={len(missing_keys)}, unexpected={len(unexpected_keys)})")
            FrameworkModel.load_state_dict(model_state_dict, strict=False)

        logger.info(
            "[lpt0324] Successfully loaded model from self-contained checkpoint "
            "with legacy two-stage loading"
        )
        return FrameworkModel

    # origin0309: 原始文件格式加载（需要base_vlm路径，存在冗余权重读取）
    else:
        model_config, norm_stats = read_mode_config(pretrained_checkpoint)  # read config and norm_stats

        config = dict_to_namespace(model_config)
        model_config = config
        model_config.trainer.pretrained_checkpoint = None
        # FrameworkModel = cls(config=model_config, **kwargs) # TODO find cls by config
        FrameworkModel = build_framework(cfg=model_config)
        # set for action un-norm
        FrameworkModel.norm_stats = norm_stats
        # Load from Checkpoint (Custom --> should load both *projector* and *llm* weights)
        if pretrained_checkpoint.suffix == ".safetensors":
            from safetensors.torch import load_file
            # TODO pretrained_checkpoint 这里先转成了path后面又用str, 存在冗余
            model_state_dict = load_file(str(pretrained_checkpoint))
        else:
            model_state_dict = torch.load(pretrained_checkpoint, map_location="cpu")
        # logger.info(f"Loading model weights from `{pretrained_checkpoint}`")
        model_keys = set(FrameworkModel.state_dict().keys())
        checkpoint_keys = set(model_state_dict.keys())  # TODO 为什么会存在重复?
        try:
            FrameworkModel.load_state_dict(model_state_dict, strict=True)
        except RuntimeError as e:
            # must keep all keys matched
            common_keys = model_keys.intersection(checkpoint_keys)
            missing_keys = model_keys - common_keys
            unexpected_keys = checkpoint_keys - common_keys
            if missing_keys:
                logger.warning(f"Missing keys in state_dict: {missing_keys}")
            if unexpected_keys:
                logger.warning(f"Unexpected keys in state_dict: {unexpected_keys}")

            raise e

        # **ensure model is on GPU**
        FrameworkModel = FrameworkModel
        return FrameworkModel

convert_checkpoint_to_dir `staticmethod` ¶

convert_checkpoint_to_dir(old_ckpt_path: str, output_dir: str = None, base_vlm_path: str = None)

Convert an old-format file checkpoint to the new self-contained directory format.

Parameters:

Name	Type	Description	Default
`old_ckpt_path`	`str`	Path to old .safetensors/.pt checkpoint file.	required
`output_dir`	`str`	Output directory path. If None, creates a directory alongside the file.	`None`
`base_vlm_path`	`str`	Path to Qwen base model (for saving config + processor). If None, reads from the checkpoint's config.yaml.	`None`

Source code in AlphaBrain/model/framework/base_framework.py

@staticmethod
def convert_checkpoint_to_dir(
    old_ckpt_path: str,
    output_dir: str = None,
    base_vlm_path: str = None,
):
    """
    Convert an old-format file checkpoint to the new self-contained directory format.

    Args:
        old_ckpt_path: Path to old .safetensors/.pt checkpoint file.
        output_dir: Output directory path. If None, creates a directory alongside the file.
        base_vlm_path: Path to Qwen base model (for saving config + processor).
                      If None, reads from the checkpoint's config.yaml.
    """
    import shutil
    old_ckpt_path = Path(old_ckpt_path)
    assert old_ckpt_path.is_file(), f"Old checkpoint not found: {old_ckpt_path}"

    # Determine output directory
    if output_dir is None:
        output_dir = old_ckpt_path.parent / old_ckpt_path.stem.replace("_model", "").replace("_pytorch", "")
    output_dir = Path(output_dir)
    os.makedirs(output_dir, exist_ok=True)

    # Copy weights
    weights_name = "model.safetensors" if old_ckpt_path.suffix == ".safetensors" else "pytorch_model.pt"
    shutil.copy2(str(old_ckpt_path), str(output_dir / weights_name))
    logger.info(f"[lpt0309] Copied weights to {output_dir / weights_name}")

    # Copy config.yaml and dataset_statistics.json from run dir
    run_dir = old_ckpt_path.parents[1]
    for fname, target_name in [("config.yaml", "framework_config.yaml"), ("dataset_statistics.json", "dataset_statistics.json")]:
        src = run_dir / fname
        if src.exists():
            shutil.copy2(str(src), str(output_dir / target_name))
            logger.info(f"[lpt0309] Copied {fname} -> {output_dir / target_name}")

    # Save VLM config + processor (auto-detect VLM type from config)
    if base_vlm_path is None:
        config_yaml = run_dir / "config.yaml"
        if config_yaml.exists():
            from omegaconf import OmegaConf
            cfg = OmegaConf.load(str(config_yaml))
            base_vlm_path = _get_base_vlm_path(cfg.framework)

    if base_vlm_path:
        vlm_pretrained_dir = output_dir / "vlm_pretrained"
        os.makedirs(vlm_pretrained_dir, exist_ok=True)
        try:
            from transformers import AutoConfig, AutoProcessor
            vlm_config = AutoConfig.from_pretrained(base_vlm_path, trust_remote_code=True)
            vlm_config.save_pretrained(str(vlm_pretrained_dir))
            processor = AutoProcessor.from_pretrained(base_vlm_path)
            processor.save_pretrained(str(vlm_pretrained_dir))
            logger.info(f"[lpt0309] Saved VLM config + processor to {vlm_pretrained_dir}")
        except Exception as e:
            logger.warning(f"[lpt0309] Could not save VLM config/processor from {base_vlm_path}: {e}")

    logger.info(f"[lpt0309] Conversion complete: {output_dir}")

get_action_stats `classmethod` ¶

get_action_stats(unnorm_key=None)

Retrieve raw action normalization statistics.

Parameters:

Name	Type	Description	Default
`unnorm_key`		Optional dataset stats key.	`None`

Returns:

Name	Type	Description
`dict`		Stats structure (e.g. q01, q99, mask).

Source code in AlphaBrain/model/framework/base_framework.py

@classmethod
def get_action_stats(self, unnorm_key=None):
    """
    Retrieve raw action normalization statistics.

    Args:
        unnorm_key: Optional dataset stats key.

    Returns:
        dict: Stats structure (e.g. q01, q99, mask).
    """
    unnorm_key = self._check_unnorm_key(self.norm_stats, unnorm_key)
    return self.norm_stats[unnorm_key]["action"]

unnormalize_actions `staticmethod` ¶

unnormalize_actions(normalized_actions: ndarray, action_norm_stats: Dict[str, ndarray]) -> np.ndarray

Map normalized actions (≈[-1, 1]) back to original value range.

Auto-detects normalization mode via the optional 'norm_mode' key in action_norm_stats (defaults to 'q99' for backward compatibility): - 'q99' → uses q01 / q99 bounds - 'min_max' → uses min / max bounds

Steps

Clamp values to [-1, 1]
Threshold channel index 6 to {0,1} (binary semantic)
Apply linear scaling for masked dimensions

Parameters:

Name	Type	Description	Default
`normalized_actions`	`ndarray`	Array shape [T, D] (or chunk length × action_dim).	required
`action_norm_stats`	`Dict[str, ndarray]`	Dict containing stat arrays and optional 'norm_mode'.	required

Returns:

Type	Description
`ndarray`	np.ndarray: Unnormalized actions (same shape as input).

Source code in AlphaBrain/model/framework/base_framework.py

@staticmethod
def unnormalize_actions(normalized_actions: np.ndarray, action_norm_stats: Dict[str, np.ndarray]) -> np.ndarray:
    """
    Map normalized actions (≈[-1, 1]) back to original value range.

    Auto-detects normalization mode via the optional 'norm_mode' key in
    action_norm_stats (defaults to 'q99' for backward compatibility):
        - 'q99'     → uses q01 / q99 bounds
        - 'min_max' → uses min / max bounds

    Steps:
        - Clamp values to [-1, 1]
        - Threshold channel index 6 to {0,1} (binary semantic)
        - Apply linear scaling for masked dimensions

    Args:
        normalized_actions: Array shape [T, D] (or chunk length × action_dim).
        action_norm_stats: Dict containing stat arrays and optional 'norm_mode'.

    Returns:
        np.ndarray: Unnormalized actions (same shape as input).
    """
    norm_mode = action_norm_stats.get("norm_mode", "q99")
    if norm_mode == "min_max":
        ref_key_high, ref_key_low = "max", "min"
    else:
        ref_key_high, ref_key_low = "q99", "q01"
    mask = action_norm_stats.get("mask", np.ones_like(action_norm_stats[ref_key_low], dtype=bool))
    action_high = np.array(action_norm_stats[ref_key_high])
    action_low = np.array(action_norm_stats[ref_key_low])
    normalized_actions = np.clip(normalized_actions, -1, 1)
    normalized_actions[:, 6] = np.where(normalized_actions[:, 6] < 0.5, 0, 1)
    actions = np.where(
        mask,
        0.5 * (normalized_actions + 1) * (action_high - action_low) + action_low,
        normalized_actions,
    )

    return actions

config_utils ¶

Shared configuration / utility helpers for framework components: - NamespaceWithGet: lightweight namespace behaving like a dict - OmegaConf conversion helpers - Config merging decorator for model init - Checkpoint config/statistics loading

NamespaceWithGet ¶

Bases: SimpleNamespace

get ¶

get(key, default=None)

Return attribute value if present, else default (dict-like API).

Parameters:

Name	Type	Description	Default
`key`		Attribute name.	required
`default`		Fallback if attribute missing.	`None`

Returns:

Name	Type	Description
`Any`		Stored value or default.

Source code in AlphaBrain/model/framework/config_utils.py

def get(self, key, default=None):
    """
    Return attribute value if present, else default (dict-like API).

    Args:
        key: Attribute name.
        default: Fallback if attribute missing.

    Returns:
        Any: Stored value or default.
    """
    return getattr(self, key, default)

items ¶

items()

Iterate (key, value) pairs like dict.items().

Returns:

Type	Description
	Generator[Tuple[str, Any], None, None]

Source code in AlphaBrain/model/framework/config_utils.py

def items(self):
    """
    Iterate (key, value) pairs like dict.items().

    Returns:
        Generator[Tuple[str, Any], None, None]
    """
    return ((key, getattr(self, key)) for key in self.__dict__)

to_dict ¶

to_dict()

Recursively convert nested NamespaceWithGet objects into plain dicts.

Returns:

Name	Type	Description
`dict`		Fully materialized dictionary structure.

Source code in AlphaBrain/model/framework/config_utils.py

def to_dict(self):
    """
    Recursively convert nested NamespaceWithGet objects into plain dicts.

    Returns:
        dict: Fully materialized dictionary structure.
    """
    return {key: value.to_dict() if isinstance(value, NamespaceWithGet) else value for key, value in self.items()}

dict_to_namespace ¶

dict_to_namespace(d)

Create an OmegaConf config from a plain dictionary.

Parameters:

Name	Type	Description	Default
`d`		Input dictionary.	required

Returns:

Name	Type	Description
`OmegaConf`		DictConfig instance.

Source code in AlphaBrain/model/framework/config_utils.py

def dict_to_namespace(d):
    """
    Create an OmegaConf config from a plain dictionary.

    Args:
        d: Input dictionary.

    Returns:
        OmegaConf: DictConfig instance.
    """
    return OmegaConf.create(d)

merge_param_config ¶

merge_param_config(init)

Decorator for init to unify config handling.

Behavior

Extract 'config' kwarg / arg (path | dict | OmegaConf | namespace)
Convert to OmegaConf
Merge with explicitly passed init parameters (explicit overrides file)
Attach merged config to self.config
Call original init with merged config

Parameters:

Name	Type	Description	Default
`init`		Original init function.	required

Returns:

Type	Description
	Wrapped initializer.

Source code in AlphaBrain/model/framework/config_utils.py

def merge_param_config(init):
    """
    Decorator for __init__ to unify config handling.

    Behavior:
        1. Extract 'config' kwarg / arg (path | dict | OmegaConf | namespace)
        2. Convert to OmegaConf
        3. Merge with explicitly passed init parameters (explicit overrides file)
        4. Attach merged config to self.config
        5. Call original __init__ with merged config

    Args:
        init: Original __init__ function.

    Returns:
        Wrapped initializer.
    """

    @functools.wraps(init)
    def wrapper(self, *args, **kwargs):
        # Map positional args to parameter names (excluding self)
        sig = inspect.signature(init)
        param_names = [name for i, (name, p) in enumerate(sig.parameters.items()) if i > 0]

        init_kwargs = {}
        for name, val in zip(param_names, args):
            init_kwargs[name] = val
        # override with explicit kwargs
        init_kwargs.update(kwargs)

        # get provided config (if any)
        provided_config = init_kwargs.get("config", None)

        loaded_cfg = _to_omegaconf(provided_config)

        # build params cfg from explicit init args (other than config)
        params = {k: v for k, v in init_kwargs.items() if k != "config"}
        params_cfg = OmegaConf.create(params) if params else OmegaConf.create({})

        # merge: loaded_cfg <- params_cfg (params override file)
        merged = OmegaConf.merge(loaded_cfg, params_cfg)

        # set on instance
        try:
            # prefer attaching OmegaConf directly
            self.config = merged
        except Exception:
            # fallback to dict
            self.config = OmegaConf.to_container(merged, resolve=True)

        # prepare kwargs for original init: ensure config is the merged OmegaConf
        call_kwargs = dict(init_kwargs)
        call_kwargs["config"] = merged

        # call original __init__ using keyword args only (safer)
        return init(self, **call_kwargs)

    return wrapper

read_model_config ¶

read_model_config(pretrained_checkpoint)

Load global model configuration and dataset normalization statistics associated with a saved checkpoint (.pt).

Expected directory layout

/checkpoints/.pt /config.json /dataset_statistics.json

Parameters:

Name	Type	Description	Default
`pretrained_checkpoint`		Path to a .pt checkpoint file.	required

Returns:

Name	Type	Description
`tuple`		global_cfg (dict): Loaded config.json contents. norm_stats (dict): Dataset statistics for (de)normalization.

Raises:

Type	Description
`FileNotFoundError`	If checkpoint or required JSON files are missing.
`AssertionError`	If file suffix or structure invalid.

Source code in AlphaBrain/model/framework/config_utils.py

def read_model_config(pretrained_checkpoint):
    """
    Load global model configuration and dataset normalization statistics
    associated with a saved checkpoint (.pt).

    Expected directory layout:
        <run_dir>/checkpoints/<name>.pt
        <run_dir>/config.json
        <run_dir>/dataset_statistics.json

    Args:
        pretrained_checkpoint: Path to a .pt checkpoint file.

    Returns:
        tuple:
            global_cfg (dict): Loaded config.json contents.
            norm_stats (dict): Dataset statistics for (de)normalization.

    Raises:
        FileNotFoundError: If checkpoint or required JSON files are missing.
        AssertionError: If file suffix or structure invalid.
    """
    if os.path.isfile(pretrained_checkpoint):
        logger.info(f"Loading from local checkpoint path `{(checkpoint_pt := Path(pretrained_checkpoint))}`")

        # [Validate] Checkpoint Path should look like
        # `.../<RUN_ID>/checkpoints/<CHECKPOINT_PATH>.pt|.safetensors`
        assert checkpoint_pt.suffix in {".pt", ".safetensors"}
        run_dir = checkpoint_pt.parents[1]

        # Get paths for `config.json`, `dataset_statistics.json` and pretrained checkpoint
        config_json, dataset_statistics_json = run_dir / "config.json", run_dir / "dataset_statistics.json"
        assert config_json.exists(), f"Missing `config.json` for `{run_dir = }`"
        assert dataset_statistics_json.exists(), f"Missing `dataset_statistics.json` for `{run_dir = }`"

        # Otherwise =>> try looking for a match on `model_id_or_path` on the HF Hub (`model_id_or_path`)
        # Load VLA Config (and corresponding base VLM `ModelConfig`) from `config.json`
        with open(config_json, "r") as f:
            global_cfg = json.load(f)

        # Load Dataset Statistics for Action Denormalization
        with open(dataset_statistics_json, "r") as f:
            norm_stats = json.load(f)
    else:
        logger.error(f"❌ Pretrained checkpoint `{pretrained_checkpoint}` does not exist.")
        raise FileNotFoundError(f"Pretrained checkpoint `{pretrained_checkpoint}` does not exist.")
    return global_cfg, norm_stats

read_mode_config ¶

read_mode_config(pretrained_checkpoint)

Same as read_model_config (legacy duplicate kept for backward compatibility).

Parameters:

Name	Type	Description	Default
`pretrained_checkpoint`		Path to a .pt checkpoint file.	required

Returns:

Name	Type	Description
`tuple`		vla_cfg (dict) norm_stats (dict)

Source code in AlphaBrain/model/framework/config_utils.py

def read_mode_config(pretrained_checkpoint):
    """
    Same as read_model_config (legacy duplicate kept for backward compatibility).

    Args:
        pretrained_checkpoint: Path to a .pt checkpoint file.

    Returns:
        tuple:
            vla_cfg (dict)
            norm_stats (dict)
    """
    # lpt0309: 支持目录格式的自包含checkpoint
    if os.path.isdir(pretrained_checkpoint):
        checkpoint_dir = Path(pretrained_checkpoint)
        logger.info(f"[lpt0309] Loading from self-contained checkpoint directory `{checkpoint_dir}`")

        # lpt0309: 从checkpoint目录读取framework_config.yaml
        config_yaml = checkpoint_dir / "framework_config.yaml"
        assert config_yaml.exists(), f"[lpt0309] Missing `framework_config.yaml` in checkpoint dir `{checkpoint_dir}`"

        try:
            ocfg = OmegaConf.load(str(config_yaml))
            global_cfg = OmegaConf.to_container(ocfg, resolve=True)
        except Exception as e:
            logger.error(f"❌ Failed to load YAML config `{config_yaml}`: {e}")
            raise

        # lpt0309: 从checkpoint目录读取dataset_statistics.json
        dataset_statistics_json = checkpoint_dir / "dataset_statistics.json"
        norm_stats = {}
        if dataset_statistics_json.exists():
            with open(dataset_statistics_json, "r") as f:
                norm_stats = json.load(f)
        else:
            logger.warning(f"[lpt0309] No dataset_statistics.json found in {checkpoint_dir}, norm_stats will be empty")

        return global_cfg, norm_stats

    # origin0309: 原始文件格式加载
    elif os.path.isfile(pretrained_checkpoint):
        logger.info(f"Loading from local checkpoint path `{(checkpoint_pt := Path(pretrained_checkpoint))}`")

        # [Validate] Checkpoint Path should look like
        # `.../<RUN_ID>/checkpoints/<CHECKPOINT_PATH>.pt|.safetensors`
        assert checkpoint_pt.suffix in {".pt", ".safetensors"}
        run_dir = checkpoint_pt.parents[1]

        # Get paths for `config.json`, `dataset_statistics.json` and pretrained checkpoint
        config_yaml, dataset_statistics_json = run_dir / "config.yaml", run_dir / "dataset_statistics.json"
        assert config_yaml.exists(), f"Missing `config.yaml` for `{run_dir = }`"
        assert dataset_statistics_json.exists(), f"Missing `dataset_statistics.json` for `{run_dir = }`"

        # Otherwise =>> try looking for a match on `model_id_or_path` on the HF Hub (`model_id_or_path`)
        # Load VLA Config (and corresponding base VLM `ModelConfig`) from `config.json`
        try:
            ocfg = OmegaConf.load(str(config_yaml))
            global_cfg = OmegaConf.to_container(ocfg, resolve=True)
        except Exception as e:
            logger.error(f"❌ Failed to load YAML config `{config_yaml}`: {e}")
            raise

        # Load Dataset Statistics for Action Denormalization
        with open(dataset_statistics_json, "r") as f:
            norm_stats = json.load(f)
    else:
        logger.error(f"❌ Pretrained checkpoint `{pretrained_checkpoint}` does not exist.")
        raise FileNotFoundError(f"Pretrained checkpoint `{pretrained_checkpoint}` does not exist.")
    return global_cfg, norm_stats

ToyVLA¶

ToyModel ¶

ToyVLA — 极简 VLA 调试模型¶

设计目标: - 无 VLM 依赖, 无需 Qwen / LLM，秒级加载 - 接口与 QwenOFT 完全一致 (forward / predict_action 接受同样的 examples List[dict]) - 能在几百步内 overfit 小样本 → 验证训练管线是否正确

验证方法

把 N 个固定样本喂进去，train 几百步
如果 action_loss 接近 0、eval MSE 接近 0 → 管线正确
否则说明 data → forward → loss → backward 链路有 bug

Interface (与 QwenOFT 相同): examples: List[dict] - "image" : List[PIL.Image] (multi-view, 各尺寸均可) - "lang" : str - "action" : np.ndarray shape (T, action_dim)

forward(examples) → {"action_loss": scalar_tensor} predict_action(examples) → {"normalized_actions": np.ndarray (B, chunk_len, action_dim)}