vllm.renderers ¶

Modules:

Name	Description
`deepseek_v32`
`grok2`
`hf`
`mistral`
`protocol`
`registry`
`terratorch`

all `module-attribute` ¶

__all__ = [
    "RendererLike",
    "RendererRegistry",
    "renderer_from_config",
]

RendererLike ¶

Bases: Protocol

Source code in vllm/renderers/protocol.py

class RendererLike(Protocol):
    @classmethod
    def from_config(
        cls,
        config: "ModelConfig",
        tokenizer_kwargs: dict[str, Any],
    ) -> "RendererLike":
        raise NotImplementedError

    @property
    def tokenizer(self) -> TokenizerLike | None:
        raise NotImplementedError

    def get_tokenizer(self) -> TokenizerLike:
        tokenizer = self.tokenizer
        if tokenizer is None:
            raise ValueError("Tokenizer not available when `skip_tokenizer_init=True`")

        return tokenizer

    def render_messages(
        self,
        messages: list["ChatCompletionMessageParam"],
        **kwargs,
    ) -> tuple[list["ConversationMessage"], TextPrompt | TokensPrompt]:
        raise NotImplementedError

    async def render_messages_async(
        self,
        messages: list["ChatCompletionMessageParam"],
        **kwargs,
    ) -> tuple[list["ConversationMessage"], TextPrompt | TokensPrompt]:
        return self.render_messages(messages, **kwargs)

tokenizer `property` ¶

tokenizer: TokenizerLike | None

from_config `classmethod` ¶

from_config(
    config: ModelConfig, tokenizer_kwargs: dict[str, Any]
) -> RendererLike

Source code in vllm/renderers/protocol.py

@classmethod
def from_config(
    cls,
    config: "ModelConfig",
    tokenizer_kwargs: dict[str, Any],
) -> "RendererLike":
    raise NotImplementedError

get_tokenizer ¶

get_tokenizer() -> TokenizerLike

Source code in vllm/renderers/protocol.py

def get_tokenizer(self) -> TokenizerLike:
    tokenizer = self.tokenizer
    if tokenizer is None:
        raise ValueError("Tokenizer not available when `skip_tokenizer_init=True`")

    return tokenizer

render_messages ¶

render_messages(
    messages: list[ChatCompletionMessageParam], **kwargs
) -> tuple[
    list[ConversationMessage], TextPrompt | TokensPrompt
]

Source code in vllm/renderers/protocol.py

def render_messages(
    self,
    messages: list["ChatCompletionMessageParam"],
    **kwargs,
) -> tuple[list["ConversationMessage"], TextPrompt | TokensPrompt]:
    raise NotImplementedError

render_messages_async `async` ¶

render_messages_async(
    messages: list[ChatCompletionMessageParam], **kwargs
) -> tuple[
    list[ConversationMessage], TextPrompt | TokensPrompt
]

Source code in vllm/renderers/protocol.py

async def render_messages_async(
    self,
    messages: list["ChatCompletionMessageParam"],
    **kwargs,
) -> tuple[list["ConversationMessage"], TextPrompt | TokensPrompt]:
    return self.render_messages(messages, **kwargs)

RendererRegistry `dataclass` ¶

Source code in vllm/renderers/registry.py

@dataclass
class RendererRegistry:
    # Renderer mode ->  (renderer module, renderer class)
    renderers: dict[str, tuple[str, str]] = field(default_factory=dict)

    def register(self, renderer_mode: str, module: str, class_name: str) -> None:
        if renderer_mode in self.renderers:
            logger.warning(
                "%s.%s is already registered for renderer_mode=%r. "
                "It is overwritten by the new one.",
                module,
                class_name,
                renderer_mode,
            )

        self.renderers[renderer_mode] = (module, class_name)

        return None

    def load_renderer_cls(self, renderer_mode: str) -> type[RendererLike]:
        if renderer_mode not in self.renderers:
            raise ValueError(f"No renderer registered for {renderer_mode=!r}.")

        module, class_name = self.renderers[renderer_mode]
        logger.debug_once(f"Loading {class_name} for {renderer_mode=!r}")

        return resolve_obj_by_qualname(f"{module}.{class_name}")

    def load_renderer(
        self,
        renderer_mode: str,
        config: "ModelConfig",
        tokenizer_kwargs: dict[str, Any],
    ) -> RendererLike:
        renderer_cls = self.load_renderer_cls(renderer_mode)
        return renderer_cls.from_config(config, tokenizer_kwargs)

renderers `class-attribute` `instance-attribute` ¶

renderers: dict[str, tuple[str, str]] = field(
    default_factory=dict
)

init ¶

__init__(
    renderers: dict[str, tuple[str, str]] = dict(),
) -> None

load_renderer ¶

load_renderer(
    renderer_mode: str,
    config: ModelConfig,
    tokenizer_kwargs: dict[str, Any],
) -> RendererLike

Source code in vllm/renderers/registry.py

def load_renderer(
    self,
    renderer_mode: str,
    config: "ModelConfig",
    tokenizer_kwargs: dict[str, Any],
) -> RendererLike:
    renderer_cls = self.load_renderer_cls(renderer_mode)
    return renderer_cls.from_config(config, tokenizer_kwargs)

load_renderer_cls ¶

load_renderer_cls(renderer_mode: str) -> type[RendererLike]

Source code in vllm/renderers/registry.py

def load_renderer_cls(self, renderer_mode: str) -> type[RendererLike]:
    if renderer_mode not in self.renderers:
        raise ValueError(f"No renderer registered for {renderer_mode=!r}.")

    module, class_name = self.renderers[renderer_mode]
    logger.debug_once(f"Loading {class_name} for {renderer_mode=!r}")

    return resolve_obj_by_qualname(f"{module}.{class_name}")

register ¶

register(
    renderer_mode: str, module: str, class_name: str
) -> None

Source code in vllm/renderers/registry.py

def register(self, renderer_mode: str, module: str, class_name: str) -> None:
    if renderer_mode in self.renderers:
        logger.warning(
            "%s.%s is already registered for renderer_mode=%r. "
            "It is overwritten by the new one.",
            module,
            class_name,
            renderer_mode,
        )

    self.renderers[renderer_mode] = (module, class_name)

    return None

renderer_from_config ¶

renderer_from_config(config: ModelConfig, **kwargs)

Source code in vllm/renderers/registry.py

def renderer_from_config(config: "ModelConfig", **kwargs):
    tokenizer_mode, tokenizer_name, args, kwargs = tokenizer_args_from_config(
        config, **kwargs
    )

    if config.tokenizer_mode == "auto" and config.model_impl == "terratorch":
        renderer_mode = "terratorch"
    else:
        renderer_mode = tokenizer_mode

    return RENDERER_REGISTRY.load_renderer(
        renderer_mode,
        config,
        tokenizer_kwargs={**kwargs, "tokenizer_name": tokenizer_name},
    )

vllm.renderers ¶

__all__ module-attribute ¶

RendererLike ¶

tokenizer property ¶

from_config classmethod ¶

get_tokenizer ¶

render_messages ¶

render_messages_async async ¶

RendererRegistry dataclass ¶

renderers class-attribute instance-attribute ¶

__init__ ¶

load_renderer ¶

load_renderer_cls ¶

register ¶

renderer_from_config ¶

all `module-attribute` ¶

tokenizer `property` ¶

from_config `classmethod` ¶

render_messages_async `async` ¶

RendererRegistry `dataclass` ¶

renderers `class-attribute` `instance-attribute` ¶

init ¶