Pixtral

class grid.model.perception.vlm.pixtral.Pixtral(*args, **kwargs)

Pixtral: Visual Description Model

This class implements a wrapper for the Pixtral model, which generates image captions based on input images.

__init__()

run(image_url, prompt)

Given an image URL and a prompt, generate a description of the image.

Parameters:

Returns:

response to the prompt

Return type:

str

Example

>>> pixtral = Pixtral()
>>> outputs = pixtral.run("https://picsum.photos/id/237/200/300", "Describe this image")