ChatGPT Vision - 计算代币

问题描述 投票:0回答:1

根据官方文档,分析225x224的图像,获得的token不超过800个。但实际上大约有 8000 个代币出来了。

型号:GPT-4o-mini-2024-07-18 代码:

base64_image = encode_image(image_path)
response = self.client.chat.completions.create(
    model=self.model,
    messages=[
        {
        "role": "user",
        "content": [
            {
            "type": "text",
            "text": prompt,
            },
            {
            "type": "image_url",
            "image_url": {
                "url":  f"data:image/jpeg;base64,{base64_image}"
            },
            },
        ],
        }
    ],
    stream=True
    )

我想我可能错误地加载了图像,但我从文档中获取了示例

python openai-api chatgpt-api
1个回答
0
投票

在您指定的模型的官方文档中,有一个计算器,您可以在其中输入图像的大小。显示它将使用 8500 个代币。

这是官方定价页面:https://openai.com/api/pricing/

由于图片尺寸小于512x512“平铺”尺寸,因此按512x512图片收费。 他们计算了 2833 个基本代币 + 每个图块 5667 个代币(本例中为 1 个)= 8500 个代币。

© www.soinside.com 2019 - 2024. All rights reserved.