根据官方文档,分析225x224的图像,获得的token不超过800个。但实际上大约有 8000 个代币出来了。
型号:GPT-4o-mini-2024-07-18 代码:
base64_image = encode_image(image_path)
response = self.client.chat.completions.create(
model=self.model,
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": prompt,
},
{
"type": "image_url",
"image_url": {
"url": f"data:image/jpeg;base64,{base64_image}"
},
},
],
}
],
stream=True
)
我想我可能错误地加载了图像,但我从文档中获取了示例
在您指定的模型的官方文档中,有一个计算器,您可以在其中输入图像的大小。显示它将使用 8500 个代币。
这是官方定价页面:https://openai.com/api/pricing/
由于图片尺寸小于512x512“平铺”尺寸,因此按512x512图片收费。 他们计算了 2833 个基本代币 + 每个图块 5667 个代币(本例中为 1 个)= 8500 个代币。