我正在开发一个项目,使用 Google Colab 运行与 Gemini API(Google Cloud AI 工具的一部分)交互的 Python 代码。目标是使用 Gemini 的 AI 自动将通话记录分类为预定义类别。
这是我正在做的事情的简要概述:我读取了通话记录的 Excel 文件,将这些记录发送给 Gemini 进行分类,然后根据 AI 识别的类别更新 Excel 文件(用 0 和 1 进行标记) ).
下面是我设置 API 并向 Gemini 发送请求的代码片段:
import google.generativeai as genai
GOOGLE_API_KEY = "your_api_key_here"
genai.configure(api_key=GOOGLE_API_KEY)
model = genai.GenerativeModel('gemini-pro')
def send_to_gemini(transcript):
prompt = f"Categorize the following transcript: {transcript}"
try:
response = model.generate_content(prompt)
return response.text
except Exception as e:
print(f"Failed to send request to Gemini: {e}")
但是,我不断收到
ERROR:tornado.access:503
提示服务器端问题:
ERROR:tornado.access:503 POST /v1beta/models/gemini-pro:generateContent (127.0.0.1) 4039.47ms
任何建议或见解将不胜感激。
错误 503 对应于“服务不可用”。
如果您阅读响应中的完整错误消息,您可能会收到“模型已过载。请稍后再试。”
这绝对是 Google 端发生的事情,而不是你的。你对此无能为力。但是,您当然应该考虑到这一点。通过渐进式退避在循环中重试尝试是处理服务器不可用消息的标准方法。
您表明您正在使用“google.generativeai”软件包,该软件包与 AI Studio 产品 (aistudio.google.com) 相对应,而不是 Google Cloud。目前,这只是一项免费服务,尚未普遍提供。因此,他们似乎仍在调整内容以满足预期的用户需求,并在为生产和付费层做好准备时进行扩展。