所以概要是,基本上我一直在从事一个夏季项目,是一个可以在桌面上运行的机器人,它使用一些 API 资源(OpenAI、Elevenlabs、Azure STT 和开源情感)检测模型)。该项目的目标是能够键入或说出提示并使其做出相应响应,但您可以插入不同的参数(例如角色/个性数据和语音模型)来个性化交互。该应用程序在发出 API 请求时还会利用短期和长期记忆,以便对话和知识不会丢失,除非明确删除。该应用程序还有一个头像,可以根据响应中检测到最多的情绪来改变表情。
现在,话虽如此,当然,同时使用 OpenAI 和 Elevenlabs API 调用确实是有成本的,我在即用即付的基础上使用这两种 API,但需要注意的是,随着我变得更加复杂,字符数据,并且随着短期和长期记忆的积累,每个 OpenAI API 调用中用于上下文的令牌数量变得过于昂贵而难以维护。理论上,如果积累足够多,即使进行一次对话也可能变得过于昂贵,每个查询高达 15 美分以上。考虑到所有这些背景,我正在寻找解决这个问题的方法,因为我只是一个勉强度日的大学生。如果我可以不再使用 OpenAI,我非常乐意使用开源替代方案(谁知道呢,也许在本地保存这样的模型而不是通过 API 会更好)。我不知道我的游戏笔记本电脑将如何处理创建我自己的模型,因此我们非常感谢任何有关此事的帮助。
要浏览源代码,请查看存储库(自述文件仍在进行中):https://github.com/L4w1i3t/Alter-Ego-AI?tab=readme-ov-file
在撰写本文时进行编辑:我现在也在寻找连续语音识别的开源替代方案,因为我的 Azure 免费期刚刚结束。谈论方便。
请记住,我是 Stack Overflow 的新手,没有 AI 方面的专业知识,但如果我的数学是正确的,Cohere 将是比 OpenAI 更便宜、可能更快的选择。如果您要获得最便宜的 Cohere 月度计划,我相信每个请求大约 1.4 美分(包括输出),并且取决于您认为单个对话的费用,如果每个对话总共 10 个请求,那么Cohere 会更便宜。 Cohere 每次对话 14 美分,而 OpenAI 每次对话 15 美分。您能告诉我有多少请求会被视为一次普通对话,以及我是否误解了您的意思吗?