假设我是一家 TAXI 公司,我不是,但它很能说明问题。 我是一家超级先进的 TAXI 公司,使用新的 OPEN AI Whisper SPEECH->TEXT 解码或类似的 AI 服务,例如 deepgram.com。 现在地址有点像噩梦,因为这个词不是合乎逻辑的“下一个标记是什么”,过去我使用过 Google API:
/maps/api/place/textsearch/
/maps/api/place/findplacefromtext/
使用 KEYBOARD 条目效果非常好......现在我发现 SPEECH->TEXT 非常非常准确,但是地址可能在语音上不准确。
例如,一个真实的例子,这是来自同一地址的语音编码的 2 x 结果。 (我会省略门牌号,但它已正确编码)。
xx Tehran Avenue, Whitwick, Coalville.
xx Perren Avenue, Whitwick, Coalville.
真实地址是:Perran Avenue, Whitwick, Coalville 但是你可以看到,Tehran 甚至 Perren 很容易成为可能,因为它们是与 “我能从 得到一辆 TAXI 吗”没有真正关联的词。在这种情况下,德黑兰是一个让谷歌特别困惑的真实城市。
我花了一些时间试图找到一个在线 API 服务(付费或不付费),它可以解码可能正确但语音错误的地址。具有合理的世界覆盖范围......欧洲,美国作为最低基线.
我原以为谷歌会:
/maps/api/place/ai-speech-search/
我找不到它。 一如既往,我试过让 CHAT_GPT 找到它,但它没有任何线索,所以我必须把它扔到 StackOverflow 上,以揭示我的愚蠢或挖掘隐藏的宝石。
总结: 我需要一个我可以轻松插入的文本 -> 地址转换器,任何为此目的而设计的 API 都可以。我不是安装这个转换器 + 那个 + 我没有说的那个不是一个很好的解决方案而且如果它不是很糟糕我愿意接受它但主要是如果它可以封装到一个 CURL 命令中它会是太棒了!
我知道有人在做这个,我就是找不到他们!