我有一个Python语音识别项目。所以,我需要它来识别 5 种语言。
我的代码:
import speech_recognition as sr
r = sr.Recognizer()
with sr.Microphone() as source:
audio = r.listen(source)
print(r.recognize_google(audio, language="ru-RU en-US de-DE fr-FR es-ES"))
它仅识别英语和俄语语音。请帮忙。
这里的问题是,您在
recognize_google()
调用中调用的 Google 语音识别 API 适用于 单语言 模型。也就是说,它只会重音您传递给它的“first”语言代码。它期望音频采用单一语言。
您所描述的五种不同语言的语音称为“代码切换”,并且需要专门为代码切换构建语音识别模型。 AFAIK,目前没有一家云语音识别提供商提供代码切换模型,如果他们提供,五种不同的语言将......不太可能。
您可以拆分音频以便一次发送一种语言吗?