Python 多语言语音识别

问题描述 投票:0回答:1

我有一个Python语音识别项目。所以,我需要它来识别 5 种语言。

我的代码:

import speech_recognition as sr
r = sr.Recognizer() 
with sr.Microphone() as source:
    audio = r.listen(source)
    print(r.recognize_google(audio, language="ru-RU en-US de-DE fr-FR es-ES"))

它仅识别英语和俄语语音。请帮忙。

python speech-recognition
1个回答
0
投票

这里的问题是,您在

recognize_google()
调用中调用的 Google 语音识别 API 适用于 单语言 模型。也就是说,它只会重音您传递给它的“first”语言代码。它期望音频采用单一语言。 您所描述的五种不同语言的语音称为“代码切换”,并且需要专门为代码切换构建语音识别模型。 AFAIK,目前没有一家云语音识别提供商提供代码切换模型,如果他们提供,五种不同的语言将......不太可能。

您可以拆分音频以便一次发送一种语言吗?

© www.soinside.com 2019 - 2024. All rights reserved.