google-speech-api 相关问题

使用Google Speech API,您可以将语音转换为基于文本文件或实时流

从网络浏览器传输麦克风音频时,如何从 Google 语音到文本 API 获得更好的转录准确性?

我正在尝试制作一个可以进行实时语音到文本转录的 Vue 组件。录制的音频应限制在 5 秒左右。 我发现这个实现使用了音频工作...

回答 1 投票 0

如何正确安装最新版本Python的PyAudio?

我正在使用最新版本的Python(3.9)的语音识别。由于某种原因,pip 不允许(仍然不允许)我安装 pyaudio。 错误消息示例: _portaudio模块....

回答 2 投票 0

GoogleCloud Speech2Text“long_running_recognize”响应对象不可迭代

从 Google 云服务运行语音转文本 api 请求时(超过 60 秒的音频,因此我需要使用 long_running_recognize 函数,以及从云存储桶检索音频)...

回答 1 投票 0

如何通过 HTTP/REST 访问 Google Cloud Speech-to-text v2 API

即使我事先确保使用服务帐户进行身份验证,但在尝试调用 Google 语音转文本 v2 API 时收到权限错误。 API调用响应: { “错误”...

回答 1 投票 0

使用 Expo + google 语音转文字进行音频转录

我正在尝试在 Expo 上录制音频并使用 Google 的语音转文本服务获取其转录。 它已经可以在 iOS 上运行,但还不能在 Android 上运行。我觉得是录音的问题

回答 2 投票 0

Google Cloud 文本转语音 API:在浏览器上播放时突出显示文本

问题是在浏览器上而不是Android上(因为标签似乎建议Android文本到语音)。 我正在使用 Google Cloud Text-to-Speech API (https://cloud.google.com/text-to-speech/) 进行转换

回答 1 投票 0

在流识别Python代码中使用生成器

我很难理解与块生成器和转录过程相关的Python脚本摘录的动态。 这是完整的代码:https://cloud.google.com/speech-to-text/docs/

回答 1 投票 0

Google-speech-api 错误转录语音数字

我开始使用谷歌语音API来转录音频。 正在转录的音频包含许多依次说出的数字。 例如。 273298 但转录结果是 270-3298 我的咕...

回答 5 投票 0

谷歌语音转文本无法在非常短的音频(单个单词)下正常工作

我正在使用流音频和 wav 文件测试 google Speech-to-Text API。 我正在使用电话音频:8000 采样率、8 位、mulaw 编码。 Google 配置已设置

回答 2 投票 0

Google Speech V2 从麦克风实时流式传输

我似乎在文档中找不到如何使用谷歌语音V2 API的任何地方。由于某种原因,V2 似乎比 V1 便宜(根据谷歌的语音定价表 - 虽然我不知道......

回答 1 投票 0

无法在 ESP32 上与 google 云语音转文本执行握手。 [PK - 公钥标签或值无效(仅支持 RSA 和 EC)]

我正在尝试与speech.googleapis.com建立连接。我正在使用 https://github.com/MhageGH/esp32_CloudSpeech/tree/master/esp32_CloudSpeech 中的代码。我修改了network_param.h...

回答 1 投票 0

谷歌云语音导入错误:无法导入名称“枚举”

我正在为我的项目使用 google-cloud-speech api 。我正在使用 Pipenv 作为虚拟环境,我安装了 google-cloud-speech api pipelinev 安装 google-cloud-speech 和 Pipenv 更新好...

回答 4 投票 0

语音转文本 API 文档问题

我正在查看 Speech-to-Text API,但有一些问题: v1 和 v1p1 有什么区别? Speech-to-Text v2 中的 chirp 模型是否支持从 stre 转录音频...

回答 1 投票 0

错误:7 PERMISSION_DENIED:您的应用程序已使用 Google Cloud SDK 中的最终用户凭据进行身份验证

几个月前,这在我的 websocket 服务器内部没有代码更改的情况下工作,但是今天使用它,似乎 Google 语音到文本 api 不再允许使用 acc 进行身份验证...

回答 2 投票 0

Google 语音转文本(语音识别)仅识别音频的前几秒

我在 Node js 中使用 Google 的 Speech-to-Text API。它返回前几个单词的识别结果,但随后忽略音频文件的其余部分。截止点是任何

回答 2 投票 0

400 音频超时错误:长时间没有音频。音频应接近实时发送

我正在尝试使用流音频输入谷歌的语音到文本。 我有一个简单的 JS 代码,该代码在按下按钮时记录音频并使用 websockets 将音频发送到 fastapi 后端。在 fastapi 中...

回答 1 投票 0

Google Speech-To-Text 会忽略自定义短语/单词

我正在使用 python3 通过提供的 python 包(google-speech)使用 Google 语音到文本转录音频文件。 有一个选项可以定义自定义短语,该短语应用于

回答 2 投票 0

如何使用 Node.js 通过 Google Cloud Speech-to-Text API 实现语音识别?

我是 Google Cloud 新手, 我最近创建了一个带有 Speech-to-Text API 的项目。 创建项目并将其链接到计费帐户后,我访问了 Node.js 控制台教程以快速了解

回答 1 投票 0

INVALID_ARGUMENT:请求负载大小超出限制:10485760 字节

我第一次在项目中使用 GCS Speech API 将一系列音频文件转换为文本。每个文件大约有60分钟,并且是一个人在整个过程中不断地说话......

回答 2 投票 0

c# 中的语音到文本 chirp 模型问题

我正在尝试使用 dotnet Google.Cloud.Speech.V2 库运行“chirp”模型的转录。我需要使用 chirp,因为我需要用波兰语标点符号进行转录,而 chirp 是...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.