使用Google Speech API,您可以将语音转换为基于文本文件或实时流
从网络浏览器传输麦克风音频时,如何从 Google 语音到文本 API 获得更好的转录准确性?
我正在尝试制作一个可以进行实时语音到文本转录的 Vue 组件。录制的音频应限制在 5 秒左右。 我发现这个实现使用了音频工作...
我正在使用最新版本的Python(3.9)的语音识别。由于某种原因,pip 不允许(仍然不允许)我安装 pyaudio。 错误消息示例: _portaudio模块....
GoogleCloud Speech2Text“long_running_recognize”响应对象不可迭代
从 Google 云服务运行语音转文本 api 请求时(超过 60 秒的音频,因此我需要使用 long_running_recognize 函数,以及从云存储桶检索音频)...
如何通过 HTTP/REST 访问 Google Cloud Speech-to-text v2 API
即使我事先确保使用服务帐户进行身份验证,但在尝试调用 Google 语音转文本 v2 API 时收到权限错误。 API调用响应: { “错误”...
我正在尝试在 Expo 上录制音频并使用 Google 的语音转文本服务获取其转录。 它已经可以在 iOS 上运行,但还不能在 Android 上运行。我觉得是录音的问题
Google Cloud 文本转语音 API:在浏览器上播放时突出显示文本
问题是在浏览器上而不是Android上(因为标签似乎建议Android文本到语音)。 我正在使用 Google Cloud Text-to-Speech API (https://cloud.google.com/text-to-speech/) 进行转换
我很难理解与块生成器和转录过程相关的Python脚本摘录的动态。 这是完整的代码:https://cloud.google.com/speech-to-text/docs/
我开始使用谷歌语音API来转录音频。 正在转录的音频包含许多依次说出的数字。 例如。 273298 但转录结果是 270-3298 我的咕...
我正在使用流音频和 wav 文件测试 google Speech-to-Text API。 我正在使用电话音频:8000 采样率、8 位、mulaw 编码。 Google 配置已设置
我似乎在文档中找不到如何使用谷歌语音V2 API的任何地方。由于某种原因,V2 似乎比 V1 便宜(根据谷歌的语音定价表 - 虽然我不知道......
无法在 ESP32 上与 google 云语音转文本执行握手。 [PK - 公钥标签或值无效(仅支持 RSA 和 EC)]
我正在尝试与speech.googleapis.com建立连接。我正在使用 https://github.com/MhageGH/esp32_CloudSpeech/tree/master/esp32_CloudSpeech 中的代码。我修改了network_param.h...
我正在为我的项目使用 google-cloud-speech api 。我正在使用 Pipenv 作为虚拟环境,我安装了 google-cloud-speech api pipelinev 安装 google-cloud-speech 和 Pipenv 更新好...
我正在查看 Speech-to-Text API,但有一些问题: v1 和 v1p1 有什么区别? Speech-to-Text v2 中的 chirp 模型是否支持从 stre 转录音频...
错误:7 PERMISSION_DENIED:您的应用程序已使用 Google Cloud SDK 中的最终用户凭据进行身份验证
几个月前,这在我的 websocket 服务器内部没有代码更改的情况下工作,但是今天使用它,似乎 Google 语音到文本 api 不再允许使用 acc 进行身份验证...
我在 Node js 中使用 Google 的 Speech-to-Text API。它返回前几个单词的识别结果,但随后忽略音频文件的其余部分。截止点是任何
我正在尝试使用流音频输入谷歌的语音到文本。 我有一个简单的 JS 代码,该代码在按下按钮时记录音频并使用 websockets 将音频发送到 fastapi 后端。在 fastapi 中...
Google Speech-To-Text 会忽略自定义短语/单词
我正在使用 python3 通过提供的 python 包(google-speech)使用 Google 语音到文本转录音频文件。 有一个选项可以定义自定义短语,该短语应用于
如何使用 Node.js 通过 Google Cloud Speech-to-Text API 实现语音识别?
我是 Google Cloud 新手, 我最近创建了一个带有 Speech-to-Text API 的项目。 创建项目并将其链接到计费帐户后,我访问了 Node.js 控制台教程以快速了解
INVALID_ARGUMENT:请求负载大小超出限制:10485760 字节
我第一次在项目中使用 GCS Speech API 将一系列音频文件转换为文本。每个文件大约有60分钟,并且是一个人在整个过程中不断地说话......
我正在尝试使用 dotnet Google.Cloud.Speech.V2 库运行“chirp”模型的转录。我需要使用 chirp,因为我需要用波兰语标点符号进行转录,而 chirp 是...