speech-recognition 相关问题

语音识别（SR）是计算语言学的跨学科子领域，它将语言学，计算机科学和电气工程领域的知识和研究结合起来，开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备，如分类为智能技术和机器人技术的设备

在src/pyaudio/device_api.c中包含的文件：1：在src/pyaudio/device_api.h中包含的文件中：7： /library/frameworks/python.framework/versions/3.13/include/python3.13/python.h:19:19:10 :.....

python-3.x speech-recognition

回答 1 投票 0

google语音识别api

https://www.google.com/speech-api/v2/recognize?...

google-api speech-recognition speech

回答 5 投票 0

我使用javascript和node.js。我试图在我的应用程序中添加语音识别，尽管不在浏览器中。我知道那里有很多使用浏览器的语音识别API的东西，但是我通常使用Mac在终端运行脚本。例如，我要实现的目标是如下：我会说些什么，如果这与if语句相对应，那么脚本将按照要求执行任何任务。因此，如果我说“你好”，它将完成所说的任何任务。有什么像这样吗？

有很多节点模块，这些模块只需包装浏览器的语音识别，如果您不在浏览器中，则没有帮助。还有几个模块是外部服务的接口，如果您向您发送音频，可以为您提供语音识别。

javascript speech-recognition speech

回答 1 投票 0

如何从音频文件（在C ++或Java中）拆分男性和女性声音。

audio speech-recognition speech

回答 3 投票 0

使用Python自动开放Google或YouTube中的搜索结果链接

但如何打开这些搜索结果的链接？

python speech-recognition

回答 2 投票 0

android webkitspeechRevention .fimpinal变量未显示正确的值

javascript android speech-recognition speech-to-text webkitspeechrecognition

回答 1 投票 0

网络语音API在Firefox / Gecko上的识别的当前状态是什么？

firefox browser cross-browser speech-recognition speech-to-text

回答 1 投票 0

我正在研究实时语音到文本应用程序，其中通过Web Audio API处理麦克风输入，然后将其发送到Azure Speech SDK。主要问题是，一些音频内容被跳过或未被认可，我怀疑这是由于噪声问题引起的。问题尤其是在以下情况下发生：

为了解决此问题，我使用Web Audio API实现了音频预处理：

azure audio speech-recognition web-audio-api azure-speech

回答 1 投票 0

我构建了一个使用Azure语音服务来命令命令的颤抖应用程序。当我说“打开”时，麦克风应该开始聆听（通过变红表示），但它无法正常工作。这是我的完整实施：

flutter azure speech-recognition riverpod state-management

回答 1 投票 0

用语音API

在OSX Mavericks中，现在包括语音说法，非常有用。我正在尝试使用命令能力来创建自己的数字生活助手，但找不到如何使用识别...

macos speech-recognition dictation

回答 1 投票 0

android的extrageRognizer用extra_audio_source仍在听麦克风而不是从文件

private var recorder: MediaRecorder? = null private var recognizer: SpeechRecognizer? = null private val mediaFormat = MediaRecorder.OutputFormat.MPEG_4 private val audioEncoding = MediaRecorder.AudioEncoder.DEFAULT private var currentRecordingFile: String = "recording_0.3gp" private var recordingParcel: ParcelFileDescriptor? = null // [ {"text": "speech to text result", "file": "path to clip recording"}, "time": "datetime" ] private var translations = mutableStateListOf<Map<String, String>>() private fun startTalking () { startRecording() } private fun stopTalking () { stopRecording() startRecognizing() } private fun startRecording () { val num = translations.count() currentRecordingFile = "$externalCacheDir/recording_$num.3gp" recorder = MediaRecorder(this).apply { setAudioSource(MediaRecorder.AudioSource.MIC) setOutputFormat(mediaFormat) setAudioEncoder(audioEncoding) setAudioChannels(1) setAudioSamplingRate(16000) setAudioEncodingBitRate(64000) setOutputFile(currentRecordingFile) try { prepare() } catch (e: IOException) { Log.e("startRecording", e.toString()) } start() } } private fun stopRecording () { recorder?.apply { stop() release() } recorder = null } private fun startRecognizing () { val file = File(currentRecordingFile) recordingParcel = ParcelFileDescriptor.open(file, ParcelFileDescriptor.MODE_READ_ONLY) val intent = Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH) intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE, "in-ID") intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_PREFERENCE, "in-ID") intent.putExtra(RecognizerIntent.EXTRA_AUDIO_SOURCE, recordingParcel) intent.putExtra(RecognizerIntent.EXTRA_AUDIO_SOURCE_ENCODING, audioEncoding) intent.putExtra(RecognizerIntent.EXTRA_AUDIO_SOURCE_CHANNEL_COUNT, 1) intent.putExtra(RecognizerIntent.EXTRA_AUDIO_SOURCE_SAMPLING_RATE, 16000) try { recognizer = SpeechRecognizer.createSpeechRecognizer(this) recognizer?.setRecognitionListener(this) recognizer?.startListening(intent) } catch (e: Exception) { Log.e("SpeechRecognizer", e.message.toString()) } } private fun stopRecognizing () { recordingParcel?.close() recognizer?.stopListening() recognizer?.destroy() recognizer = null } override fun onError(error: Int) { Log.e("Speech onError", error.toString()) stopRecognizing() } override fun onResults(results: Bundle){ val words: ArrayList<String>? = results.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION) if (words != null) { val sentence = words.joinToString(separator = " ") val translation = mapOf("text" to sentence, "file" to currentRecordingFile) translations.add(translation) Log.e("CURR RESULT", sentence) } stopRecognizing() }

android kotlin speech-recognition audio-recording

回答 0 投票 0

Web语音识别的移动设备的解决方法不支持连续聆听

const recognition = new SpeechRecognition(); recognition.continuous = true; recognition.lang = 'en-US'; recognition.onresult = (event) => {...} recognition.start();

javascript speech-recognition speech-to-text google-speech-api

回答 0 投票 0

我如何将文本从语音直接发送到另一个端点或来自我的语音资源的Azure函数？我正在使用Azure语音服务资源使用Microsoft-CognitiveServices-Speech-SDK从我的MIC转录实时音频。我想将抄录的文本发送到另一个端点（或AZ ...

任何帮助都会受到赞赏。

azure speech-recognition speech-to-text azure-speech microsoft-speech-api

回答 1 投票 0

激动发音评估无法应对语音上下文错误

javascript azure speech-recognition speech-to-text azure-speech

回答 1 投票 0

Azure 语音服务连续语音识别

我对 Azure 语音服务还很陌生，我正在使用 twilo/plivo 服务将号码与 azure stt 连接起来，并在转录后进一步处理它。我的问题是当我说话时，它是

azure speech-recognition azure-sdk-python azure-speech