audio-processing 相关问题

音频处理涉及数学和信号处理技术的研究,以理解或改变音频信号的性质。研究中的不同类型的音频信号包括语音,音乐,环境音频和计算机音频。通过应用各种滤波器在时域或频谱域中分析音频。

通过Python(PyAudio、Sounddevice)写入虚拟音频线

我正在尝试使用 python 将数据写入虚拟音频电缆。到目前为止,我并不真正关心我使用哪个模块,所以我尝试了 PyAudio 和 Sounddevive。我从 VB-Audio 安装了虚拟电缆。它...

回答 1 投票 0

未检测到麦克风,因为 sound.query_devices() 返回空列表?

我正在尝试使用Python中的“sounddevice”库获取麦克风的信号。 将声音设备导入为 SD 打印(sd.query_devices()) 但它返回空列表。 我尝试了 arecord -f cd -d 6 test...

回答 2 投票 0

ffmpeg命令问题,以消除开头和结尾处的沉默。错误:返回非零退出状态 4294967274

我在 jupyter 笔记本中使用 ffmpeg 时遇到问题。我正在尝试将此功能用于音频,但出现以下错误,我尝试将文件更改为 wav 和不同的规格...

回答 1 投票 0

Python:比较两个可能有噪音的音频文件

出于项目目的,我正在从舞台附近的不同区域录制音频剪辑(波形文件)。我需要检查源音频是否为;舞台上的声音在附近的地方非常清晰......

回答 1 投票 0

说话人识别嵌入音频片段长度

我有一个与具体扬声器相匹配的音频样本基础 nick_sample1.mp3 nick_sample2.mp3 ... nick_sampleN.mp3 约翰_样本1.mp3 约翰样本2.mp3 ... 约翰样本K.mp3 任务是匹配

回答 1 投票 0

如何在 .wav 文件末尾添加几秒的静音?

我有 1,440 个音频文件要输入神经网络。问题是它们的长度并不相同。我使用了发布的答案: 使用python向wav文件添加静音帧 但它不...

回答 2 投票 0

如何使用faster_whisper从转录中获取置信度分数?

我正在使用faster_whisper Python 库来转录音频文件。目前,我能够获取音频数据的转录,但无法检索这些转录的置信度分数...

回答 1 投票 0

使用 DCT 为麦克风输入创建实时“电平”动画

对于上下文:我正在尝试创建一个简单的“电平监视器”动画,用于从麦克风传输音频数据。我在 iOS 设备上运行此代码并严重依赖 Accelerate

回答 2 投票 0

无法使用 librosa 中的 Harmonic 和 rp_entropy 函数

我正在尝试使用 librosa 从音频文件中提取某些特征,但它不断引发谐波和熵函数的 AttributeError 。我尝试将我的 python 版本从 3.8 更改为...

回答 1 投票 0

Yin 算法(音高检测)- 差分函数的替代方案

我已经实现了 Yin 算法来检测音调。 我的问题是差分函数的性能(方程 6) 差分函数: 静态 std::vector 差异(const std::...

回答 1 投票 0

尝试使用 scikits.samplerate.resample 更改音频文件的音调会导致 pygame 产生垃圾音频

我的问题与Python中的变调音频有关。我安装了当前的模块:numpy、scipy、pygame 和 scikits“samplerate”api。 我的目标是获取立体声文件并...

回答 4 投票 0

寻求建议:将拍手声检测集成到 Flutter 应用程序中

您好 Stack Overflow 社区, 我目前正在开发一个 Flutter 应用程序,我有兴趣将拍手声音检测模块集成到其中。我相信这个功能可以显着增强用户体验

回答 1 投票 0

使用 YouTube API 自动静音 YouTube 视频中的受版权保护的音乐

我目前手动将 YouTube 视频中受版权保护的歌曲静音,方法是导航到视频,单击“限制”,然后将特定的受版权保护的曲目静音。然而,我想实现......

回答 1 投票 0

如何计算音频信号的响度?

我有一个音频信号,我想从中检测大声时刻。 我遇到的问题是我不确定我提供的算法/代码是否正确。 我在很多帖子中读到

回答 2 投票 0

ToneJS PitchShift 与 MediaStream

我目前正在构建一个具有变调功能的应用程序,我发现 ToneJS 可以完成这项工作。我想知道是否可以从媒体中仅提取音轨的音高移动部分

回答 1 投票 0

Swift 3 中的 AVAudioRecorder:获取字节流而不是保存到文件

我是 iOS 编程新手,我想使用 Swift 3 将 Android 应用程序移植到 iOS。该应用程序的核心功能是从麦克风读取字节流并实时处理该流....

回答 2 投票 0

使用 pyDub 将增益应用于特定频率

我想增加 wav 文件中特定频率的音量,使它们比其余频率更响亮(更容易听到)。 我完全没有音频处理经验,正在学习

回答 1 投票 0

使用 OpenAI 的 Whisper 转录降噪音频时的时序偏移

我正在开展一个项目,涉及使用 OpenAI 的 Whisper 转录音频文件。为了提高转录质量,我尝试使用

回答 1 投票 0

我怎样才能进行实时系统音频处理?

我一直在尝试在线查找实时系统音频处理的资源,但似乎找不到我正在寻找的任何内容。我检查了一些 Python 库,例如 PyAudio 和 librosa,但是...

回答 1 投票 0

声音设备输出溢出

我在使用Python的声音设备模块时遇到了未知的麻烦。 下面的代码输出一个 GUI,您可以在其中输出用户定义频率的正弦波。此外,还可以调节其

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.