识别音频文件中的重复句子

问题描述 投票:0回答:1

我正在寻找有关识别音频文件中重复语音片段的最佳方法的信息。

假设有人正在录制自己说的一段文字,有时他会被一句话噎住,停下来,然后从乞求的句子重新开始。他还可能对同一部分进行两到三次拍摄,以便在最终剪辑中保留最好的部分。

所以我的问题是:检测这些片段是否相同或围绕同一文本的变化的最佳方法是什么?

我的想法是进行一些语音到文本的转换,然后对结果进行一些文本比较。我将能够识别非常接近的字符串,然后将相应的音频片段标记为“相同”。

但我想知道是否有某种方法可以直接在音频文件上执行此操作。我听说过音频指纹识别,但我不确定它在这里是否有效,因为这个人可能不会以完全相同的方式发音这两个句子(添加静音,甚至稍微改变一些单词)。

是否有人已经做过类似的事情,或者已经使用过这些工具,并且可以就其可能性和局限性向我提供反馈?

speech-recognition speech-to-text speech audio-fingerprinting text-comparison
1个回答
0
投票

在这种情况下,您可以使用任何在线转录器并上传音频以生成相同的转录。然后你可以使用chatGPT来纠正这个问题。

© www.soinside.com 2019 - 2024. All rights reserved.