pyannote 给出错误的结果

pyannote 给出错误的结果

问题描述投票：0回答：0

我正在尝试将

pyannote

用于

speaker diarization

而且我的发言者数量不对。

我试过的任何例子都得到了错误的结果。

例如：

我使用了这个 youtube 文件： https://www.youtube.com/watch?v=b2_ZZ2UpSzI
我把它转换成wav文件，采样率为16000.

我运行以下代码：

from pyannote.audio import Pipeline

TEST_FILE = "example.wav"
MY_TOKEN = "..."
pipeline = Pipeline.from_pretrained("pyannote/speaker-diarization",
                                    use_auth_token=MY_TOKEN)

diarization = pipeline(TEST_FILE)

我得到了以下分类：

GT 包含 4 个扬声器，而不是 2 个。

我怎样才能调整

pyannote

并获得更好的结果？

deep-learning

huggingface-transformers

问题描述 投票：0回答：0

最新问题

问题描述投票：0回答：0