我正在尝试将
pyannote
用于speaker diarization
而且我的发言者数量不对。
我试过的任何例子都得到了错误的结果。
例如:
我使用了这个 youtube 文件: https://www.youtube.com/watch?v=b2_ZZ2UpSzI
我把它转换成wav文件,采样率为16000.
我运行以下代码:
from pyannote.audio import Pipeline
TEST_FILE = "example.wav"
MY_TOKEN = "..."
pipeline = Pipeline.from_pretrained("pyannote/speaker-diarization",
use_auth_token=MY_TOKEN)
diarization = pipeline(TEST_FILE)
我怎样才能调整
pyannote
并获得更好的结果?