为了使用大数据技术应用实时语音分析,我试图在一开始使用KAFKA。因此,首先,我使用WAVIO API将.wav文件转换为字节,然后将包含[数据(nparray的类型),速率(整数)和采样宽度(整数)]的消息发送到kafka,这些消息将被转换成消费者的消费者使用他们再次到.wav文件。
问题是如何通过一条消息(每条消息代表.wav文件)与kafka之间发送和接收这些[数据,速率,采样宽度]?
producer = KafkaProducer(bootstrap_servers='localhost:9092')
x = wav2bytes("bush_read") # return tuple containing(data, rate, sampwidth)
here I'm sending 3 messages
producer.send("TestTopic", key=b'data', value=b'%s' % (x[0])) # data -> nparray
producer.send("TestTopic", key=b'rate', value=b'%d' % (x[1])) # rate -> int
producer.send("TestTopic", key=b'sampwidth', value=b'%d' % (x[2])) #sampwidth -> int
send("TestTopic","bush_read")
for message in consumer:
msg = message # I want somthing like this
file = bytes2wav("name", msg.data, msg.rate, msg.sampwidth )
如果需要,您可以将其作为json(或任何其他序列化)发送,创建一个json,如
{'data' : data, 'rate': rate, 'sampwidth': sampwidth}
您可以在消费者中反序列化它