我读了电报频道消息:
channel = await self.client.get_entity(entity)
messages = await self.client.get_messages(channel, limit=lim)
text_df = pd.DataFrame(columns=[
'channel_id',
'message_id',
'message_text',
'message_datetime'
])
for x in messages:
message_list = list(range(4))
message_list[0] = int(tg_channel[0])
message_list[1] = int(x.id)
message_list[2] = str(x.raw_text) #str(x.message)
message_list[3] = str(x.date)
text_df.loc[len(text_df)] = message_list
print(len(x.raw_text))
print(len(x.text))
print(len(x.message))
print('\n ############# \n')
预计在同一频道上我可能会收到 1 条包含文本的消息,以及另外 4 条不带文本的消息。我尝试手动检查电报中的这些消息,我发现附加了视频内容但下面有文本的消息不会返回文本,但我不确定这是否是 100% 的机会。我还看到附有照片的消息有时不返回文本。我对
message.raw_text
、message.text
和 message.message
得到了相同的结果,示例如下。
尝试获取消息 https://t.me/DtRoad
0 0 0
##############
0 0 0
##############
0 0 0
##############
1011 1068 1011
##############
953 1019 953
##############
收到5条消息
其中两个仅包含非空文本内容。
什么因素会影响文本的缺失?
带媒体但不带标题的消息或服务消息没有文本。