从数据集中删除链接

问题描述 投票:0回答:1

我有以下数据集,我需要从中删除所有链接。 csv看起来像这样:

data

有人知道我如何快速,轻松地做到这一点吗?

python excel twitter hyperlink
1个回答
1
投票

您可以在python中使用正则表达式,例如:

import re 

for x in list :
     re.sub("http\S*\s", "", x)

其中list是您的csv数据的列表。

这是我用来预处理Twitter数据的代码:

all_text  = re.sub("#\S*\s", "", all_text)
all_text  = re.sub("W+", "", all_text)
all_text  = re.sub("@\S*\s", "", all_text)
all_text  = re.sub("http\S*\s", "", all_text)
© www.soinside.com 2019 - 2024. All rights reserved.