我正在寻找一种方法,将缩短的URL从Twitter自动“翻译”为原始URL。
我使用以下代码抓取了一些Twitter时间轴:tweets
然后,我将缩短的URL与其他tweet文本分开,以便在数据框中有一个单独的列,其中仅包含缩短的URL。
现在,我正在寻找一种方法来自动抓取所有这些URL,这些URL会重定向到各个网站,并使用原始(即未缩短的)URL来获得一个新列。
有人知道如何在R中做到这一点吗?
感谢,曼努埃尔
您可以使用httr
包。
httr::HEAD("URL")
将在第一行中给您答复,然后您可以进行通常的清洗以获得仅URL-s。