如何使用 R 或 Python 一次性提取多个站点中具有相同模式的 url?

问题描述 投票:0回答:1

我正在尝试从网站下载视频,这需要提取每个“视频网址”上驻留的 1 个“下载网址”。

示例:

“视频网址”:https://www.example.com/video/[string1]

“下载网址”(每个视频网址 1 个网址):https://www.example.com/get_file/[string2]

每个“视频网址”有1个“下载网址”,所以如果我有100个视频网址,我将有100个下载网址。

存在 1 个问题:如果域帐户已登录,“下载网址”仅在“视频网址”上可用。在我的默认浏览器 (Chrome) 上登录就足够了吗?

我希望 R 或 Python 代码读取视频网址列表 (.txt),然后生成下载网址列表 (txt)。

web-scraping web-crawler
1个回答
-2
投票

不告诉我真正的链接,你需要cookie,然后我才能知道如何抓取它

© www.soinside.com 2019 - 2024. All rights reserved.