使用Python进行网页抓取，但值为空

Question

我想从这个网站获取值： http://cdn.ime-co.ir/ 和 BeautifulSoup ，但当我尝试导入表时，值是空的。我认为禁用了 javascrip 或任何我不知道的东西。请帮我将值导出为 csv 或 txt 格式。

import urllib2
from bs4 import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen('http://cdn.ime-co.ir/').read())
print soup

Answer 1

BeautifulSoup 不支持 JavaScript。如果您只需要解析一次，您显然可以将源代码保存到文件中并从那里进行解析。如果您需要多次抓取该网站，您可以考虑使用 Webkit（这里有一个使用 PyQT4 和 Webkit 的示例）或 PhantomJS 来生成可以在 Python 中解析的源代码。

使用Python进行网页抓取，但值为空

问题描述投票：0回答：1

1个回答

最新问题

使用Python进行网页抓取，但值为空

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1