我正在尝试建立一个网络刮板,奇怪的是,有时代码工作,有时它没有,没有改变任何东西,它可能是网站问题,但我怎么能解决它,所以它会一直工作?
我已多次尝试重建31号线,但无论我怎么做,它似乎都无法工作。
# html parsing
page_soup = soup(page_html, "html.parser")
# grabs each appartment
containers = page_soup.findAll("div", {"class":"list-item-container"})
filename = "asunnot.csv"
f = open(filename, "w")
headers = "Kohdetta Vuokraa, Huoneistot, Talotyyppi ja Koko, Sijainti, Vapautuu, Vuokra"
f.write(headers)
count = 0
for page in range(1,10):
my_url = "https://www.vuokraovi.com/vuokra-asunnot/Uusimaa?page={}&pageType="
for container in containers:
Vuokranantaja = container.findAll("div", {"class":"hidden-xs col-sm-3 col-4"})[0].img["alt"]
Huoneistot = container.findAll("li", {"class":"semi-bold"})[1].text
Talotyyppi = container.findAll("li", {"class":"semi-bold"})[0].text
Sijainti = container.findAll("div", {"class":"hidden-xs col-sm-4 col-3"})[0].findAll("span", {"class":"address"})[0].text.strip().replace("\r", "").replace("\n", "").replace(" ", "").replace(",", ", ")
Vapautuu = container.findAll("div", {"class":"hidden-xs col-sm-4 col-3"})[0].findAll("span", {"class":"showing-lease-container hidden-xs"})[0].li.text
Vuokra = container.findAll("li", {"class":"rent"})[0].text.strip()
期望的输出将是给我我试图刮去的东西,但相反它给了我这个:
Traceback (most recent call last):
File "C:\Users\----\Desktop\vuokraovi.py", line 31, in <module>
Vuokranantaja = container.findAll("div", {"class":"hidden-xs col-sm-3 col-4"})[0].img["alt"]
TypeError: 'NoneType' object is not subscriptable
你得到的错误,'NoneType' is not subscriptable
,意味着你试图通过None
上的索引来访问某些内容,例如None[idx]
。
因此,在尝试在[0]
结果上访问项目container.findAll()
之前,您应首先检查是否存在某些内容。
有时候,使用findAll方法无需任何方法。检查文档中的异常处理:https://docs.python.org/3/tutorial/errors.html#handling-exceptions