我需要一些帮助。我是网络抓取的初学者。 我正在一个有两个以上级别的网站上工作。我可以通过python获取所有表,但我无法关联master和child对象。我有如下表,但我不能将index(i)列添加到第一个表。
如何在第一个表中添加索引,如下所示。谢谢。
我有一个主阵列像;
[1,2,3,4,5]
我有像这样的细节数组
[1, 2, 3]
[2, 3, 4]
当我得到第二个数组时,我想将第一级ID添加到第二个表/数组。我怎么能添加这个。我在评论区添加了我的代码。对于示例,我的代码中有两个for循环。
谢谢
首先,我在列表中添加了索引
table_km_rows=soup2.findAll('table')[0].findAll("tr")
for tr in table_km_rows:
td = tr.find_all('td')
row = [tr.text.strip() for tr in td if tr.text.strip()]
if row:
row=[i+1,row]
myRelatedCityKMTable.append(row)
然后将我的列表分隔为列
df_km=df_km.KM.apply(pd.Series) \
.merge(df_km, right_index = True, left_index = True) \
.drop(["KM"], axis =`enter code here` 1)
df_km.columns=["IL","km","ID"]
#now 'age' will appear at the end of our df
df_km = df_km[['ID','IL','km']]