将主ID添加到孩子

问题描述 投票:-2回答:1

我需要一些帮助。我是网络抓取的初学者。 我正在一个有两个以上级别的网站上工作。我可以通过python获取所有表,但我无法关联master和child对象。我有如下表,但我不能将index(i)列添加到第一个表。

如何在第一个表中添加索引,如下所示。谢谢。

我有一个主阵列像;

[1,2,3,4,5]

我有像这样的细节数组

 [1, 2, 3]
 [2, 3, 4]

当我得到第二个数组时,我想将第一级ID添加到第二个表/数组。我怎么能添加这个。我在评论区添加了我的代码。对于示例,我的代码中有两个for循环。

谢谢

python-3.x web-scraping
1个回答
0
投票

首先,我在列表中添加了索引

table_km_rows=soup2.findAll('table')[0].findAll("tr")
for tr in table_km_rows:
    td = tr.find_all('td')
    row = [tr.text.strip() for tr in td if tr.text.strip()]
    if row:
        row=[i+1,row]
        myRelatedCityKMTable.append(row)

然后将我的列表分隔为列

df_km=df_km.KM.apply(pd.Series) \
    .merge(df_km, right_index = True, left_index = True) \
    .drop(["KM"], axis =`enter code here` 1)
df_km.columns=["IL","km","ID"]
#now 'age' will appear at the end of our df
df_km = df_km[['ID','IL','km']]
© www.soinside.com 2019 - 2024. All rights reserved.