将多个抓取的表导出到单个 CSV 文件中

问题描述 投票:0回答:1

如何连接从多个 HTML 读取的表格?我知道它们被视为列表,并且列表不可能串联,但是如何将从不同 URL 抓取的多个表插入到一个 CSV 中?有任何想法吗?是否可以将打印输出保存在变量中,然后将其移至 CSV 中?

import pandas as pd

df = pd.read_html('URL')
df1 = pd.read_html('URL')

print(df, df1)

(**df,df1**).to_csv('name.csv')

属性 (df,df1) 当然是不正确的,只是写它来描述我所缺少的内容。

提前非常感谢您

python pandas web-scraping export-to-csv
1个回答
0
投票

pd.read_html 返回数据帧列表。因此,如果您确定列表包含以可以串联的方式格式化的数据帧,您可以将其合并到单个数据帧中,然后将其导出到 csv:

import pandas as pd

dframes_list1 = pd.read_html('URL1')
dframes_list2 = pd.read_html('URL2')
dframes_all = dframes_list1 + dframes_list2
consolidated_dframe = pd.concat(dframes_all)
consolidated_dframe.to_csv('name.csv')
© www.soinside.com 2019 - 2024. All rights reserved.