如何连接从多个 HTML 读取的表格?我知道它们被视为列表,并且列表不可能串联,但是如何将从不同 URL 抓取的多个表插入到一个 CSV 中?有任何想法吗?是否可以将打印输出保存在变量中,然后将其移至 CSV 中?
import pandas as pd
df = pd.read_html('URL')
df1 = pd.read_html('URL')
print(df, df1)
(**df,df1**).to_csv('name.csv')
属性 (df,df1) 当然是不正确的,只是写它来描述我所缺少的内容。
提前非常感谢您
pd.read_html 返回数据帧列表。因此,如果您确定列表包含以可以串联的方式格式化的数据帧,您可以将其合并到单个数据帧中,然后将其导出到 csv:
import pandas as pd
dframes_list1 = pd.read_html('URL1')
dframes_list2 = pd.read_html('URL2')
dframes_all = dframes_list1 + dframes_list2
consolidated_dframe = pd.concat(dframes_all)
consolidated_dframe.to_csv('name.csv')