我在 Visual Studio Code 中使用 Jupyter 笔记本。
在分析大型数据集的多个步骤之后,我创建了一个简短的摘要数据框,列出了独特的数据。 在VS Code中,使用数据查看器,我可以在数据查看器中查看数据。 在 VS Code 中,使用数据查看器,我可以将其导出为 CSV。
问题:
示例(简化):
我从df1开始。 我从中导出 df2。
import pandas as pd
df1 = pd.DataFrame({'name': ['alice', 'bob', 'frank', 'carole', 'yuchen', 'navid'],
'role': ['dev', 'dev', 'dev', 'qa', 'ux', 'ux'],
'team': ['avengers', 'avengers', 'marvel', 'marvel', 'avengers', 'gotham'],
'country': ['china', 'china', 'US', 'US', 'china', 'US']})
df2 = df1[df1.country=='US']
display(df2)
我可以在 VS Code 数据查看器中查看 df2 的内容。 我可以将数据导出为 CSV。
我还可以自动生成重新创建此类数据结构(和关联数据)所需的代码吗?例如,可以通过单击 VS Code 中的某个位置(在数据查看器中?)。或者也可以通过在数据框上调用 Python 方法来实现。
目标是提供类似下面的内容,其中包含重新创建 df2 结构所需的数据和代码:
df2 = pd.DataFrame({'name': ['frank', 'carole', 'navid'],
'role': ['dev','qa', 'ux'],
'team': ['marvel', 'marvel', 'gotham'],
'country': ['US', 'US', 'US']})
再次强调:这不是要漂亮地打印数据框,而是要获取创建结构和数据所需的 Python 代码。
谢谢!
我猜你可能想要实现这样的东西:
这是代码:
import pandas as pd
df1 = pd.DataFrame({'name': ['alice', 'bob', 'frank', 'carole', 'yuchen', 'navid'],
'role': ['dev', 'dev', 'dev', 'qa', 'ux', 'ux'],
'team': ['avengers', 'avengers', 'marvel', 'marvel', 'avengers', 'gotham'],
'country': ['china', 'china', 'US', 'US', 'china', 'US']})
df2 = df1[df1.country=='US']
code = f"df2 = pd.DataFrame({df2.to_dict(orient='list')})"
print(code)