假设我有:
raw_data = [
[("name": "Bob" ), ("age": 26)],
[("name": "Alice"), ("age": 29)]
]
raw_data_df = spark.createDataFrame(raw_data)
我希望完成的是将 Alice 行提取到它自己的(单行)DataFrame 中。有什么简单的解决办法吗?
你只需要一个过滤操作:
alice_df = raw_data_df.filter(raw_data_df.name == "Alice")