如何将大型数据框复制到较小的数据框？

Question

可能以前曾被问过但我找不到任何东西。学习熊猫，我认为学习曲线不会那么陡峭 - 我错了=）我正在导入一个超过2000万行的csv文件。问题在于它因为尺寸而难以使用。只需更改列以使用正确的dateTime需要很长时间。

所以我的第一个想法是拖尾最后100行 -

shortDataFrame = longDataFrame.tail(100).copy()

但是，当我尝试检查某些列的类型时，这给了我一些奇怪的KeyError：0L。这给出了错误 -

type(shortDataFrame['Time'][0])

这适用于原始long dataFrame并且没有错误

type(longDataFrame['Time][0])

那么如何将大型数据帧变成更小的数据帧以使其更易于管理？

Answer 1

以下将为您提供原始数据帧的随机样本，只有100行：

shortDataFrame = longDataFrame.sample(100)

该示例将与“母”数据帧具有完全相同的列。