可能以前曾被问过但我找不到任何东西。学习熊猫,我认为学习曲线不会那么陡峭 - 我错了=)我正在导入一个超过2000万行的csv文件。问题在于它因为尺寸而难以使用。只需更改列以使用正确的dateTime需要很长时间。
所以我的第一个想法是拖尾最后100行 -
shortDataFrame = longDataFrame.tail(100).copy()
但是,当我尝试检查某些列的类型时,这给了我一些奇怪的KeyError:0L。这给出了错误 -
type(shortDataFrame['Time'][0])
这适用于原始long dataFrame并且没有错误
type(longDataFrame['Time][0])
那么如何将大型数据帧变成更小的数据帧以使其更易于管理?
以下将为您提供原始数据帧的随机样本,只有100行:
shortDataFrame = longDataFrame.sample(100)
该示例将与“母”数据帧具有完全相同的列。