使用panda将整列中的时间转换为从csv导入float

问题描述 投票:1回答:2

在我的csv文件中,我有三个数据列的时间列。我需要使用熊猫将时间转换为浮动。但它给了我一个错误,int()的无效文字与基数10:'g'你能建议我解决这个错误吗?我的代码是,

def time_to_float(t):
    """ convert "hh:mm:ss" to float (0, 1) only of the correct format """
    if t == '-':
        return None
    a = [int(i) for i in t.split(":")]
    if len(a) == 3:
        return round((a[0] + a[1] / 60 + a[2] / 3600) / 24, 5)
    else:
        return t


def pick_column(data_, n, start=1):
    """ pick all the n'th column data starting from "start" """
    return [time_to_float(data_[i][n]) for i in range(start, len(data_))]

data = pd.read_csv('data4.csv')
data = [i for i in data]


Time = pick_column(data, 0)
g = pick_column(data, 1)
p = pick_column(data, 2)
c = pick_column(data, 3)
y = pick_column(data, 4)



print(Time)
print(g)
print(p)
print(c)
print(y)

我的数据集是

Time	   g	 p	  c	 y
0:06:15	141	NaN	NaN	141
0:08:00	NaN	10	NaN	117
0:09:00	NaN	15	NaN	103
0:09:25	95	NaN	NaN	95
0:09:30	NaN	NaN	50	93
python-3.x pandas jupyter-notebook
2个回答
2
投票

我想你需要这个

这是你的样本时间

print(df['Time'])
1:06:15

要将此转换为每天秒数,您可以这样做

df['TimeFloat'] = (pd.DatetimeIndex(df['Time']).astype(np.int64)/10**9)%86400

取模数为86400,因为在一天内有86400秒您可以根据您的转换(秒,分,毫秒)修改模数值。如果您需要在int中进行转换,您可以简单地使用//而不是/

最终的df就是这个

   Time  TimeFloat
1:06:15     3975.0

0
投票

通常你会做类似的事情

t = df[df.columns[0]].astype('int64') / 1e9
print(t)

转换整个第一列。如果您的表中只有字符串,则需要先转换为日期,例如

timecol = df.columns[0]
df[timecol] = pd.to_datetime(df[timecol])

然后运行第一个片段。

© www.soinside.com 2019 - 2024. All rights reserved.