如何在python中为每个患者id从时间序列数据中选择最新记录,我们必须将每小时数据合并为几天

问题描述 投票:1回答:1

下面附有数据集图像链接

enter image description here

**ID         date         ag  o   admision    discharge   a   b    c   d   e**
1   2020-01-31 01:09:00 73  1   ########    ########    0               
    2020-01-31 01:25:00 73  1   ########    ########    0       136     
    2020-01-31 01:44:00 73  1   ########    ########    0           103.1   
    2020-01-31 01:45:00 73  1   ########    ########    0               13.9
    2020-01-31 01:56:00 73  1   ########    ########    0   19.9            
    2020-01-31 01:59:00 73  1   ########    ########    0               
    2020-01-31 02:09:00 73  1   ########    ########    0               
    2020-01-31 06:44:00 73  1   ########    ########    0               
    2020-02-04 19:42:00 73  1   ########    ########    0               
    2020-02-06 09:14:00 73  1   ########    ########    0       140     
    2020-02-06 10:06:00 73  1   ########    ########    0           101.4   
    2020-02-10 12:42:00 73  1   ########    ########    0       130     
    2020-02-10 14:41:00 73  1   ########    ########    0               14.1
    2020-02-10 14:47:00 73  1   ########    ########    0           98.5    
    2020-02-15 09:58:00 73  1   ########    ########    0       129     
    2020-02-15 10:41:00 73  1   ########    ########    0           98.1    
    2020-02-15 10:50:00 73  1   ########    ########    0               
    2020-02-16 08:53:00 73  1   ########    ########    0               
    2020-02-16 08:55:00 73  1   ########    ########    0               
    2020-02-16 09:23:00 73  1   ########    ########    0       131     
    2020-02-16 10:59:00 73  1   ########    ########    0               
    2020-02-16 11:32:00 73  1   ########    ########    0           100 
    2020-02-16 13:33:00 73  1   ########    ########    0               12.4
    2020-02-17 08:31:00 73  1   ########    ########    0               

我尝试过此

tra=tra.resample('D').sum()

但它汇总了每个日期数据集中的所有行,但我需要根据ID对每个患者进行汇总。

python pandas numpy dataframe nan
1个回答
0
投票

您可能希望按患者ID分组并进行操作。

tra=tra.groupby('PATIENT_ID').apply(lambda x: x.resample('D').sum())

让我知道是否可行。

© www.soinside.com 2019 - 2024. All rights reserved.