数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。
我有一个包含用户ID的csv文件(其中一些出现不止一次)以及注册日期。此外,我有一些关于字符串中包含的路径的信息:id1,01-01-2015,'...
我有一个像这样的熊猫数据框:X Y Z值0 6.196133e + 06 2.321880e + 06 1356.439 0.01 1 6.196155e + 06 2.321867e + 06 ...
我试图以一种奇怪的方式加入2个数据帧,并且想知道是否有人有任何建议。我的第一个数据框看起来像这样,称之为df1:第二个看起来像,称之为df2:我想要我...
对于我的数据框中的每个col,执行一个函数并将其结果添加到新的数据框中?
我有一个以下格式的数据框(第一行对应某个名称的数字列;数据可能丢失) - col1.name | col2.name | col3.name | ...... 132 | 12 ....
目前,我有两个数据框,我在'KEY'上合并。我的第一个数据框包含一个KEY和产品的原始价格。我的第二个数据框每次收集一个人的信息......
我有两个数据帧,我正在尝试搜索每个数据帧中的事件,其中每个数据帧中特定标记列下的两个值彼此接近,但我不知道如何做...
在具有带有重复项的已排序数字索引的DataFrame中,创建现有列的移位版本和插值缺失值
具有这样的Pandas DataFrame df,其具有可能重复值的排序的数字索引(表示f.e。时间或距离):a b 0 4.0 1.0 1.5 5.5 2.5 1.5 5.5 2.5 2 6.0 3.0 ...
以longdata格式转换data.frame中的列表[复制]
我有这个data.base在类列表中的R. $ multiinstrumentais [1]“248269”“248827”$ geds [1]“248198”“248198”“248857”$ ghzmb [1]“248087”“296994”“302862 “我希望改造......
我有一个数据框df,其索引结构如下所示:>> df.index.values array(['2017-12-19T07:00:04.753422000','2017-12-19T07:00:09.628389000','2017 -12-19T07:00:12 ....
我有一个带有'agepreg'列的dataFrame live(活产),这是一个带有两个小数位的浮点数。我想创建一个新列'agepreg_rounded'作为整数。我天真的做法:活着['...
在N数或列式减法和除法中需要帮助,下面是输入数据帧中的列。输入数据帧:> df A B C D 1 1 3 6 2 2 3 3 3 4 3 1 2 2 2 4 4 4 4 4 5 5 ...
我有3个df:df1 = pd.DataFrame({“Name”:[“one”,“two”,“three”],“value”:[4,5,6]})df2 = pd.DataFrame({ “名称”:[“四”,“一”,“三”],“值”:[8,6,2]})df3 = pd.DataFrame({“名称”:[“一”,“四” , “六个一”], “价值”:...
我对R很新,我仍然无法解决某个聚合问题;我有这种形式的信息:SubjectType Subtype --------------------- TypeA 1 TypeB 2 ...
如何将值与循环中的下一个或上一个项目进行比较?我需要总结列中连续出现的重复事件。之后,我需要创建“频率表”,以便dfoutput schould ...
我有一个数据框以下值有每天四班倒日期ID ID timeworked(min)1/1/2017 1 1 20 1/1/2017 1 9 20 1/1/2017 3 2 100 1/2/2017 2 ...