dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

ExplodeDataFrame,并根据条件添加具有特定值的新列

我有一个带有6个Coloumn的数据框架,A,B,C,Val,类别 有点这样: 命名A B C Val类别 x 1.1 0 0.2 na na y 0 0.1 0 na na z 0.5 0 ...

回答 1 投票 0

从mysql

问题 如何从MySQL中读取Polars的数据框。 文档对此问题保持沉默。目前可能只有对Parquet,JSON,IPC等的支持,并且对SQL没有直接支持...

回答 1 投票 0

如何使用列之间相同条件在r中过滤数据框?

我有一个带有13列的数据集,其中包含这些名称DIAG2-DIAG14。我需要在此列中使用“或”作为逻辑运算符中的相同标准过滤。 diag2 diag3 diag4 diag5 diag6 diag ...

回答 1 投票 0

如何使用r

I有一个具有多个样本(行)的数据集和样本中存在的特征(列)。每个功能的数字值在每个样本的0到1之间。我想将其变成存在/abse ...

回答 3 投票 0


dplyr-从目录导入所有文件后,需要添加CSV文件名

我已经使用此代码从目录导入所有CSV文件<- list.files(pattern = "\\.csv$") %>

回答 0 投票 0

回答 1 投票 0

Accesso = df['AccessLevels'] print(Accesso)

回答 1 投票 0


回答 1 投票 0


dataframe中的格式重组列

我想知道,如果在r或pandas中,有一种图形方式更改列的顺序。

回答 0 投票 0




将这些.CSV文件组合到单个dataframe

df = pd.DataFrame() for file in files: if file.endswith('.csv'): df=df.append(pd.read_csv(file), ignore_index=True) df.head()

回答 1 投票 0

如何优雅地拆卸火花执行者

IAM使用df.cache()来cachce数据框架,并使用databricks以min实例为1和max实例自动化为8。但是,由于某些执行者在MIDD中死亡...

回答 1 投票 0

10个交叉折叠的聚集矩阵 - 如何进行pandas dataframe?

我试图为任何型号(随机森林,决策树,天真的贝叶斯等)获得10倍的混乱矩阵 如果我为普通模型运行,我能够正常获得每个混淆矩阵,如下所示:

回答 2 投票 0

使用dataframe.replace()用于在dataframe.map()函数中用NAN替换字符串返回typeerror

我意识到有一些工作替代方案,我只想了解我自己的教育或其他任何遇到此事的事情。 df_test = pd.dataframe({'test1':['blah1','b ...

回答 1 投票 0

julia:相当于pythons选择多索引级别(尤其是列)

import numpy as np import pandas as pd #generating sample data nsmpls = 10 smpls = [f'smpl{j}' for j in range(nsmpls)] nfeats = 5 feats = [f'feat{j}' for j in range(nfeats)] data = np.random.rand(nfeats, nsmpls) countries = ['France'] * 2 + ['UK'] * 3 + ['US'] * 5 df = pd.DataFrame(data, index=feats, columns=pd.MultiIndex.from_tuples(zip(countries, smpls))) df.to_csv('./data.tsv', sep='\t') #--------------------------------------------------------------------- #loading dataset df = pd.read_csv('./data.tsv', sep='\t', index_col=0, header=[0,1]) #extracting subset dg = df.xs('France', level=0, axis=1) print(dg.shape) #iterating for country, group in df.groupby(level=0, axis=1): print('#samples: {}'.format(group.shape[1]))

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.