dataframe 相关问题

数据框是表格数据结构。通常，它包含数据，其中行是观察值，列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语（R，Apache Spark，deedle，Maple，Python中的pandas库和Julia中的DataFrames库），“table”是用于的术语MATLAB和SQL。

ExplodeDataFrame，并根据条件添加具有特定值的新列

我有一个带有6个Coloumn的数据框架，A，B，C，Val，类别有点这样：命名A B C Val类别 x 1.1 0 0.2 na na y 0 0.1 0 na na z 0.5 0 ...

python python-3.x pandas dataframe

回答 1 投票 0

从mysql

问题如何从MySQL中读取Polars的数据框。文档对此问题保持沉默。目前可能只有对Parquet，JSON，IPC等的支持，并且对SQL没有直接支持...

mysql dataframe rust rust-sqlx rust-polars

回答 1 投票 0

如何使用列之间相同条件在r中过滤数据框？

我有一个带有13列的数据集，其中包含这些名称DIAG2-DIAG14。我需要在此列中使用“或”作为逻辑运算符中的相同标准过滤。 diag2 diag3 diag4 diag5 diag6 diag ...

r dataframe filter

回答 1 投票 0

如何使用r

I有一个具有多个样本（行）的数据集和样本中存在的特征（列）。每个功能的数字值在每个样本的0到1之间。我想将其变成存在/abse ...

r dataframe if-statement mutate

回答 3 投票 0

我可以定义涉及多列的pandas dataframe groupby聚合吗？

python pandas dataframe

回答 1 投票 0

dplyr-从目录导入所有文件后，需要添加CSV文件名

我已经使用此代码从目录导入所有CSV文件<- list.files(pattern = "\\.csv$") %>

r dataframe dplyr import tidyverse

回答 0 投票 0

在R

r dataframe unique

回答 1 投票 0

Accesso = df['AccessLevels'] print(Accesso)

python json pandas dataframe

回答 1 投票 0

为数据框架pandas

python multithreading dataframe bigdata

回答 2 投票 0

julia

python dataframe julia multi-index

回答 1 投票 0

Python -valueCounts（）方法 - 显示所有结果[重复]

python pandas dataframe

回答 2 投票 0

dataframe中的格式重组列

我想知道，如果在r或pandas中，有一种图形方式更改列的顺序。

r pandas dataframe rstudio data-manipulation

回答 0 投票 0

dedit行和列名称中的数据框架中的列我有一个数据框，我已经使用基本R中的t函数成功地转移了。但是，我想更改列名和行名称为数据框的一部分。我将使用虹膜

r dataframe transpose

回答 1 投票 0

估计按时间划分的相对变化我正在努力计算公司年度净销售额之间的百分比差异，并考虑到NA。这是数据示例： DT

<- data.table(lpermno = c(10065,...

r dataframe grouping

回答 2 投票 0

创建一个新的数据帧形成现有的数据框，仅在pandas

python pandas dataframe

回答 1 投票 0

将这些.CSV文件组合到单个dataframe

df = pd.DataFrame() for file in files: if file.endswith('.csv'): df=df.append(pd.read_csv(file), ignore_index=True) df.head()

python pandas dataframe csv

回答 1 投票 0

如何优雅地拆卸火花执行者

IAM使用df.cache（）来cachce数据框架，并使用databricks以min实例为1和max实例自动化为8。但是，由于某些执行者在MIDD中死亡...

dataframe apache-spark databricks executor

回答 1 投票 0

10个交叉折叠的聚集矩阵 - 如何进行pandas dataframe？

我试图为任何型号（随机森林，决策树，天真的贝叶斯等）获得10倍的混乱矩阵如果我为普通模型运行，我能够正常获得每个混淆矩阵，如下所示：

python pandas dataframe cross-validation k-fold

回答 2 投票 0

使用dataframe.replace（）用于在dataframe.map（）函数中用NAN替换字符串返回typeerror

我意识到有一些工作替代方案，我只想了解我自己的教育或其他任何遇到此事的事情。 df_test = pd.dataframe（{'test1'：['blah1'，'b ...

pandas dataframe replace

回答 1 投票 0

julia：相当于pythons选择多索引级别（尤其是列）

import numpy as np import pandas as pd #generating sample data nsmpls = 10 smpls = [f'smpl{j}' for j in range(nsmpls)] nfeats = 5 feats = [f'feat{j}' for j in range(nfeats)] data = np.random.rand(nfeats, nsmpls) countries = ['France'] * 2 + ['UK'] * 3 + ['US'] * 5 df = pd.DataFrame(data, index=feats, columns=pd.MultiIndex.from_tuples(zip(countries, smpls))) df.to_csv('./data.tsv', sep='\t') #--------------------------------------------------------------------- #loading dataset df = pd.read_csv('./data.tsv', sep='\t', index_col=0, header=[0,1]) #extracting subset dg = df.xs('France', level=0, axis=1) print(dg.shape) #iterating for country, group in df.groupby(level=0, axis=1): print('#samples: {}'.format(group.shape[1]))

python dataframe julia multi-index

回答 1 投票 0

dataframe 相关问题

最新问题