dataframe 相关问题

数据框是表格数据结构。通常,它包含数据,其中行是观察值,列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语(R,Apache Spark,deedle,Maple,Python中的pandas库和Julia中的DataFrames库),“table”是用于的术语MATLAB和SQL。

高效加载 pandas 数据框的索引

我正在处理大型数据帧,我只想读取其索引,而不必加载整个数据帧。 我尝试使用 usecols=0 ,我认为它只会加载第一列,我会

回答 1 投票 0

读取多个文件时,列不可见或重复 :)

所以我正在读取多个文件(正好是 30 个)。其中一些具有相同的列,一些具有不同的列等等。 mycsvdir = r'C: \...\dict_full' csvfiles = glob.glob(os.path.join(mycsvdir, '*.csv'))

回答 1 投票 0


带有标签样式列表的 Pandas groupby

我有一个带有“类似标签”分组的数据集: 身份标签 0 item1 ['朋友','家人'] 1 项2 ['朋友'] 2 项目3 [] 3 item4 ['家庭','假期'] 所以一行可以属于

回答 1 投票 0

识别r

我想知道DF有多少个数据: DF<- data.frame( stringsAsFactors = FALSE, V1 = c("A","-","-","-","B&q...

回答 1 投票 0


系统的方式pandas dataframe的夏姆列

我有一个看起来像这样的熊猫数据框架: 1_2 1_3 1_4 2_3 2_4 3_4 1 5 2 8 2 2 4 3 4 5 8 5 8 8 8 9 3 3 4 3 4 4 4 8 3 8 0 7 4 2 2 col ...

回答 1 投票 0

导入错误:即使安装了 adlsf 后,仍安装 adlfs 来访问 Azure Datalake Gen2 和 Azure Blob 存储

我有一个天蓝色的函数,代码如下: storage_account_url = f“{self.datalake_settings.STORAGE_ENDPOINT}/{parquet_folder_path}/{file_name}.parquet” 存储选项= { “账户...

回答 1 投票 0

R 过滤一个数据帧,其中一列有多个值,奇怪的行为

我有一个包含多个列的数据框,我想获取感兴趣的列采用某些值的所有行。最初,我使用 == ,如下所示 其中(df$列==c(值1,值2)) 成功了...

回答 1 投票 0

保留重复列名称的第一个实例,除非为空,然后保留列的第二个实例

我有一个包含多列的数据框,其中两列具有相同的名称(“手机”),有些值为空,有些不是,但总会有两列之一填充...

回答 3 投票 0

读取合并后的excel数据并使用python转换成json格式

我正在尝试使用 Python Pandas 库将数据从 Excel 转换为 JSON。 我的 Excel 数据如下表所示, 测试...

回答 1 投票 0

如何动态分割数据框

我有以下数据框: 将 pandas 导入为 pd data = {'姓名': ['Ankit', '阿米特', '艾西瓦娅', 'Priyanka','Kovacs','Tompos'], ‘年龄’: [21, 19, 20, 18, 20, 19], '...

回答 1 投票 0

如何在Python中绘制概率密度函数?

我想绘制日志文件偏移量的概率密度函数。 这是代码: 时间戳 = [] 序列=[] log_Name = 'test_rtt_25-01-17_13-07-41_values5_rate50.log' 日志路径=&

回答 1 投票 0

如何将 pandas.series 结果转换为整数?

我有一列 ['Duration],它是 int 数据类型。我现在试图找出 pandas 数据框中最常出现的 ['Duration'] 。 持续时间 = (inter['duration'].mode()) 打印(持续时间)

回答 1 投票 0

如何将此 pandas.series 结果转换为整数?

我正在做一些问题,但我被困在这个问题上。所以基本上我有一列 ['Duration] 它是 int 数据类型。我现在正在尝试找出 pandas datafr 中最常出现的 ['Duration']...

回答 1 投票 0

使用 LRstats() 代替 summarise(),R 错误是“sum(n, na.rm = TRUE) 中的错误:参数的‘类型’(闭包)无效”

我有一个工作任务的示例 R 代码,其中一个代码块包含 summarise(),但 R 不喜欢推荐的 LRstats() 并表示“警告:'summarise' 已弃用。 使用 '

回答 1 投票 0

使用现有和不存在的数据创建并完成条件变量[已关闭]

附资料: id = c (1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2) vm = c("1", "2", "3", "4", "5", "7", "8&qu...

回答 2 投票 0

如何在数据框中生成一个新列来指示具有积极结果的列?

我有一个数据框,如下所示: ID f_1 f_2 f_3 1 1 0 1 2 0 1 1 3 1 1 0 4 1 0 1 5 0 1 1 我完全不知道如何开始。而且我的原始数据框相当大(...

回答 1 投票 0

在 Pandas 数据框中生成一个新列,指示具有积极结果的列

我有一个数据框,如下所示: ID f_1 f_2 f_3 1 1 0 1 2 0 1 1 3 1 1 0 4 1 0 1 5 0 1 1 我完全不知道如何做

回答 1 投票 0

使用现有和不存在的数据创建条件变量[已关闭]

附资料: id = c (1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2) vm = c("1", "2", "3", "4", "5", "7", "8&qu...

回答 2 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.