dataframe 相关问题

数据框是表格数据结构。通常，它包含数据，其中行是观察值，列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语（R，Apache Spark，deedle，Maple，Python中的pandas库和Julia中的DataFrames库），“table”是用于的术语MATLAB和SQL。

高效加载 pandas 数据框的索引

我正在处理大型数据帧，我只想读取其索引，而不必加载整个数据帧。我尝试使用 usecols=0 ，我认为它只会加载第一列，我会

python pandas dataframe performance

回答 1 投票 0

读取多个文件时，列不可见或重复 :)

所以我正在读取多个文件（正好是 30 个）。其中一些具有相同的列，一些具有不同的列等等。 mycsvdir = r'C: \...\dict_full' csvfiles = glob.glob(os.path.join(mycsvdir, '*.csv'))

python pandas dataframe duplicates multiple-columns

回答 1 投票 0

如何将数组的元素乘以一组数据框的相应元素？

python arrays dataframe

回答 2 投票 0

带有标签样式列表的 Pandas groupby

我有一个带有“类似标签”分组的数据集：身份标签 0 item1 ['朋友','家人'] 1 项2 ['朋友'] 2 项目3 [] 3 item4 ['家庭','假期'] 所以一行可以属于

python pandas dataframe group-by

回答 1 投票 0

识别r

我想知道DF有多少个数据： DF<- data.frame( stringsAsFactors = FALSE, V1 = c("A","-","-","-","B&q...

r dataframe large-data

回答 1 投票 0

i有一个包含无法估计的行和列的数据框架。 DF的结构是使直到第六排和第二列，我都有字符串为输入，其余的是数字（浮点）。我想要...

原始数据框架（DF）：

python pandas dataframe jupyter-notebook data-manipulation

回答 1 投票 0

系统的方式pandas dataframe的夏姆列

我有一个看起来像这样的熊猫数据框架： 1_2 1_3 1_4 2_3 2_4 3_4 1 5 2 8 2 2 4 3 4 5 8 5 8 8 8 9 3 3 4 3 4 4 4 8 3 8 0 7 4 2 2 col ...

python pandas dataframe combinations

回答 1 投票 0

导入错误：即使安装了 adlsf 后，仍安装 adlfs 来访问 Azure Datalake Gen2 和 Azure Blob 存储

我有一个天蓝色的函数，代码如下： storage_account_url = f“{self.datalake_settings.STORAGE_ENDPOINT}/{parquet_folder_path}/{file_name}.parquet” 存储选项= { “账户...

python pandas dataframe azure-functions azure-data-lake

回答 1 投票 0

R 过滤一个数据帧，其中一列有多个值，奇怪的行为

我有一个包含多个列的数据框，我想获取感兴趣的列采用某些值的所有行。最初，我使用 == ，如下所示其中（df$列==c（值1，值2））成功了...

r dataframe

回答 1 投票 0

保留重复列名称的第一个实例，除非为空，然后保留列的第二个实例

我有一个包含多列的数据框，其中两列具有相同的名称（“手机”），有些值为空，有些不是，但总会有两列之一填充...

python pandas dataframe

回答 3 投票 0

读取合并后的excel数据并使用python转换成json格式

我正在尝试使用 Python Pandas 库将数据从 Excel 转换为 JSON。我的 Excel 数据如下表所示，测试...

python json excel pandas dataframe

回答 1 投票 0

如何动态分割数据框

我有以下数据框：将 pandas 导入为 pd data = {'姓名': ['Ankit', '阿米特', '艾西瓦娅', 'Priyanka'，'Kovacs'，'Tompos']， ‘年龄’: [21, 19, 20, 18, 20, 19], '...

dataframe dynamic split bigdata

回答 1 投票 0

如何在Python中绘制概率密度函数？

我想绘制日志文件偏移量的概率密度函数。这是代码：时间戳 = [] 序列=[] log_Name = 'test_rtt_25-01-17_13-07-41_values5_rate50.log' 日志路径=&

python dataframe numpy matplotlib

回答 1 投票 0

如何将 pandas.series 结果转换为整数？

我有一列 ['Duration]，它是 int 数据类型。我现在试图找出 pandas 数据框中最常出现的 ['Duration'] 。持续时间 = (inter['duration'].mode()) 打印（持续时间）

python pandas dataframe type-conversion

回答 1 投票 0

如何将此 pandas.series 结果转换为整数？

我正在做一些问题，但我被困在这个问题上。所以基本上我有一列 ['Duration] 它是 int 数据类型。我现在正在尝试找出 pandas datafr 中最常出现的 ['Duration']...

python pandas dataframe type-conversion

回答 1 投票 0

使用 LRstats() 代替 summarise()，R 错误是“sum(n, na.rm = TRUE) 中的错误：参数的‘类型’（闭包）无效”

我有一个工作任务的示例 R 代码，其中一个代码块包含 summarise()，但 R 不喜欢推荐的 LRstats() 并表示“警告：'summarise' 已弃用。使用 '

r dataframe group-by rowwise

回答 1 投票 0

使用现有和不存在的数据创建并完成条件变量[已关闭]

附资料： id = c (1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2) vm = c("1", "2", "3", "4", "5", "7", "8&qu...

r dataframe group-by conditional-formatting mutate

回答 2 投票 0

如何在数据框中生成一个新列来指示具有积极结果的列？

我有一个数据框，如下所示： ID f_1 f_2 f_3 1 1 0 1 2 0 1 1 3 1 1 0 4 1 0 1 5 0 1 1 我完全不知道如何开始。而且我的原始数据框相当大（...

pandas dataframe

回答 1 投票 0

在 Pandas 数据框中生成一个新列，指示具有积极结果的列

我有一个数据框，如下所示： ID f_1 f_2 f_3 1 1 0 1 2 0 1 1 3 1 1 0 4 1 0 1 5 0 1 1 我完全不知道如何做

pandas dataframe

回答 1 投票 0

使用现有和不存在的数据创建条件变量[已关闭]

附资料： id = c (1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2) vm = c("1", "2", "3", "4", "5", "7", "8&qu...

r dataframe group-by conditional-formatting mutate

回答 2 投票 0

dataframe 相关问题

最新问题