dataframe 相关问题

数据框是表格数据结构。通常，它包含数据，其中行是观察值，列是各种类型的变量。虽然“数据框架”或“数据框架”是这个概念用于多种语言的术语（R，Apache Spark，deedle，Maple，Python中的pandas库和Julia中的DataFrames库），“table”是用于的术语MATLAB和SQL。

丢弃数据框中具有字符串值的行

我有一个像这样的数据框： C1 C2 C3 C4 1 富自闭症谱系障碍 23 富富自闭症谱系障碍 43 3 富自闭症谱系障碍 1 4 富自闭症谱系障碍酒吧我正在尝试过滤（并丢弃）C1 或 C4 列中包含字符串的所有行，我的最终数据...

python pandas dataframe

回答 1 投票 0

按列分组并根据值将值分散到多个列中[重复]

我想执行一项操作，根据另一列中的相同值将列中的值扩展到新列。请参阅下面的示例将 pandas 导入为 pd pd.DataFrame({'A': ['a', 'a', 'b',...

python pandas dataframe

回答 1 投票 0

如何在R数据框中用增量值替换零？

我有一个数据集，我想用递增值替换每个零：第一个零变为 0.001，第二个 0.002，第三个 0.003，依此类推。每次出现零时，它都会增加......

r dataframe replace tidyverse zoo

回答 3 投票 0

使用 Pandas 在列之间进行样条插值时遇到问题

我有以下数据框索引 Flux_min New_Flux Flux_max 0 0 0.550613 南 0.537315 1 1 0.656621 南 0.620647 2 2 0.756486 ...

python pandas dataframe interpolation spline

回答 2 投票 0

Pandas eval() 嵌套自定义函数与算术运算符和 pandas 包装器具有不同的行为

简介：我尝试将“嵌套”自定义函数与 pandas.eval() 一起使用，但我收到一些带有算术运算符的 AttributeError，请参阅最后的问题。我用 Dataf 得到了相同的结果...

python python-3.x pandas dataframe

回答 2 投票 0

使用单元格值的字典以并行方式更新极坐标数据框中的每个单元格？

我有一个像这样的数据框： test_df = pl.DataFrame( { “row_id”：[“a”，“b”，“c”，“d”，“e”，“f”]， “s1&...

dataframe python-polars

回答 1 投票 0

重命名列，但在 R 中的 ggplot 2 中保持相同的排序

我有一个名为 df 的数据框，包含 2 个字符变量和一个双精度变量。我试图解决的问题的最初问题是这里。简而言之，我试图在每个方面对 de...

r dataframe ggplot2

回答 1 投票 0

为什么Pandas的replace()方法不起作用？

我试图将 df 中的所有列替换为整数的价格，但是由于某种原因，replace() 方法不起作用： df = pd.read_csv(f_name, dtype="string") df = df[df.columns.dro...

python python-3.x pandas dataframe replace

回答 1 投票 0

如何使用 pyspark 分解数据框中的逗号分隔值

我有如下数据： ID ID1 ID2 32336741 ["32361087"] ["36013040"] 32290433 [“32...

python dataframe pyspark

回答 1 投票 0

通过截止值根据子列表分割数据帧

我想根据将列表分为多个部分给出的子列表来分割数据帧，其中高于截止值的唯一值是第一个。例如截止值 = 3 [4,2,3,5,2,1,6,7] => [4,2,3], [...

python dataframe python-polars

回答 1 投票 0

将数据帧转换为矩阵并创建和弦图

我正在尝试创建一个和弦图，如下图所示。在这里，您可以看到 TRAV 的哪些值（例如 TRAV21、TRAV1-2 等）与 TRBV 的值（例如 TRBV6-4、TRBV6-1 ec）相匹配，

r dataframe matrix rstudio

回答 1 投票 0

R 中的数据帧操作 - 选择某些值

我有以下问题找不到答案：我有一个看起来像这样的 df： id x1_t1 x1_t2 x1_t3 y1_t1 y1_t2 y1_t3 1 1 0 0 0 100 110 150 2 2 0 0 1...

r dataframe dplyr data-manipulation

回答 1 投票 0

如何将 R Studio 3 变量数据框绘制成热图？

我目前正在R中做一个项目，并且有这个数据框：拉德夫 nseg 均值 loglr 1 27 16.64982 2.163818549 2 18 15.49226 0.524823313 3 22 23.85373 0.570587756 我想要...

r dataframe ggplot2 heatmap

回答 1 投票 0

计算行中的元素并在 pandas 中创建列计数器

我创建了以下 pandas 数据框：将 pandas 导入为 pd ds = {'col1' : ['A','A','B','C','C','D'], 'col2' : ['A','B','C','D','D','A']} df = pd.DataFrame(数据=ds) 数据框...

pandas dataframe count record calculated-columns

回答 1 投票 0

如何制作新的 pandas DataFrame，其中列作为旧的索引_列对

我有两个 pandas DataFrame： object_1df = pd.DataFrame([['a', 1], ['b', 2]], 列=['字母','数字']) object_2df = pd.DataFrame([['b', 3, '猫'], ['c', 4, '狗']], ...

python pandas dataframe

回答 1 投票 0

水平匹配 R 中的两个 ggplots

我在 R.g1 和 g2 中有两个图。图书馆（dplyr）库（ggplot2）库（forcats） set.seed(123) # 设置种子以实现可重复性 level_country = c('美国', '英国', '法国', '德国') 国家 = s...

r dataframe ggplot2

回答 1 投票 0

pandas 使用正则表达式模式重命名多个列

我有一个如下所示的数据框 ID、US-测试1、US-测试2、US-测试3 1,11,12,13 2,13,16,18 3,15,19,21 我想从我的所有列名称中删除关键字 US - 我尝试了下面的方法，但是......

python pandas dataframe numpy series

回答 2 投票 0

ValueError：NaTType 不支持 strftime

在重置索引之前，我尝试使用 dropna 方法删除缺少“日期”值的行，然后出现 KeyError： df.set_index('日期', inplace=True) df = df. Between_time(

pandas dataframe

回答 1 投票 0

从大型数据帧中删除大量 ID 需要很长时间

我有两个数据框 df1 和 df2 打印（df1.形状） (1042009, 40) 打印（df1.列） Index(['date_acte', 'transaction_id', '金额', ...], dtype='对象') 打印（df2.形状） (734738, 37) 原则...

python pandas dataframe contains

回答 1 投票 0

有没有办法在tbl中使用reshape？

在上一个问题中，我在使用重塑时遇到了问题：重塑错误 - 无效的“row.names”长度几个小时后我意识到这是因为我使用的是 tbl 格式而不是 data.frame。所以要使用

r dataframe dplyr reshape

回答 2 投票 0

dataframe 相关问题

最新问题