pandas 相关问题

Pandas是一个用于数据处理和分析的Python库,例如统计数据,实验科学结果,计量经济学或金融学中常见的数据框架,多维时间序列和横截面数据集。 Pandas是Python中主要的数据科学库之一。

在 pandas 数据框的箱线图上显示数据点

我正在模拟论文的结果,需要在 pandas 数据框的箱线图上显示数据点。对应论文的图片是这样的: 我尝试使用 df.boxplo 绘制箱线图...

回答 1 投票 0

使用 on_conflict_do_update 在 upsert 中添加列

我正在尝试在使用 on_conflict_do_update 进行更新插入时在更新中添加时间戳列,updated_at。以下是我当前的实现,但在运行时遇到以下错误...

回答 1 投票 0

我怎样才能消除pandas关于在pivot_tables中使用aggfunc=np.sum的抱怨?

我最近将我的 pandas 从 v1.x 升级到了 v2.x。 但是,使用数据透视表执行合理操作的代码会生成一组令人讨厌的未来警告。 (Pdb) df = pd.DataFrame([["a",...

回答 1 投票 0

我怎样才能消除pandas关于在pivot_tables中使用aggfunc=sum的抱怨?

我最近将我的 pandas 从 v1.x 升级到了 v2.x。 但是,使用数据透视表执行合理操作的代码会生成一组令人讨厌的未来警告。 (Pdb) df = pd.DataFrame([["a",...

回答 1 投票 0

如何有效地从数据集中删除重叠的圆圈

我有一个包含约 20,000 条记录的数据集,代表人口超过 20,000 的全球城市。我估计了半径,或多或少描述了城市的大小。不太准确...

回答 1 投票 0

如何有效地将所有非对角线元素乘以 pandas DataFrame 中的常量?

我有一个存储为 pandas DataFrame 的平方成本矩阵。行和列表示位置 [i, j],我想将所有非对角线元素(其中 i != j)乘以常数 c,而不使用...

回答 1 投票 0

对 pandas 列中的值进行分组

我有一个 pandas 数据框,其中包含分数,例如 分数 0.1 0.15 0.2 0.3 0.35 0.4 0.5 ETC 我想将这些值分为 0.2 组 因此,如果分数介于 0.1 或 0.2 之间,则该值...

回答 2 投票 0

解析列值并将第一部分保存在新列中

我需要解析数据框中的列值,并将第一个解析的部分保存在新列中,如果它有像“-”这样的解析分隔符(如果不将其留空) raw_data = {'名称':['威拉德...

回答 1 投票 0

如何在 Pandas 数据框中添加索引的列名称

这是关于 Pandas 数据框的。我有一个通过以下 python 代码制作的数据框。 df_test = pd.DataFrame(np.arange(12).reshape(3, 4), 列=['col_0','col_1','col_2','col_3'], 索引=['row_0', '...

回答 2 投票 0

Pandas HTML 生成,可重现的输出

我正在使用此代码将 Pandas 数据框编写为 HTML 将 pandas 导入为 pd df = pd.DataFrame({ "a": [1] }) 打印(df.style.to_html()) 我运行了一次,它产生了这个输出 <question vote="1"> <p>我正在使用此代码将 Pandas 数据框编写为 HTML </p> <pre><code>import pandas as pd df = pd.DataFrame({ &#34;a&#34;: [1] }) print(df.style.to_html()) </code></pre> <p>我运行了一次,它产生了这个输出</p> <pre><code>&lt;style type=&#34;text/css&#34;&gt; &lt;/style&gt; &lt;table id=&#34;T_f9297&#34;&gt; &lt;thead&gt; &lt;tr&gt; &lt;th class=&#34;blank level0&#34; &gt;&amp;nbsp;&lt;/th&gt; &lt;th id=&#34;T_f9297_level0_col0&#34; class=&#34;col_heading level0 col0&#34; &gt;a&lt;/th&gt; &lt;/tr&gt; &lt;/thead&gt; &lt;tbody&gt; &lt;tr&gt; &lt;th id=&#34;T_f9297_level0_row0&#34; class=&#34;row_heading level0 row0&#34; &gt;0&lt;/th&gt; &lt;td id=&#34;T_f9297_row0_col0&#34; class=&#34;data row0 col0&#34; &gt;1&lt;/td&gt; &lt;/tr&gt; &lt;/tbody&gt; &lt;/table&gt; </code></pre> <p>但是当我稍后再次运行相同的程序时,它给出了</p> <pre><code>&lt;style type=&#34;text/css&#34;&gt; &lt;/style&gt; &lt;table id=&#34;T_d628d&#34;&gt; &lt;thead&gt; &lt;tr&gt; &lt;th class=&#34;blank level0&#34; &gt;&amp;nbsp;&lt;/th&gt; &lt;th id=&#34;T_d628d_level0_col0&#34; class=&#34;col_heading level0 col0&#34; &gt;a&lt;/th&gt; &lt;/tr&gt; &lt;/thead&gt; &lt;tbody&gt; &lt;tr&gt; &lt;th id=&#34;T_d628d_level0_row0&#34; class=&#34;row_heading level0 row0&#34; &gt;0&lt;/th&gt; &lt;td id=&#34;T_d628d_row0_col0&#34; class=&#34;data row0 col0&#34; &gt;1&lt;/td&gt; &lt;/tr&gt; &lt;/tbody&gt; &lt;/table&gt; </code></pre> <p>我希望每次都能得到相同的输出。 也就是说, <pre><code>T_f9297</code></pre> 和 <pre><code>T_d628d</code></pre> 标识符从一次运行到下一次运行不应发生变化。 我怎样才能得到它?</p> <p>我相信我可以生成没有任何 CSS 样式和标识符的 HTML,但我确实想要 CSS(我只是在示例中省略了它)并且我很高兴拥有标识符,只要我得到相同的输出相同的输入数据。</p> <p>我正在使用Python 3.11.7和Pandas 2.1.4。</p> </question> <answer tick="false" vote="1"> <p><a href="https://pandas.pydata.org/docs/reference/api/pandas.io.formats.style.Styler.to_html.html" rel="nofollow noreferrer"><pre><code>pandas.io.formats.style.Styler.to_html</code></pre></a>有一个<pre><code>table_uuid</code></pre>参数,您可以设置该参数以确保每次都相同:</p> <pre><code>print(df.style.to_html(table_uuid=&#34;my_table_id&#34;)) </code></pre> <p>输出:</p> <pre><code>&lt;style type=&#34;text/css&#34;&gt; &lt;/style&gt; &lt;table id=&#34;T_my_table_id&#34;&gt; &lt;thead&gt; &lt;tr&gt; &lt;th class=&#34;blank level0&#34; &gt;&amp;nbsp;&lt;/th&gt; &lt;th id=&#34;T_my_table_id_level0_col0&#34; class=&#34;col_heading level0 col0&#34; &gt;a&lt;/th&gt; &lt;/tr&gt; &lt;/thead&gt; &lt;tbody&gt; &lt;tr&gt; &lt;th id=&#34;T_my_table_id_level0_row0&#34; class=&#34;row_heading level0 row0&#34; &gt;0&lt;/th&gt; &lt;td id=&#34;T_my_table_id_row0_col0&#34; class=&#34;data row0 col0&#34; &gt;1&lt;/td&gt; &lt;/tr&gt; &lt;/tbody&gt; &lt;/table&gt; </code></pre> </answer> </body></html>

回答 0 投票 0

使用DuckDB查询类成员变量

我有一个带有 API 的代码库,用于传递 SQL 查询以运行执行,但相同的 API 不提供传递变量的方法。这意味着我无法在与...

回答 1 投票 0

按月平均值和标准差进行分组和滚动

数据= {'A':列表(范围(250)),'B':列表(范围(251,501))} 日期 = pd.date_range('2023-01-17', period=250, freq='D') df = pd.DataFrame(数据,索引=日期) 我想要滚动 2 个日历月,如下所示...

回答 1 投票 0

具有多个 alpha 值的 Pandas 条形图

我正在尝试创建一个具有不同时间序列的 alpha 透明度值的条形图。 我认为下面的代码会给我这个,正如我在其他地方看到的那样,列表可以通过 alpha kwar 传递......

回答 1 投票 0

对 Pandas 系列切片进行排序,包括索引

我有以下df系列 一个 1 乙4 丙3 d 2 并想对最后三行(包括索引)进行排序。 df[1:] = df[1:].sort_values 给出 一个 1 乙2 丙3 d 4 哪只母鹿...

回答 1 投票 0

Python 中的时间序列预测

我想预测当X(天)代表时间时变量Y(c_start)的下一个值。 正如您在图片中看到的,我有属性“c_start”的值,我想...

回答 1 投票 0

有没有更好的方法将两个 SQL 查询中的两个 DataFrame 合并到一个 DataFrame 中?

目前我正在查询 SQL 数据库中的两个单独的表——一个是我从 my_table 获取“数据”,另一个是我从配置表获取“单位”。单位

回答 1 投票 0

在另一个数据帧中的日期之间过滤 pandas 数据帧

假设我有两个 pandas 数据框:第一个数据框包含一些跨代码和时间的数据(反映在下面示例中的 Col1 和 Col2 列中)。 第二个数据框详细说明了一组日期 bo...

回答 1 投票 0

计算Python中最后一个非零条目的累积和

我有一个数字系列,例如 [0,0,0,0,1,1,1,0,0,1,1,0]。我想计算最后一个非零值的数字总和。即一旦发生零输入,累积和将重置为零。 输入...

回答 2 投票 0

为什么 pandas.merge_asof 在我的例子中出现错误?

我正在尝试使用 pandas.merge_asof 合并 2 个表。 第一个表administrators_system_with_schemes_sort: 沙龙_id 员工编号 日期 872646 2715596 2024-10-02 00:00:00 872646 2715596 2024-10-03 00:0...

回答 1 投票 0

将 pandas Excel Dataframe 复制到剪贴板,不带索引标题

我有一个 Excel 文件,我必须将一些数据子集复制到剪贴板,以便我可以将其粘贴到任何地方。我正在使用 pandas DataFrame.to_clipboard(excel=True, sep=None, **kwargs) 有趣...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.