数据分析涉及从原始数据中提取意义和见解。它涉及检查,清理,转换和建模数据以获得结论的方法和算法。
在 panda 数据框中使用“groupby”和“Grouper”对日期时间对象值进行分组时出错
我在尝试根据年份对包含日期的列进行分组时遇到以下错误。 我已将列转换为日期时间对象并尝试了 groupby 和 Grouper 方法,但是 fa...
我想制作一个闪亮的应用程序,显示巴西南里奥格兰德州牛随时间的感染流行情况。 我可以让绘图工作,并在
带有自动化 HTML/CSS 的 Python 数据分析仪表板
我正在寻找一个Python数据分析仪表板,它不需要我硬编码html/css,而是自己处理所有事情,有点像R闪亮应用程序。 据我所知,Voila、Bokeh 和 D 都不知道...
有人可以帮我找出从 zip 文件夹中提取和合并 csv 文件的代码有什么问题吗? [已关闭]
# 查找具有相关关键字(VTE、CLI、ART)的 ZIP 文件的功能 def find_zip_files(month_folder_path): zip_files = {“vte”:无,“cli”:无,“art”:无} #
导入操作系统 导入压缩文件 将 pandas 导入为 pd 查找带有相关关键字(VTE、CLI、ART)的 ZIP 文件的功能 def find_zip_files(month_folder_path): zip_files = {“vte”:无,“cli&
我想使用类似于以下问题的极坐标将特定函数应用于特定列: 在特定数据框列上应用名称实体识别 以上问题适用于
我正在听一个讲座,其中我们使用非参数测试(特别是 Wilcoxon 测试)进行了 A/B 测试。导师提到可以使用以下代码来检查不同...
我正在编写一个使用 Pandas 来分析事件数据的 Python 脚本。我的目标是计算活动事件的交集。 如果相同的事件不发生两次,我的代码就可以正常工作。但是,如果...
我有一个包含月份和销售额的数据框。如果某人连续 3 个月的销售额达到 250 笔,他们就会获得奖金。 一旦确定了奖金月份,计数器就会重置并开始计算接下来的 3
我试图从确实的网站上抓取数据,并想首先创建一个转换函数来查找所有具有此部分的 div 并返回长度: 我的代码不断返回零...
如何使用 Pandas 在 Python 中高效处理大型数据集?
我正在使用 Pandas 库在 Python 中处理大型数据集(大约 100 万行),并且在执行过滤和聚合等操作时遇到性能问题...
我想在 vs code 的数据分析项目中使用 pyodide 包,但我无法安装这个包,我需要帮助 我尝试运行 pip install pyodide 但遇到这个问题: 正在收集
使用 DAX 创建 COUNTS 汇总表,允许进行全局过滤器
我有下表: 产品 地区 代表 月 REG-YH-67 北 简 六月 REG-YH-67 北 简 行进 REG-YH-67 北 简 十二月 REG-YH-89 北 简 九月 REG-YH-67 失控 一月...
我想知道是否可以通过 Excel 公式、宏或 Power Query 自动执行一些精确的数据清理。 假设我是一名牙医,有一份包含所有患者及其就诊日期的电子表格,包括...
我如何合并三个表格 - 同一队列使用的 2 个单独的调查问卷和一张包含血液结果的表格
我有一项研究结果,查看甲状腺功能的一些血液结果以及研究开始和结束时的问卷。我希望能够在 rstudio 中独立分析结果...
我正在尝试格式化来自 Faker API 的虚假数据。我正在使用 pandas 将其存储到数据框中。我已经弄清楚如何删除和替换任何错误,例如没有间距、间距不当、删除
我试图将两个数据集合并成一种易于理解的格式。 作为我的要求的一个例子,假设我经营一家动物育种机构。 首先是动物饲养员的名单,
我想进入数据分析领域并拥有扎实的Python基础知识。然而,我从很多人那里了解到,这个过程要求你先学习 Excel 和 SQL,然后再学习
我是数据分析新手,但我有一个关于天气的项目。我正在处理一组新数据(尚未清理),并且我注意到某些值被错误地输入为零(0)...
我有一个这样的样本数据: 0 46X ⌀ 376_ 000 直通 1 个插槽 ⌀250 X .750 LG ↧.03 2 -2X .250-20-UNC-2B ↧....