data-science 相关问题

数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖

Scikit-fuzzy 出现错误引发 ValueError("意外的输入:" + key)

我的代码 - scikit-fuzzy lib - 2 个输入 - 一个是室内温度,另一个是所需温度。输出 - 锅炉炉内建议的温度。一切以°C为单位。 Pastebin.com/Vz3cMXUk 我真的...

回答 2 投票 0

如何提取一个comlun中特定符号后面的字符串并分成多行?

我的数据在一列中包含最近的基因集,包括它们的基因组区域和链。 我想为从该列中提取的单个基因制作一个新列并将它们分开

回答 1 投票 0

创建 ARIMA 模型时获得直线

我有一个值为 192.405 的风扇速度 (RPM) 数据集(训练+测试值)。我正在训练 ARIMA 模型,并尝试预测数据集的其余未来值并比较结果。 W...

回答 2 投票 0

聚合函数作为参数

我需要写一个函数: def group_and_aggregate_data(df:pd.DataFrame, group_by_column:str, agg_func) -> pd.DataFrame 按城市名称对我的 Excel 数据进行分组并应用 agg_func 传递...

回答 1 投票 0

机器学习中的“适合”是什么?

机器学习中的“适合”是什么?我注意到在某些情况下它是培训的同义词。 有人可以用通俗的语言解释一下吗?

回答 2 投票 0

使用 OpenCv Python 的颜色预测系统

嗨,我是一名初级开发人员,试图制作颜色预测系统,但我遇到了一些我无法理解的错误。我想你可以帮助我......我会与你分享我的

回答 1 投票 0

回归 - 模型整体看起来不错,但 R2 出乎意料地负高

我一直在构建一个包含大约 150 行数据的线性回归模型。我检查了参数与目标变量的相关性,并尝试仅保留它们,因为我的数据较少并且

回答 1 投票 0

如何将横截面数据转换为非相同样本的时间序列数据

我有两个不同年份收集的横截面数据集,每个数据集检查不同的样本。每年,我们都会评估人体测量数据和有关饮食和

回答 1 投票 0

如何比较不同年份的集群?

我有多个数据集,所有数据集的组织方式相似(相同的变量、值等)。我已经使用 KModes 独立分析了数据集,但是,我试图寻找可能发生的趋势......

回答 1 投票 0

如何解决矢量化器不匹配问题

我正在使用 TfidfVectorizer 作为文本矢量化器,但当我尝试获取余弦相似度时遇到尺寸不匹配。 我的情况如下: 首先, def clean_text(文本): 返回...

回答 1 投票 0

术语“空间”和“时间”在统计学、数据科学或机器学习方面的定义是什么

空间和时间的确切定义是什么?我在很多地方看到人们使用这两个术语,例如空间向量、时间向量、时间因子、空间位置。 我正在寻找

回答 3 投票 0

如何在 Python 中使用列表推导式计算列表中的平方和?

这是提供的数据。 # 按国家估计的扩张成功概率数据 成功估计= { “澳大利亚”:[0.6,0.33,0.11,0.14], “法国”:[0.66,0.78,0.98,0.2], '

回答 3 投票 0

Hadoop:线程“main”中出现异常 java.lang.UnsupportedOperationException:不支持“posix:permissions”作为初始属性

C:\Users\sudha>hadoop jar "C:\hadoop\share\hadoop\mapreduce\hadoop-mapreduce-examples-3.4.0.jar" wordcount /newdir/HadoopSmall.txt /newdir/smallword 我正在使用这个命令来处理单词 co...

回答 1 投票 0

odbcConnectAccess2007(“BD-Embalses.mdb”)中出现错误。 R 安装并加载 RODBC 后找不到函数“odbcConnectAccess2007”

我是数据科学专业的学生,我正在从事一个可视化西班牙水库数据库的项目;但我收到此错误: # 如果需要的话安装包: if(!require("tidyverse&

回答 1 投票 0

获取运行时错误:configs/COCO-Detection/faster_rcnn_R_50_FPN_3x.yaml 在模型动物园中不可用!运行 Detectron2 进行物体检测时

想要通过 Detectron2 Faster_RCNN 模型训练自定义图像数据集。我在 Windows 操作系统中使用 wsl2 ubuntu 终端和 VScode。在我的 train.py 中,我使用“conf...

回答 1 投票 0

尝试在 Geopandas 的同一图中绘制两个具有两个图例的地理数据框

我在与 geopandas 的同一地块中使用多层时遇到了麻烦。我分别成功地绘制了两个图例,但是要绘制两个图例(每个图例一个)我无法绘制。下面是重新...

回答 1 投票 0

Pydoop 在大数据分析和数据科学中的重要性

我是数据科学和大数据框架的新手。 可以说,我有一个 CSV 格式的数据集输入。 我从 Google 和其他资源中发现了有关数据分析师和数据科学家日常工作的信息, 一旦使用...

回答 2 投票 0

XGBoost Python 错误:“标签大小必须等于行数”

我在Python中使用xgboost。 将 pandas 导入为 pd 将 numpy 导入为 np 将 xgboost 导入为 xgb 从 sklearn.model_selection 导入 train_test_split df=pd.read_csv('442.csv') y=df.columnone X=df.列...

回答 3 投票 0

主题建模的评价:如何理解一个一致性值/c_v为0.4,是好是坏? [已关闭]

我需要知道一致性分数为0.4是好是坏?我使用LDA作为主题建模算法。 在这种情况下,平均一致性得分是多少?

回答 3 投票 0

新版本 R 的 gWidgets2RGtk2 问题

我想将 tReasure 工具用于科学目的(https://github.com/jinoklee/tReasure)。完成我的工作对我来说非常重要。但是,我无法安装它,因为它给出了关于 &q 的错误...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.