data-science 相关问题

数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖

Python:从数据趋势中查找异常值

请注意,这篇文章不会与 SO 上的以下任何相关文章重复: 查找奇偶校验异常值 Python Python:查找列表中的异常值 使用 z 分数查找异常值 我得到了数据...

回答 2 投票 0

IntCastingNaNError:无法将非有限值(NA 或 inf)转换为整数

在执行此特定代码行时,我收到错误。需要将特定列的字符串数据类型转换为数值 data['性别'] = data['性别'].map( {'男': 1, '女': 0...

回答 1 投票 0

X (Twitter) 使用 twikit 进行网页抓取。如何验证auth_token是否过期?

我正在尝试使用 twikit python lib 来 webscrape X(以前称为 twitter)。 我无法验证 auth_token 是否过期。 这是供您参考的代码片段: 来自 twikit 我...

回答 1 投票 0

Pandas 多索引数据框 - 从多索引中的一个索引中选择最大值

我有一个具有年和月多重索引的数据框,如下所示 | |价值 年|月| | 1 | 3 1992 | 2 | 5 | 3 | 8 | ... | ... 1993 | 1 | 2 ...

回答 2 投票 0

时间序列预测的最佳算法?

我想向您询问一些关于时间序列预测问题的建议。特别是,我必须每天预测某个区域的总需水量,创建一个基于...

回答 1 投票 0

如何编码具有大量类别的项目特征以进行推荐

对于我正在研究的推荐问题,大约有50000个独特品牌和3级产品类别,level_1_cat(50个类别)、level_2_cat(100个类别)和level_3_cat(1000个

回答 1 投票 0

Azure 视频索引器 API:模糊完成后检查模糊作业状态时出现“USER_NOT_ALLOWED”错误

当前权限 我正在使用 Python 中的 Azure 视频索引器 API 来处理视频,特别是索引和模糊它们。虽然索引和模糊过程都成功运行...

回答 1 投票 0

长度参数无效

我想将数据帧的所有列转换为数字格式。 我使用 lapply - 像这样: data.frame(lapply(dat, 数字)) 但我从这段代码中得到一个错误: 长度参数无效 然而...

回答 2 投票 0

如何评估torch.pca_lowrank()返回的PCA的质量?

我使用以下代码: U, S, V = torch.pca_lowrank(A, q=self.n_components) 自身.V = V self.projection = torch.matmul(A, V) 如何计算累积百分比方差或任何其他

回答 2 投票 0

多类问题的 SHAP 图问题

我有以下代码: 从 xgboost 导入 XGBClassifier 导入形状 从 sklearn.preprocessing 导入 LabelEncoder # 对多类分类的标签进行编码 label_encoder = LabelEnco...

回答 1 投票 0

Scikit-fuzzy 出现错误引发 ValueError("意外的输入:" + key)

我的代码 - scikit-fuzzy lib - 2 个输入 - 一个是室内温度,另一个是所需温度。输出 - 锅炉炉内建议的温度。一切以°C为单位。 Pastebin.com/Vz3cMXUk 我真的...

回答 2 投票 0

如何提取一个comlun中特定符号后面的字符串并分成多行?

我的数据在一列中包含最近的基因集,包括它们的基因组区域和链。 我想为从该列中提取的单个基因制作一个新列并将它们分开

回答 1 投票 0

创建 ARIMA 模型时获得直线

我有一个值为 192.405 的风扇速度 (RPM) 数据集(训练+测试值)。我正在训练 ARIMA 模型,并尝试预测数据集的其余未来值并比较结果。 W...

回答 2 投票 0

聚合函数作为参数

我需要写一个函数: def group_and_aggregate_data(df:pd.DataFrame, group_by_column:str, agg_func) -> pd.DataFrame 按城市名称对我的 Excel 数据进行分组并应用 agg_func 传递...

回答 1 投票 0

机器学习中的“适合”是什么?

机器学习中的“适合”是什么?我注意到在某些情况下它是培训的同义词。 有人可以用通俗的语言解释一下吗?

回答 2 投票 0

使用 OpenCv Python 的颜色预测系统

嗨,我是一名初级开发人员,试图制作颜色预测系统,但我遇到了一些我无法理解的错误。我想你可以帮助我......我会与你分享我的

回答 1 投票 0

回归 - 模型整体看起来不错,但 R2 出乎意料地负高

我一直在构建一个包含大约 150 行数据的线性回归模型。我检查了参数与目标变量的相关性,并尝试仅保留它们,因为我的数据较少并且

回答 1 投票 0

如何将横截面数据转换为非相同样本的时间序列数据

我有两个不同年份收集的横截面数据集,每个数据集检查不同的样本。每年,我们都会评估人体测量数据和有关饮食和

回答 1 投票 0

如何比较不同年份的集群?

我有多个数据集,所有数据集的组织方式相似(相同的变量、值等)。我已经使用 KModes 独立分析了数据集,但是,我试图寻找可能发生的趋势......

回答 1 投票 0

如何解决矢量化器不匹配问题

我正在使用 TfidfVectorizer 作为文本矢量化器,但当我尝试获取余弦相似度时遇到尺寸不匹配。 我的情况如下: 首先, def clean_text(文本): 返回...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.