data-science 相关问题

数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖

如何删除绘图中由“颜色”属性生成的标签

我正在使用plotly.graph_objects来绘制时间序列,但是生成“颜色”属性的标签使用了所有空间。我想知道 update_layout(...

回答 1 投票 0

Keras LSTM - 验证损失从 Epoch #1 开始增加

我目前正在进行我的第一个“真正的”深度学习项目(令人惊讶)预测股票走势。我知道我以 1000:1 的比例去创造任何有用的东西,但我很享受它并希望看到它完成,我已经...

回答 3 投票 0

如何安装Detectron2

我正在安装布局解析器并点击此链接。使用以下软件包没有遇到任何问题。 pip 安装布局解析器 pip install "layoutparser[effdet]" 点安装

回答 3 投票 0

即使使用 IQR 方法删除异常值。异常值仍然存在于数据中

我使用箱线图方法找到了数据中的异常值。 在此处输入图像描述 箱形图 在应用 IQR 方法之前 文件1.形状 # (457, 11) 我已将 IQR 方法应用于数据。 ...

回答 1 投票 0

是否建议对已经one-hot编码的数据进行主成分分析(PCA)

我正在做一个项目,虽然机器学习模型做得还不错,但我觉得还可以更好。该模型可以很好地预测多数类别,但不能很好地预测少数类别。召回和

回答 1 投票 0

数值变量和分类变量之间的逻辑回归偏差方差

我为客户流失数据集拟合了逻辑回归模型,结果如下 对数结果 我用验证集测试了这个模型并计算了 ROC AUC 分数,这是

回答 1 投票 0

如何使用 Python 将多个 CSV 文件合并为一个大 CSV 文件 [重复]

我有一个 zip 文件,其中包含 70 多个 csv 文件。我想将所有这些文件中的信息合并到一个大的 csv 文件中。在python中使用append方法会花费很长时间,因为我会...

回答 1 投票 0

Python Polars 如何根据行条件过滤列

根据列中的值过滤(排除列)极坐标数据帧的正确方法是什么? 例如: Polars_df.std() 输出: col_1 (f64) col_2 (f64) 20242.888632 0.0 # 不...

回答 2 投票 0

如何将这些函数转换为作用于整个数据框并加速我的Python代码

为了对被广泛讨论的交易方法(称为“智能货币概念”)进行回溯测试,我制作了一个包含一些函数的 Python 类。 现在,我犯的错误是让每个功能都运行......

回答 1 投票 0

pandas 的最小浮点数据类型/最小化变换大小

我有一个包含 17000 列和 50000 行整数值(~1 GB)的数据框。 我将数据帧的每一列除以列的总和(例如,标准化数据)。 我需要指定

回答 1 投票 0

文本分类中处理不均匀数据的最佳方法

我正在尝试使用 sklearn 和 Python 对一些文本数据(推文)运行文本分类模型。我已经手工编码了近 1,500 个案例,但是数据不平衡。 案例按主题进行编码。一个...

回答 1 投票 0

如何构建多输出回归模型的目标变量?

我想使用 XGBoost 构建一个多输出模型,其中输出是联系客户时的预测销售,例如: 输出 1 是联系后的预测销售,并且 输出2是预测...

回答 1 投票 0

SVM 问题 - 名称“model_SVC”未定义

我的代码有问题: 从 sklearn 导入 svm model_SVC = SVC() model_SVC.fit(X_scaled_df_train, y_train) svm_prediction = model_SVC.predict(X_scaled_df_test) 错误

回答 3 投票 0

有没有其他方法(将一列的值组合到不同的组中),而不是在下面的问题中多次使用 'df.replace( )' ?

在: char_df['Loan_Title'].unique() 出去: array(['债务合并', '信用卡再融资', ‘家装’、‘信用整合’、‘绿色贷款’、‘其他’、 '搬家和重新安置...

回答 1 投票 0

(简单,但奇怪)循环遍历大型 JSON 数据文件 JS、Python 时出现问题[重复]

上下文 您好,我有一个 JSON 文件,其中包含与此类似的对象列表: [{ “科迪戈”:“01”, "描述":"Animais vivos.", “Data_Inicio”:“01/04...

回答 1 投票 0

我在尝试运行作业时遇到启动错误

因此,我尝试在 AWS 上运行作业,但每次运行都会失败,并收到以下错误: 我不确定该去哪里查看或问题出在哪里。我是新人,仍在学习,请指导

回答 1 投票 0

计算 K 折交叉验证的准确率、精确率、召回率、f1 分数

这是我用Python编写的代码,用于计算K-Fold交叉验证的准确度、精确度、召回率、f1分数。在我的代码中,我总结了我的每一个准确率、召回率等。然后我将其除以n_folds。 ...

回答 1 投票 0

在 pd 数据框中转换为 2d 数组后,3d 数组图像缺少蓝色值

我正在尝试编写一个Python代码,将3d数组图像转换为格式为“RGB(r,g,b)”的2d数组并将它们插入到pd数据帧中,一切正常,我有一个...

回答 1 投票 0

用于机器学习算法的 csv 流

我有一个很大的 CSV 文件(大约 5GB)。 我试图逐行读取整个文件,并尝试应用最典型的算法(SVM、朴素贝叶斯、线性回归等)。 将 numpy 导入为 np 导入

回答 2 投票 0

如何使用 matplotlib.pylot.stackplot() 在堆栈图中添加数据标签?

我目前正在学习如何在 MatPlotLib 中创建不同的绘图。到目前为止,我可以创建一个基本的堆栈图,但我想知道是否可以在数据值上添加标签。 下面是我的代码: `举个例子

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.