数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖
我正在使用plotly.graph_objects来绘制时间序列,但是生成“颜色”属性的标签使用了所有空间。我想知道 update_layout(...
Keras LSTM - 验证损失从 Epoch #1 开始增加
我目前正在进行我的第一个“真正的”深度学习项目(令人惊讶)预测股票走势。我知道我以 1000:1 的比例去创造任何有用的东西,但我很享受它并希望看到它完成,我已经...
我正在安装布局解析器并点击此链接。使用以下软件包没有遇到任何问题。 pip 安装布局解析器 pip install "layoutparser[effdet]" 点安装
我使用箱线图方法找到了数据中的异常值。 在此处输入图像描述 箱形图 在应用 IQR 方法之前 文件1.形状 # (457, 11) 我已将 IQR 方法应用于数据。 ...
是否建议对已经one-hot编码的数据进行主成分分析(PCA)
我正在做一个项目,虽然机器学习模型做得还不错,但我觉得还可以更好。该模型可以很好地预测多数类别,但不能很好地预测少数类别。召回和
我为客户流失数据集拟合了逻辑回归模型,结果如下 对数结果 我用验证集测试了这个模型并计算了 ROC AUC 分数,这是
如何使用 Python 将多个 CSV 文件合并为一个大 CSV 文件 [重复]
我有一个 zip 文件,其中包含 70 多个 csv 文件。我想将所有这些文件中的信息合并到一个大的 csv 文件中。在python中使用append方法会花费很长时间,因为我会...
根据列中的值过滤(排除列)极坐标数据帧的正确方法是什么? 例如: Polars_df.std() 输出: col_1 (f64) col_2 (f64) 20242.888632 0.0 # 不...
如何将这些函数转换为作用于整个数据框并加速我的Python代码
为了对被广泛讨论的交易方法(称为“智能货币概念”)进行回溯测试,我制作了一个包含一些函数的 Python 类。 现在,我犯的错误是让每个功能都运行......
我有一个包含 17000 列和 50000 行整数值(~1 GB)的数据框。 我将数据帧的每一列除以列的总和(例如,标准化数据)。 我需要指定
我正在尝试使用 sklearn 和 Python 对一些文本数据(推文)运行文本分类模型。我已经手工编码了近 1,500 个案例,但是数据不平衡。 案例按主题进行编码。一个...
我想使用 XGBoost 构建一个多输出模型,其中输出是联系客户时的预测销售,例如: 输出 1 是联系后的预测销售,并且 输出2是预测...
我的代码有问题: 从 sklearn 导入 svm model_SVC = SVC() model_SVC.fit(X_scaled_df_train, y_train) svm_prediction = model_SVC.predict(X_scaled_df_test) 错误
有没有其他方法(将一列的值组合到不同的组中),而不是在下面的问题中多次使用 'df.replace( )' ?
在: char_df['Loan_Title'].unique() 出去: array(['债务合并', '信用卡再融资', ‘家装’、‘信用整合’、‘绿色贷款’、‘其他’、 '搬家和重新安置...
(简单,但奇怪)循环遍历大型 JSON 数据文件 JS、Python 时出现问题[重复]
上下文 您好,我有一个 JSON 文件,其中包含与此类似的对象列表: [{ “科迪戈”:“01”, "描述":"Animais vivos.", “Data_Inicio”:“01/04...
因此,我尝试在 AWS 上运行作业,但每次运行都会失败,并收到以下错误: 我不确定该去哪里查看或问题出在哪里。我是新人,仍在学习,请指导
这是我用Python编写的代码,用于计算K-Fold交叉验证的准确度、精确度、召回率、f1分数。在我的代码中,我总结了我的每一个准确率、召回率等。然后我将其除以n_folds。 ...
在 pd 数据框中转换为 2d 数组后,3d 数组图像缺少蓝色值
我正在尝试编写一个Python代码,将3d数组图像转换为格式为“RGB(r,g,b)”的2d数组并将它们插入到pd数据帧中,一切正常,我有一个...
我有一个很大的 CSV 文件(大约 5GB)。 我试图逐行读取整个文件,并尝试应用最典型的算法(SVM、朴素贝叶斯、线性回归等)。 将 numpy 导入为 np 导入
如何使用 matplotlib.pylot.stackplot() 在堆栈图中添加数据标签?
我目前正在学习如何在 MatPlotLib 中创建不同的绘图。到目前为止,我可以创建一个基本的堆栈图,但我想知道是否可以在数据值上添加标签。 下面是我的代码: `举个例子