data-mining 相关问题

数据挖掘是分析大量数据以查找模式和共性的过程。

数据挖掘中的Apriori算法 - 如何解决Python中有关TransactionEncoder()的TyperError?

我正在尝试将 apriori 算法合并到 python 程序中,但是“te_ary = te.fit(dataset).transform(dataset)”行出现 TypeError。我相信这与事实有关

回答 1 投票 0

这个python代码的输出不是我所期望的

我是一名新的 CE 学生,我想制作一个 python 程序,从文本文件中读取输入并在文本文件中给出输出。 在这个程序中,我希望它逐行获取输入,然后...

回答 1 投票 0

为什么当所有列都是 float64 和 int64 时 dtype: object

打印(cleaned_train.dtypes) 打印(” - ”) 打印(cleaned_test.dtypes) 观察年份 int64 保险期间 float64 住宅 int64 Building_Painted float64

回答 1 投票 0

用于创建红色边界框的数据注释工具

我工作的数据注释公司正在使用 MS-Paint 在图像中的对象周围制作红色边框。 问题是在 MS-

回答 2 投票 0

特征选择-提取使用Ngram和TF-IDF

我是数据挖掘新手,我使用ChatGPT来解决我的问题。我不明白哪里有错误。乍一看,一切似乎都是正确的。如果您能帮助我,我会很高兴...

回答 1 投票 0

Scrape 公司在 Google 地图上开门和关门时间

我正在尝试使用 selenium python 获取 Google 地图公司的开门和关门时间。 下面给出了一个示例链接: https://www.google.com/maps/place/Solar+Project+Development+%26+Engineeri...

回答 1 投票 0

Python as_strided 方法,它是如何工作的?

我正在尝试在我的一项作业中进行一些异常检测,并且正在尝试创建滑动窗口,但我想让它们使一个窗口不与另一个窗口重叠。例如 ...

回答 1 投票 0

Sklearn 具有可分离 Nu 参数的一类 SVM

Sklearn (OneClassSVM) 现有的一类分类 (OCC) 模型实现有一个参数 (Nu),用于处理训练误差的上限和支持的下限

回答 1 投票 0

预测客户意图

我得到了这个前景数据集: 公司ID_行业公司_规模DMU_最终加入_日期国家 65656 金融和保险 10 最终用户 2010-04-13 法国 54535 公共

回答 1 投票 0

如何修复在 Weka 中打开 CSV 时出现的“索引越界”错误?

错误信息 我无法在 weka 中打开此数据集文件 https://www.kaggle.com/datasets/parisrohan/credit-score-classification?resource=download 因为我收到此错误:索引 28 超出范围

回答 2 投票 0

我正在尝试为集合向量创建一个累加器函数。但我不断得到奇怪的结果

基本上,我有一个集合向量。我想根据某个条件合并集合(您可以在 if 语句中看到此条件)。可以合并两个以上的集合。这是一个示例数据集:...

回答 1 投票 0

在 K 均值聚类肘部图中找到正确的值

使用 k 均值算法,我需要确定要作为输入传递的 k 值。为此,我决定使用肘部图来获得以下图表: 获得的惯性值是

回答 1 投票 0

sample.int(m, k) 中的错误:无法获取大于总体的样本

首先,我要说的是,我对机器学习、kmeans 和 r 相当陌生,这个项目是一种了解更多相关知识的方法,也是向我们的 CIO 展示这些数据的一种方法,这样我就可以在开发...

回答 2 投票 0

如何在 R 中复制 Python 的 matplotlib 绘图?

我有一个使用 matplotlib 的 Python 代码,它可以绘制 DataFrame 中的数据: 将 matplotlib.pyplot 导入为 plt dataframe_name.plot(图大小=(20,10)) plt.show() 下面是 Python 代码的输出: 我是

回答 1 投票 0

使用Python打印PDF文件中的所有对象

我想列出 PDF 文件中存在的所有对象:文本块、图像、字体、页面对象,还有矢量形状(如果有)。 我希望用 PyMuPDF 看到所有这些: 导入 fitz # pip install Py...

回答 4 投票 0

将 Python 数据帧操作代码转换为 R

我在 Python 中有一个数据帧操作,我正在尝试将其转换为 R。但是,我在 R 翻译方面遇到了问题。 col_names = China_2.columns 省份 = col_names[0] 天=

回答 1 投票 0

如何调整这个DBSCAN算法python

我正在使用这种聚类算法对纬度和经度点进行聚类。我正在使用 http://scikit-learn.org/stable/auto_examples/cluster/plot_dbscan.html 中给出的预先编写的代码。 代码是...

回答 2 投票 0

ValueError:目标大小 (torch.Size([555, 3])) 必须与输入大小相同 (torch.Size([2, 3, 320, 320]))

def train_loop(数据加载器,模型,loss_fn,优化器,设备): 大小 = len(dataloader.dataset) 模型.train() 对于批处理,枚举(dataloader)中的(X,y): # 将数据移动到同一个d...

回答 2 投票 0

k-means聚类算法的实现

在我的程序中,我对 k-mean 算法采用 k=2,即我只需要 2 个簇。 我已经以非常简单直接的方式实现了,但我仍然无法理解为什么我的程序变得......

回答 5 投票 0

如何从 Instagram 获取自然语言数据?我应该使用官方API还是使用数据抓取方法更好?

我正在开展一个数据分析项目,研究 Instagram 上波斯语用户中有毒男性气质的兴起。我有一个直接的方法从 Twitter 获取数据并且能够......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.