数据挖掘是分析大量数据以查找模式和共性的过程。
我如何正确设置“random_state”以使我的结果始终相同? (蟒蛇,sklearn)
如果我有以下代码片段: knn = KNeighborsClassifier() grid_search_knn = GridSearchCV( 估计量=knn, n_职位=-1 ) 我必须这样设置吗 1.: knn =
文本分类+NLP+数据挖掘+数据科学:在应用tf-idf之前我应该停止词删除和词干提取吗?
我正在研究文本分类问题。问题解释如下: 我有一个事件数据集,其中包含三列 - 事件名称、事件描述、
我正在尝试使用R树实现DBSCAN。我们可以以R树的形式存储数据。所以我的问题是如何在R树中存储实时数据以及我应该如何实现区域查询来查找
我正在使用 DBSCAN 等聚类算法。 它返回一个名为 -1 的“簇”,这些点不属于任何簇。对于这些点,我想确定从它到新点的距离...
如何在 Android 应用程序中使用 ML 模型 [已关闭]
我的毕业项目是关于使用数据挖掘技术或ML模型从数据集(而不是API)预测Covid-19的android应用程序,其中会有一部分供用户按地区搜索......
我目前正在开发一个网络爬虫,每次我尝试单击或尝试使用它获取某个链接按钮的href时,它绝对不会给我任何东西。 然而,我尝试过,我必须指出...
我目前正在开发一个网络爬虫,每次我尝试单击或尝试使用它获取某个链接按钮的href时,它绝对不会给我任何东西。 然而,我尝试过,我必须指出...
rapidminer 可以从 URL 列表中提取 xpath,而不是先保存 HTML 页面吗?
我最近发现了RapidMiner,我对它的功能感到非常兴奋。但是我仍然不确定该程序是否可以帮助我满足我的特定需求。我希望程序能够抓取 xpath mat...
我想创建类似于下图的有吸引力的信息图表或流程图? 能给我介绍一下软件、工具、人工智能、在线网站吗? 这些是由视频制作者或创作者创建的吗? 做...
我有一本字典,其中键作为频繁项集,值作为该项集的支持。现在,我想生成所有可能的关联规则(X --> Y)。我怎样才能做到这一点?有没有内置的p...
我想在Weka 3.8.6中运行apriori算法后得到每行生成规则的前提和结果。 `apriori.setNumRules(NUMBER_OF_RULES); apriori.setMinMetric(
我有一个道路事故数据集,我想分析这个数据集。但我在数据类型方面遇到了困难,因为数据集中的所有数据类型都是浮点数,但数据是整数或分类数据。 伤亡 年龄 1.0 22.0 ...
我想在Weka 3.8.0中运行apriori算法后得到每行生成规则的前提和结果。 apriori.setNumRules(NUMBER_OF_RULES); 先验。
Orange Data Mining 中的“特征构造函数”小部件消失了
我在 Orange 数据挖掘文档中看到有一个名为“功能构造函数”的小部件,但我在我的应用程序中没有看到它。 我卸载了该应用程序并重新安装...
我想从 https://slideshare.net 抓取幻灯片,但当我在所有幻灯片上运行 for 循环时,只有第一张幻灯片下载,而另一张幻灯片只是空白 jpf 文件。我不知道为什么。我也试过...
我想手动注释积极/消极/中立的政治街头信息(语言景观)。我需要参考资料。是否有参考资料可以在背景下做到这一点? ...
对于我的数据挖掘课程中的一个项目,我要在数据集上执行模糊-c 表示聚类,其中每个数据点都有 3 个轴(我用谷歌搜索,这显然是复数“轴”的正确方法)。 .
我想从此链接中抓取数据: https://www.orpha.net/consor/cgi-bin/ClinicalLabs_Diagnostictest.php?lng=EN&search=ClinicalLabs_Diagnostictest_TechPurpose 我想按国家使用过滤器...
我正在尝试对 Twitter 流进行聚类。我想将每条推文放入讨论同一主题的集群中。我尝试使用在线聚类算法与 tf/idf 和 co 对流进行聚类...
do_one(nmeth) 中的错误:外部函数调用中的 NA/NaN/Inf (arg 1)
我有一个数据表(“范数”),其中包含数字 - 至少我可以看到 - 以下形式的标准化值: 当我执行时 <- kmeans(norm,center=3) I am receving the follow...