data-mining 相关问题

数据挖掘是分析大量数据以查找模式和共性的过程。

抓取谷歌地图时始终“无”

我抓取了谷歌地图,得到了几个网址,我想提取一些数据,但我不能 def get_data(path_txt): 以 open(path_txt) 作为文件: url_to_sc = [url.strip() for url in ...

回答 1 投票 0

如何在scrapy中发送带有标头和有效负载的Post请求

我正在尝试向 Graph API 发送发布请求,并且成功了,但我想在 scrapy 中发送相同的请求,但我不知道如何在 scrapy 中发送带有标头和有效负载的发布请求。

回答 1 投票 0

数据库分析架构[已关闭]

我们有一个架构,为每个客户的网站(互联网商家)提供类似商业智能的服务。现在,我需要在内部分析这些数据(用于算法改进......

回答 2 投票 0

数据集中的分隔符,但作为字符而不是分隔符

我前几天问过这个问题,网友的回答解决了这个问题: 根据标签将一列分隔在不同的列中 解决方案的步骤之一是使用“:”作为分隔符......

回答 1 投票 0

从开发人员的角度来看什么是数据挖掘?

我可以在一本书或维基百科上找到数据挖掘的技术解释,但我想知道它到底涉及什么样的开发?是更多关于使用工具还是更多关于

回答 8 投票 0

如何选择合适的机器学习分类器

我面临着为数据挖掘任务选择正确分类器的问题。 我使用统计方法来标记网页,并使用 1-4 等级来标记它们,1 是最差的,而 4 是...

回答 3 投票 0

Microsoft Excel 2003 中的相关性/数据挖掘

我有一个 Excel 电子表格,其中每一列都是一个特定变量。在我的专栏的末尾,我有一个特殊的最后一列,称为“类型”,可以是 A、B、C 或 D。 每行都是一个数据点

回答 1 投票 0

使用 BERT 模型,我不断收到错误:在 MacBook-Pro-21.lan 上运行的二进制文件中,Op 类型未注册“CaseFoldUTF8”

我正在尝试使用 BERT 模型来帮助预测更新是否紧急。我可以使用以下输出来标记更新: 然而,当我去定义模型时,我不断得到

回答 1 投票 0

根据局部线性度分割一组点的分割算法

假设我有一些点,大致由 N 段组成,每个段之间都有一定的线性关系。下面的例子显示了3个簇,但一般我们不知道有多少个segm...

回答 2 投票 0

是否可以自动化数据挖掘过程以自动生成见解

我是一名前端开发人员,负责数据洞察(救命!)大家好! 我是一名应届毕业生,从事前端开发工作。这是我第一份真正的工作,我有点陷入困境了!我的第一个...

回答 1 投票 0

如果遇到预测未来成功与否的问题,从哪里开始

我们有一个基于Web的产品,允许用户对商品的未来价值(或需求)进行预测,历史数据包含大约10万个例子,每个例子有大约...

回答 1 投票 0

使用订单/账单表与 Orange3 关联规则 - 如何转换为:cloumns 是 Items_name,Row 是关联的 OrderID?

我有一个订单表,其中有很多订单,每个订单都是一个项目。在 Excel 中,您有 2 列:OrderID 和 ItemName。因此,如果您在一个订单中有 4 件商品,那么您将有 4 行...

回答 1 投票 0

“顺序模式挖掘”和“顺序规则挖掘”有什么区别

非常强大的开源数据挖掘工具SPMF的文档将它们单独列出: http://www.philippe-fournier-viger.com/spmf/index.php?link=algorithms.php 有谁知道为什么吗?

回答 3 投票 0

使用 SPARK 从关联规则中提取提升和支持

我正在使用频繁模式挖掘算法 - 关联规则: 导入 org.apache.spark.mllib.fpm.AssociationRules 导入 org.apache.spark.mllib.fpm.FPGrowth.FreqItemset val freqItemsets = sc.

回答 1 投票 0

为什么我提取的规则置信度都是1.0?

我有以下数据集: [广告] [出租车] [A] [A、E、D] [B、D] 我正在尝试使用 Spark Mllib 使用频繁模式挖掘来提取一些关联规则。为此,我有以下代码: 瓦尔

回答 1 投票 0

顺序模式或项集 fp 树

FP 增长算法用于项集挖掘。有没有办法使用这些算法进行序列模式挖掘而不是项集挖掘?

回答 1 投票 0

FP-增长算法中的递归

我正在尝试用Java实现FP-Growth(频繁模式挖掘)算法。我已经构建了树,但在条件 FP 树构建方面遇到困难;我不明白什么是递归

回答 1 投票 0

向每天的天气数据添加行,将相应的日期放在顶部

我在 R 中以 15 分钟的间隔记录天气数据,我需要对数据进行格式化,以便每天的数据后面跟着两个空白行,并在顶部写上相应的日期。这里'...

回答 1 投票 0

KNIME 将节点与列表文件/文件夹循环连接起来?

尼姆。我知道如何将“连接”节点与多个 Excel 阅读器一起使用,以便将所有电子表格组合在一起,即使它们的结构不同。 如果有很多这样的

回答 1 投票 0

数据挖掘中的Apriori算法 - 如何解决Python中有关TransactionEncoder()的TyperError?

我正在尝试将 apriori 算法合并到 python 程序中,但是“te_ary = te.fit(dataset).transform(dataset)”行出现 TypeError。我相信这与事实有关

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.