数据挖掘是分析大量数据以查找模式和共性的过程。
我有一个可变长度的字符串,但如果我不得不猜测它可能有 500-2000 个字符长。它仅由大写字母 A-Z 组成,并且分布基本均匀。我……
如何找到 Pandas Datafarame 中不同类别的滚动差异?
我有一个这样的数据框(作为示例)。现在我想找出德里和加尔各答的利润的一阶差分。基本上,我想计算利润 f 的百分比变化...
我刚刚通过 NetworkX 库在 Python 中构建了一个无向图,我正在尝试实现一种关联规则挖掘形式,但我不知道哪个可能是正确的......
我们如何关联多维警报? 我们正在尝试根据其功能关联警报。有什么办法吗? 是否有任何替代方法来关联
Multilevel和Multidimensional关联规则有什么区别
我读过,在多级关联规则中存在抽象,通常抽象程度越高,相关的机会就越高。 在多维关联规则中有
Helium10(H10) 或 JungleScout(JS) 等工具如何工作?他们从亚马逊提取数据,使其用户友好并将其出售给卖家。没有它我会迷路的。但它的局限性是什么 - 它真的......
How to Scrape the "span.VlHyHc" values from google image reinement buubles with Google sheet?
我想使用 IMPORT XML 公式将“Google Image”搜索框下的优化小部件(建议标签)列表提取到我的 Google 表格中。但是对于“xpath_query&
我正在寻找一种方法让这个SVM运行得更快。当我运行这个的时候,它会使用我电脑的所有CPU,而且需要很长的时间来运行。
我在R中用党派图做了一棵决策树,但并不真正知道它在告诉我什么。数据是关于印度创业生态系统的。我不知道这些节点是什么意思。
我想在学校的项目中实现一种加密货币 但是我卡在了区块验证的部分,也就是挖矿部分 我使用了我在网上找到的这段代码,并把它改编成了我的项目: void Block::...
在python pandas中是否有办法像excel中那样按位置(而不是按分隔符)进行 "文本到列"?
我使用的是来自国务卿的投票历史数据,然而他们给我的.txt文件是700万行,其中每行是一个27个字符的字符串。前3个字符是一个代码,用于...
我需要找到一个客户已经购买了P1,以及多少天后客户会购买P2。我无法找到同一客户的P1订单和下一个P2订单之间的天数。我的数据为...
表名和模式 表1:学生表 列名:学生_姓名, 学生_地址, 学生_标记 表2:员工表 列名:员工_姓名, 员工_地址, 员工_年龄, ...
Python Pandas,根据另一列中的值进行日期时间的四舍五入。
我试图根据传感器的类型,将传感器数据的时间戳四舍五入到最接近的5分钟。我有一列叫做 "传感器类型",有两个选项:"空气 "或 "声音"。"空气 "或 "声音"。对于传感器类型空气的...
如何解决y_true_val = list(y_true.values()) AttributeError:'list'对象没有属性'values'?
我试图为Zachary空手道俱乐部数据集写代码。现在我卡在了y_true_val = list(y_true.values())这一行。我的代码: nmi_results = [] ars_results = [] y_true_val = list(y_true....)
我正在编写一个python程序来读取一个数据集文件,写下这行:df = pd.read_csv (r'C:\Users\user118\Desktop\StudentsPerformance.csv') 这行工作,但我必须上传这个项目作为...
目前我正在做我的结业项目,是从Github仓库中挖掘源代码。我打算实现一个完整的解决方案,从提取Github数据(Django),处理...
我们在加速器中有一个巨大的数据集,我们需要对每一行执行一些非常昂贵的操作。如果我们想一次性处理整个数据集,需要花费数周的时间,所以我们想...
我正在用Knime做一个项目。我的数据集相当小,而且,特征的数量大于实例的数量。因此,我想尝试做数据扩增,但是 ...
我目前正试图将一个csv文件的信息隐蔽到Weka的ARFF文件中...... 问题是弹出3384行有问题......但我看不出有什么问题......。