数据挖掘是分析大量数据以查找模式和共性的过程。
鉴于我们要查找用户在我们的应用程序中完成的活动数量的异常情况。对于每个活动,我们都会在数据库中获得一个事件。因此,每天...
我在使用分类算法CART时遇到一些问题,我的数据看起来像这样,问题是当所有数据都是数字时,我如何使用GINI索引来计算“拆分的优缺点”? ...
我在df列中有一堆日期,格式如下:dd.mm.yyyy我希望它看起来像这样:01/2020(mm.yyyy)如何从所有日期中删除日期?
如何在此Quarintin中下载所有免费的Springer图书?
在这个隔离区中,Springer免费提供了一些书来学习ML,数据挖掘,机器人等,而且我已经看到所有这些书都很重要和稀有。因此,请先下载所有书籍,然后再放入...
我有一个统计问题。以下是secnario人1的投资组合中有2笔股票交易交易代码:A,买入价:$ 10.00,卖出价:$ 12.00交易品种:B,买入价:$ 50.00,卖出价:$ 55.00 ...
交易ID项目1 {A,C,D} 2 {B,C,E} 3 {A,B,C,E} 4 {B,E} 5 {A,B,C,E}最小支持数量是3。确定最大频率...
自从我发布这个问题已经有一段时间了;只是好奇是否有人可以对此采取诚实的行动。这是我有的桌子+ ---------------------- + | cart_product_table | + --------------...
我是数据挖掘/文本挖掘的新手,所以我不确定我使用的是正确的术语。我试图提出一个提取相关内容组以稍后应用NLP和...
假设我有一个多类数据集(例如,iris)。我要执行分层的10折CV以测试模型性能。我在包splitstackchange中找到了一个名为stratified的函数,该函数是...
我有一组主题,每个主题都有一个关键字列表。 {体育:['罗纳尔多·梅西·齐达内','足球棒球','巴塞罗那皇家'] ...}任务是对特定文件进行分类。 ...
我有一个包含超过一百万条记录的数据集,其格式如下:data = {'Item':['Item1','Item1','Item1','Item2','Item2','Item3'],' Count':[333,232,199,318,846,91],'Year':[1999,2000,...
读取大文件是否有可能使python处于无尽运行状态?我已经针对python 3.7和3.8进行了测试,并获得了相同的结果(无尽的运行)。您对...的建议是什么?
我正在尝试获取以下Google工作表的不同工作表中存在的COVID-19数据。 G工作表已开放供公众使用,URL仅返回第一个工作表。我要...
我想了解K均值在聚类论文以发现其主题方面的优势。有很多算法可以做到这一点,例如K-medoid,x-means,LDA,LSA等。请给我完整的...
标头中未声明标称值,读取令牌[X],Y行。我在Weka上不断看到此弹出窗口
@@@@@@@@@@@@@@@@@的yytfw.yesfww.com/zh-cn/
如何在datetime类型的对象上修复Python不是JSON可序列化错误
我使用Twitter的数据挖掘。所以我从Twitter获取值create_at以将excel文件发送到Google工作表后保存到excel文件中,但无法发送。它有这样的错误:response = service ....
我有一个数据集,并希望通过Kohonen SOM在R中进行聚类。我想将聚类的数量从2改变为40,但是我没有找到可以在聚类之前将聚类的数量设置为的程序包。 ..
我对R较新。尝试通过针对相同的数据集和相同的K值重复调用k-means例程来评估是否可以通过使用R来获得K-means的优化(即我的情况下k = 3的10 / ...
我正在寻找免费的详细股票数据来源(出价和要价),间隔<1m。这是用于测试交易理论的-因此,它既不必实时也不需要更新。我...