data-mining 相关问题

数据挖掘是分析大量数据以查找模式和共性的过程。

时间序列数据中用于检测日常用户活动异常的算法

鉴于我们要查找用户在我们的应用程序中完成的活动数量的异常情况。对于每个活动,我们都会在数据库中获得一个事件。因此,每天...

回答 1 投票 0

当所有数据都是数字时如何计算CART算法的基尼系数?

我在使用分类算法CART时遇到一些问题,我的数据看起来像这样,问题是当所有数据都是数字时,我如何使用GINI索引来计算“拆分的优缺点”? ...

回答 1 投票 0

R:如何从日期中删除日期?

我在df列中有一堆日期,格式如下:dd.mm.yyyy我希望它看起来像这样:01/2020(mm.yyyy)如何从所有日期中删除日期?

回答 4 投票 0

如何在此Quarintin中下载所有免费的Springer图书?

在这个隔离区中,Springer免费提供了一些书来学习ML,数据挖掘,机器人等,而且我已经看到所有这些书都很重要和稀有。因此,请先下载所有书籍,然后再放入...

回答 1 投票 0

我如何比较2个百分比的收益?

我有一个统计问题。以下是secnario人1的投资组合中有2笔股票交易交易代码:A,买入价:$ 10.00,卖出价:$ 12.00交易品种:B,买入价:$ 50.00,卖出价:$ 55.00 ...

回答 1 投票 0

用于查找最大和闭合频繁集的ECLAT算法

交易ID项目1 {A,C,D} 2 {B,C,E} 3 {A,B,C,E} 4 {B,E} 5 {A,B,C,E}最小支持数量是3。确定最大频率...

回答 1 投票 0

MySQL在用户购物车中创建相似商品的分布或频率列表

自从我发布这个问题已经有一段时间了;只是好奇是否有人可以对此采取诚实的行动。这是我有的桌子+ ---------------------- + | cart_product_table | + --------------...

回答 1 投票 0

将非结构化文本的组提取到以后的NLP中?

我是数据挖掘/文本挖掘的新手,所以我不确定我使用的是正确的术语。我试图提出一个提取相关内容组以稍后应用NLP和...

回答 1 投票 0

R中的分层k倍交叉验证

假设我有一个多类数据集(例如,iris)。我要执行分层的10折CV以测试模型性能。我在包splitstackchange中找到了一个名为stratified的函数,该函数是...

回答 1 投票 0

使用k-gram索引的主题分类

我有一组主题,每个主题都有一个关键字列表。 {体育:['罗纳尔多·梅西·齐达内','足球棒球','巴塞罗那皇家'] ...}任务是对特定文件进行分类。 ...

回答 1 投票 0

将数据集中包括所有唯一项的训练集

我有一个包含超过一百万条记录的数据集,其格式如下:data = {'Item':['Item1','Item1','Item1','Item2','Item2','Item3'],' Count':[333,232,199,318,846,91],'Year':[1999,2000,...

回答 1 投票 0

python不断运行以读取海量数据文件

读取大文件是否有可能使python处于无尽运行状态?我已经针对python 3.7和3.8进行了测试,并获得了相同的结果(无尽的运行)。您对...的建议是什么?

回答 1 投票 0

如何使用python从公共Google表格中获取数据?

我正在尝试获取以下Google工作表的不同工作表中存在的COVID-19数据。 G工作表已开放供公众使用,URL仅返回第一个工作表。我要...

回答 1 投票 0

为什么k均值在聚类中比像LDA这样的主题建模算法更好?

我想了解K均值在聚类论文以发现其主题方面的优势。有很多算法可以做到这一点,例如K-medoid,x-means,LDA,LSA等。请给我完整的...

回答 1 投票 0


如何在datetime类型的对象上修复Python不是JSON可序列化错误

我使用Twitter的数据挖掘。所以我从Twitter获取值create_at以将excel文件发送到Google工作表后保存到excel文件中,但无法发送。它有这样的错误:response = service ....

回答 1 投票 0

如何在R中的Kohonen SOM中设置簇数?

我有一个数据集,并希望通过Kohonen SOM在R中进行聚类。我想将聚类的数量从2改变为40,但是我没有找到可以在聚类之前将聚类的数量设置为的程序包。 ..

回答 3 投票 1

K均值对相同数据进行10次迭代

我对R较新。尝试通过针对相同的数据集和相同的K值重复调用k-means例程来评估是否可以通过使用R来获得K-means的优化(即我的情况下k = 3的10 / ...

回答 1 投票 0

哪里可以获得免费的详细历史数据,例如间隔<1分钟

我正在寻找免费的详细股票数据来源(出价和要价),间隔<1m。这是用于测试交易理论的-因此,它既不必实时也不需要更新。我...

回答 2 投票 2


© www.soinside.com 2019 - 2024. All rights reserved.