data-mining 相关问题

数据挖掘是分析大量数据以查找模式和共性的过程。

使用XGBoost时,二进制功能的一种热编码

我很清楚,当将分类特征与基于树的模型(例如随机森林和梯度增强)一起使用时,无需从N级分类特征中删除一个等级。对于...

回答 1 投票 1

如何从扫描的文档中提取垂直标签和值?

我正在制作一个文档解析器,它从文档中提取数据字段并以结构化方式存储它们。我的数据集中的每个字段都是水平的,很容易提取。但是模型失败了...

回答 1 投票 1

将整数数组转换为C ++中位集表示形式的最佳方法?

我已经在该主题上看到了一些类似的问题,但是我对编程还比较陌生,无法理解解决方案中使用的某些语言。假设我有2个有限集A,B ...

回答 1 投票 1

如何测试数据集是否具有代表性?

例如,我收集了1000个具有10个独立变量的样本,其中我采用了其中一个(适用条件)创建目标类。现在要获得最终的数据集,我有...

回答 1 投票 1

Tfidf Vectorizer

我从文本审阅中获取了一个用于预测情感的数据集,最初,我清理数据(删除标点符号,删除停用词,标记化)。当我尝试将标记化数据提供为...

回答 1 投票 0

用Java删除数组中的行

我正在使用Data Miner从网站表中抓取一些数据。该表在第一列中的球员排名从1到235。该表在各个位置被字符串分割。我想...

回答 1 投票 0

如何使用Beautiful Soup BS4在Yahoo Finance上刮取多个页面

我是Python的新手,正在尝试使用BS4从Yahoo Finance获取一些财务数据。只需一页,脚本就可以很好地工作。但是,现在我试图一次抓取多个页面,但是...

回答 1 投票 0

哪种算法最适合于文本汇总?

这些算法中的余弦,骰子,雅卡德哪个算法最适合于文本汇总?

回答 2 投票 -3

为多组多级数据结构中的值创建空的缺失行,并计算组内行之间的差异

假设我具有以下数据集:ID类型组星期值111 A胡椒-1 10 112 B盐2 20 113 C咖喱4 40 114 D迷迭香9 ...

回答 1 投票 1

为什么KS曲线以(0,0)开头?

KS曲线的垂直轴为tpr,fpr和(tpr-fpr),水平轴为阈值。 tpr =(tp / tp + fn)。当阈值= 0时,预测所有样本为1,因此tp =阳性样本数,...

回答 1 投票 0

SQL Server数据清理

请获得我的帮助,我将开始使用SQL Server for Databases进行数据挖掘项目。我的数据库很大,在开始从事我的项目之前,请确保需要在...

回答 1 投票 -2

R中使用波斯语的文本挖掘

我正在寻找一些v。简单数据挖掘(频率,二字组,三字母组),这些数据是我在波斯语中收集并存档在csv中的一些Facebook帖子上的。以下是我将在英语中使用的脚本...

回答 1 投票 1

是否可以为逻辑回归定义您自己的成本函数?

在最小二乘模型中,成本函数定义为预测值和实际值之差与输入之间的函数关系的平方。当我们进行逻辑回归时,我们...

回答 6 投票 21

我想学习数据挖掘和机器学习。我应该从哪里开始?

我是一名业余程序员,可以使用C / C ++和python进行编程,但是希望将我的知识扩展到数据挖掘和机器学习领域。我知道可能有好书和在线书籍...

回答 2 投票 -1

总结质心簇的结果

我正在使用WEKA对虹膜数据集进行聚类分析。我想知道如何使用质心给定的值总结群集的结果。我得到了...

回答 1 投票 2

Centroids意义

我正在使用WEKA对虹膜数据集进行聚类分析。我想知道如何使用质心给定的值总结群集的结果。我得到了...

回答 1 投票 2

检查一个大文件.csv并替换,并将其分类为一列

我需要检查一个大文件.csv并进行替换,然后将其分类为一列dataframe ['value']。这是我的代码,但是运行缓慢:def encoder():classes = {} a = dataframe ['value'] c = -1 ...

回答 1 投票 1

对于轮廓图和PCA图具有相同的颜色

我的目标是在PCA减少图旁边绘制轮廓图。我的想法是,为了理解,我想在两个图表上使用相同的颜色。现在,我明白了:...

回答 1 投票 1

数据挖掘日志以查找错误

我正在研究一个数据分发应用程序,该应用程序从源接收数据并将该数据分发到多个目标应用程序。每秒成功分发几条消息后...

回答 4 投票 2

Laravel:数据未出现在视图中

[大家好,我的数据不会显示在下面。这是我的控制器代码,我很难解决这个问题。public function prediksi(){$ collection = ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.