text-mining 相关问题

文本挖掘是从非结构化(文本)信息中获取高质量信息的过程。

如何删除除字母,数字和!之外的所有内容! ? 。 ; ,@'在python pandas df中使用正则表达式?

我正在尝试删除除字母,数字和!之外的所有内容! ? 。 ; ,@'来自我的python pandas列文本。我已经阅读了有关该主题的其他一些问题,但仍然无法使我的工作正常。 ...

回答 1 投票 0

R中使用波斯语的文本挖掘

我正在寻找一些v。简单数据挖掘(频率,二字组,三字母组),这些数据是我在波斯语中收集并存档在csv中的一些Facebook帖子上的。以下是我将在英语中使用的脚本...

回答 1 投票 1

搜索句子中的单词并将其表示为R中的新功能

我正在尝试从R中数据框中的句子列表中识别出具有特定单词(例如,高位)的句子,如果该单词存在于数据框中,那么我想添加另一个...

回答 1 投票 0

如何检查我的数据框中的文本列是否包含可能的模式列表,从而允许出现错误?

我在数据框中有一个名为“文本”的列,其中写了很多东西。我正在尝试验证此列中是否有模式列表中的任何字符串(例如pattern1,...

回答 1 投票 0

哪种聚类方法是进行文本分析的标准方法?

假设您有很多可能具有(或没有)相似性的文本句子。现在,您想对相似的句子进行聚类,以查找每个聚类的质心。哪种方法是首选的方法...

回答 2 投票 0

我如何提取葡萄牙语的名词/口头短语?

我找到了多种工具来提取英语中的语言和名词短语,包括在stackoverflow中的某些问题中。但是,我发现的技术似乎仅适用于英文文本。我有...

回答 1 投票 0

使用textmineR的LDA模型中每个文档的主题标签

我正在使用textmineR使LDA模型适合类似于https://cran.r-project.org/web/packages/textmineR/vignettes/c_topic_modeling.html的文档。是否可以获取每个...的主题标签...

回答 1 投票 0

用R组合语料库中的两个词

所以这是我的代码ny

回答 1 投票 -1

Laravel:数据未出现在视图中

[大家好,我的数据不会显示在下面。这是我的控制器代码,我很难解决这个问题。public function prediksi(){$ collection = ...

回答 1 投票 0

如何将令牌与字典键匹配并获得相应的值

我有一个带有令牌的数据框,如下所示,我想与字典的键匹配并获取相应的键和值。数据帧:A B 1 ['i','like','apples ......

回答 1 投票 0

ErrorException(E_NOTICE)试图获取非对象[重复]的属性'sentimen'>>

[帮助,我收到一条错误消息ErrorException(E_NOTICE)。试图获取非对象公共函数prediksi(){$ collection = array();的属性'sentimen'。 $ ...

回答 1 投票 -2

ErrorException(E_NOTICE)试图获取非对象的属性“ sentimen”

大家好,我在我的代码$ collection = array();中遇到错误; $ title =“数据处理专家”; $ testing_data = DataTesting :: count(); $ klasifikasi = DataTesting :: with(...

回答 1 投票 0

Laravel“ ErrorException(E_NOTICE)未定义的变量:类” [重复]

每个人都可以帮助我,我遇到了一个问题“ ErrorException(E_NOTICE)未定义的变量:类” $ title =“数据培训”; foreach(Sentimen :: all()as $ stm){$ class ['class'...

回答 1 投票 0

使用LSA / SVD的文档分类

我正在尝试使用支持向量机(SVM)进行文档分类。我的文件是电子邮件的集合。我大约有3000个文档来训练SVM分类器并进行测试...

回答 4 投票 3

如何在R文本挖掘中更改termDocumentmatrix的语言?

我需要在termDocumentmatrix函数中将语言更改为土耳其语。你能帮我吗?此代码有效。我达到了我想要的土耳其语词干,停用词等结果。 dat

回答 1 投票 0

如何删除其他字符串之间带有/的数字集? [重复]

我需要从通常以一个较大数字报告的文本注释中提取血压值,以较小的数字报告“ /”,其单位为mm HG(不是小数,只能写为...。) >

回答 3 投票 1

如何在Pandas数据框列中查找关键字并通过虚拟变量分配标签?

我不知道该如何称呼这个抱歉。基本上,我有一个包含关键字和标签的CSV文件。它看起来像这样:col关键字标签0关键字1标签1 1关键字2标签1 2关键字3标签2 3 ...

回答 1 投票 2

当应用word2vec时,仅显示字符而不显示单词?

这是我的代码,您可以看到我将句子与单词对齐,但是当我在句子中应用word2vec模型时,我仍然遇到问题,我使用阿拉伯文字anaconda版本4.7.12句子= nltk。...

回答 1 投票 0

[从图像中提取文本

我确实从图像中提取了文本。提取文本后,我得到了非结构化数据。我必须将其转换为结构化形式,但是我不能这样做。从...

回答 1 投票 1

如何在Python中将PCA用于术语文档矩阵?

[我有一个词干列表:文本= ['uplink platz windows

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.