text-mining 相关问题

文本挖掘是从非结构化(文本)信息中获取高质量信息的过程。

Python 建议/资源,以学习如何有效地操作和分析(大)文本文件

我正在重新使用 Python(我以前主要使用 R 和 Bash)并且想提高我的知识以处理文本数据。更多背景: 我不是程序员,而是语言学家。 F...

回答 0 投票 0

文本与R的相关性

我正在处理一个DF,其中包含几行文字ID,文字语料库和所述语料库中的单词数。它看起来像这样。ID Text W_Count Text_1 ...

回答 1 投票 1

贝叶斯

我试图根据推文的情绪将其分为三类(买入、持有、卖出)。我使用R和包e1071。我有两个数据框架:一个训练集和一组新 ...

回答 1 投票 6


如何从pandas列分析文本?

我习惯于用Python对文本文件进行一些分析。我通常这样做: f = open('filename.txt','r') text = "" while 1: line = f.readline() if not line:break text += line ....

回答 1 投票 0

Python nltk不能标记阿拉伯语文本

当使用 nltk 软件包对阿拉伯文进行标记时,结果显示为数字!在对英文文本进行标记时没有问题。当使用 nltk 包来标记阿拉伯文文本时,结果显示为数字!而标记英文文本时则没有问题。UnicodeDecodeError: 'ascii' codec can't decode byte 0xd8 in ...

回答 2 投票 0

我应该用什么来做聚类词相似性? 以及Python中的可视化聚类。

我有一个相似度词的矩阵。Noun1 能力 缺席 丰度 重音 访问 访问 账号 准确度 Noun2 能力 1.00000 0.453362 0.374926 0.174432 0.448402 0.209143 ....

回答 1 投票 0

去芜存菁

在文本清理过程中,是否可以检测并删除句子中这样的垃圾:x。

回答 1 投票 0

R-文本挖掘:替换德文中的缩略语、数字和符号。

我想替换我文本中的缩写、数字和符号。由于我的文本是德文而不是英文,我在转换时遇到了问题。我试过: review_text

回答 1 投票 0

"[Float64Index([nan,nan],dtype='float64')]中没有一个[索引]"如果col B中包含字符串,则设置col A的值。

我有一个数据框架(称为语料库),有一列(tweet)和两行。['check, tihs, out, this, bear, love, jumping, on, this, plant'] ['i, can, t, bear, the, noise, from, that, power, plant, it, ...

回答 2 投票 0

当R中出现分号时,如何从数据框中的一列中提取匹配的值?

我有一个大型的已发表文章的数据框架,我想提取所有与少数作者有关的文章,并将其指定在一个单独的列表中。数据框中的作者被分组在一起... ...

回答 1 投票 0

如何将txt文件转为漂亮的数据框?

我有一个txt文件,包含Track ID、Song ID、Artist Name和Song name。我想在R中把它转换成一个数据框架来做一些分析。有什么好的函数可以用来分离数据? ...

回答 1 投票 0

将多个多行的txt文件合并为一个csv文件(1行=1个文件),用于主题建模。

我目前有30个文本文件,都有多行。我想根据这个教程应用一个LDA模型。所以,对我来说,它应该是这样的:text of document1 text of document2 text of document3......。

回答 1 投票 0

从列表中提取值和属性,并在R中把它们转换为数据框架。

我的模型得到以下列表。9个列表 $ phi : num [1:5, 1:1500] 1.8e-04 1.8e-04 1.8e-04 1.8e-04 1.8e-04 ... ...- attr(*, "dimnames")=2个列表 ... ...$ : chr [1:5] "t_1" "t_2" "..."。

回答 1 投票 0

为我的研究分析Twitter粉丝

我需要分析一个组织的Twitter账户的关注者,以确定谁是关注者(在他们的个人资料中的描述),他们的推特内容等。有没有什么R(或python)库(...

回答 1 投票 0

word

我在R中有两个数据框,看起来像下面的例子。数据框1

回答 1 投票 0

PANDAS从一列中找到准确的给定串词。

所以,我有一列名为 "笔记 "的熊猫,其中包含了一些事件的句子或解释。我试图从该列中找到一些给定的单词,当我找到该单词时,我将其添加到下一个 ...

回答 1 投票 0

如何根据自定义词典将列中的文本转换为其他格式?

我正在根据大学/学院名称的词典来使数据集中的教育数据保持一致。如何针对字典运行代码并获得所需的输出?数据包括...

回答 1 投票 0

如何基于R中的自定义词典转换文本数据?

我正在根据大学/学院名称的词典来使数据集中的教育数据保持一致。如何针对字典运行代码并获得所需的输出?数据包括...

回答 1 投票 0

如何为r文本分析创建自定义的贸易/法律词典

我计划在R中进行文本分析,就像按照“交易”与“法律”逻辑使用自己的自定义词典进行情感分析一样。我在excel中拥有字典所需的所有单词...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.