text-mining 相关问题

文本挖掘是从非结构化（文本）信息中获取高质量信息的过程。

<- system.file("E:/project_refrences", package = "readtext") rt7 <- readtext(paste0(data_dir, "*.pdf"), docvarsfrom = "filenames", docvarnames = c("

r pdf text-mining

回答 1 投票 0

您如何处理介于两者之间的英文文字？（r中的文字开采）

r text-mining sentiment-analysis

回答 1 投票 0

将句子分类为代表它们的 5 个单词

我有包含 1000 个文本行的数据框。 df['文本'] 我还有 5 个单词，我想知道每个单词代表文本的程度（0 到 1 之间）每个分数都将在 df["word1...

python pandas nlp text-mining similarity

回答 1 投票 0

做单词嵌入后单词到句子的相似度

我有包含 1000 个文本行的数据框。我做了 word2vec 。现在我想创建一个新字段，它可以给出每个句子到我想要的单词的距离，比如说“king”这个词。我

python nlp text-mining word2vec similarity

回答 1 投票 0

嵌入后单词到句子的相似度

我有包含 1000 个文本行的数据框。我做了 word2vec 。现在我想创建一个新字段，它可以给出每个句子到我想要的单词的距离，比如说“king”这个词。我

python nlp text-mining word2vec similarity

回答 1 投票 0

做word2vec后单词到句子的相似度

我有包含 1000 个文本行的数据框。我做了 word2vec 。现在我想创建一个新字段，它可以给出每个句子到我想要的单词的距离，比如说“king”这个词。我

python nlp text-mining word2vec similarity

回答 1 投票 0

如何获取OpenNLP模型的训练数据集？

我正在使用以下 OpenNLP 模型： en-parser-chunking.bin 恩纳人.bin 内位置.bin 内部组织.bin 我想将我的数据附加到训练数据集中，这些数据集...

machine-learning nlp text-mining opennlp

回答 2 投票 0

在词云中实现 tf-idf

我在像下面的 df_unis 这样的数据框中有一些对一些大学的谷歌评论。列 uni_name 包含大学名称。我希望分别为每所大学创建词云...

nlp text-mining tf-idf word-cloud

回答 1 投票 0

如何从PDF中提取文本，包括图像和文本

我将从多个 PDF 文件中提取文本。 PDF文件包括文本和一些图像，甚至有些页面是扫描页面（我假设扫描页面就像图像）。我遵循了...

python nlp text-mining text-extraction

回答 1 投票 0

用 Python 解析日本议会演讲的正则表达式

我是Python初学者，正在开发一个项目来预处理日语文本数据以进行参数挖掘。我需要提取元数据（例如议会会议、日期、演讲者）和演讲内容...

python json regex text-mining cjk

回答 1 投票 0

是否可以抓取公共 Twitter 帐户（页面）的关注者列表

我是学生，我对抓取等完全陌生，今天我的主管给我任务来获取用户或页面（名人等）的关注者列表该列表应包含有关每次使用的信息...

python web-scraping twitter text-mining

回答 1 投票 0

从文本向量中提取关键字——每个元素一组关键字

请考虑帖子末尾的代表。它的工作原理是 https://cran.r-project.org/web/packages/udpipe/vignettes/udpipe-usecase-postagging-lemmatising.html 它提取了一个se...

r nlp text-mining udpipe

回答 1 投票 0

R：从文本向量中提取关键字——每个元素一组关键字

请考虑帖子末尾的代表。它的工作原理是 https://cran.r-project.org/web/packages/udpipe/vignettes/udpipe-usecase-postagging-lemmatising.html 它提取了一个se...

r nlp text-mining udpipe

回答 1 投票 0

无序txt文件内容：如何在正确的字典中设计

我有txt文件，它的内容是无序的，如下例所示。我必须选择第一行，因为它有火车运行的准确时间。我的 txt 文件有几个摘要 1、2 等等。因此，钥匙是...

python pandas dataframe dictionary text-mining

回答 1 投票 0

根据关键词创建并计算同现百分比

我有以下数据集： df <- data.frame (text = c("House Sky Blue", "House Sky Green", "House Sky Red&qu...

r text-mining quanteda

回答 2 投票 0

文本文档聚类比 tf/idf 和余弦相似度更好？

我正在尝试对 Twitter 流进行聚类。我想将每条推文放入讨论同一主题的集群中。我尝试使用在线聚类算法与 tf/idf 和 co 对流进行聚类...

machine-learning data-mining cluster-analysis text-mining

回答 3 投票 0

Android 机器学习库

我正在尝试为我的 Android 应用程序构建一个小型文本挖掘工具。我正在检查一个机器学习库，它可以让我进行聚类、分类等。有没有机器学习库

android machine-learning nlp artificial-intelligence text-mining

回答 3 投票 0

词云标题未在 R 中显示/渲染

所以我使用整洁的原则进行了情感分析。我想在比较云中绘制结果（积极情绪与消极情绪）。这是我的代码：库（重塑2）图书馆（ti...

r text-mining sentiment-analysis word-cloud tidytext

回答 3 投票 0

通过网页抓取提取文本：使用多个可选的开始/结束字符串循环

我想抓取一些新闻声明的文本。我目前遇到的问题是定义几个字符串，其中文本的抓取应该开始/结束。例如...

r loops web-scraping text-mining

回答 1 投票 0

我无法获取过去的数据（stop_words）来分析文本挖掘中的文本

这是我第一次尝试文本挖掘，但我遇到了困难。这是我到目前为止所做的：图书馆（TM）图书馆（整洁的文本）图书馆（dplyr）库（ggplot2）文本 1 <- c("Dear land of G...

r dplyr nlp text-mining tidy

回答 1 投票 0

text-mining 相关问题

最新问题