text-mining 相关问题

文本挖掘是从非结构化（文本）信息中获取高质量信息的过程。

gensim word2vec词嵌入如何提取1个单词句子的训练单词对？

请参考下图（word2vec跳过图如何从输入句子中提取训练数据集-单词对的过程）。例如。 “我爱你。” ==> [[I，love），（I，you）]请问单词是什么...

nlp text-mining gensim word2vec word-embedding

回答 1 投票 0

生物医学名称实体识别的预先训练框架

是否存在经过培训的生物医学名称实体识别框架？谢谢和亲切的问候。

bioinformatics text-mining information-retrieval named-entity-recognition pre-trained-model

回答 1 投票 0

R：如何删除语料库中除特定单词以外的单词

在语料库“ tkn_pb”中，我想删除所有单词，除了我选择的某些关键字（例如，“ attack”和“ gunman”）。可以这样做吗？

r text-mining corpus

回答 1 投票 0

如何清除包含“句点”的缩写（例如“。”，“ st。”，“ rd。”），但保留“。”在句子结尾吗？

我正在研究R中的句子级LDA，目前正在尝试使用来自openNLP包中的send_detect（）函数将文本数据拆分为单个句子。但是，我的文本数据...

r regex text-mining topic-modeling

回答 1 投票 1

R中的文本挖掘：计算2-3个词组

我在Stackoverflow中找到了一段非常有用的代码-使用R TM包查找2到3个单词的短语（信用@patrick perry）以显示语料库中2到3个单词的短语的频率：...

r text-mining

回答 1 投票 0

Python-正则表达式功能的异常处理

[第一次访问该网站，到处搜索适当的答案，如果格式不正确，请通知我。问题：在将正则表达式应用于Python时如何应用异常处理...

python regex exception match text-mining

回答 1 投票 0

删除数据框中的空行并检查相似性

我在使用数据框内的正则表达式（findall）选择不为空的字段时遇到一些困难，正在查找文本源中包含的单词：text =“小心，否则警察会抓捕...

python regex pandas text-mining

回答 2 投票 0

基于数字/数字的文本比较

我需要通过仅从以下两个文本中提取数字来比较文本：text_1 =“ source =”先前的低点是27,523，记录于1900年5月。1.35万亿（2,250万美元）计划...

python text-mining

回答 1 投票 -1

从数据框格式的文本列中提取单词

我需要从另一列创建一个新列。数据集是通过以下代码创建的（我仅提取了几行）：将熊猫导入为pd new_dataframe = pd.DataFrame（{“ Name”：['John'，'Lukas'，'...

python pandas text-mining

回答 2 投票 5

通过for循环以不同的名称存储多个语料库

我希望将每个股票行情录包含多个文本文档，并将其存储为单个语料库。我已经读过有关创建“列表中的列表”的信息，但这对我不起作用。例如，“文本挖掘和...

r for-loop text-mining tm corpus

回答 1 投票 1

合并两列以创建日期时间对象

我需要通过组合数据框中的两列来创建日期时间。我原始的数据集包含以下列：日期时间05/29/2020 00:12 05/29/2020 00:32 05/28 / ...] >>

python pandas string text-mining

回答 1 投票 0

从数据帧中提取单词

python pandas text-mining

回答 2 投票 1

R中的文本挖掘-如何从文本分析中排除完整的短语/句子

我正在对调查进行约160个单独的回复。我已经运行了R代码，以在清理后产生一个简单的wordcloud和一些敏感性分析。但是，分析包括来自...

r text-mining

回答 2 投票 0

R中的文本挖掘：创建语料库会创建不寻常的文本

我正在阅读一个文本文件，下面是我的代码。它读起来很好，但是在整个语料库中的随机位置放置了\ t。示例：文本文件5中的原始文件。如果您以...

r text-mining

回答 1 投票 0

Character-Matrix-如何按行操作？

我有一个字符数据矩阵charMatrix

r matrix text-mining

回答 3 投票 2

特征选择文本挖掘

我们正在完成一项有关文本分类的任务，我们使用了一种无监督的机器学习模型。在进行文本聚类之前，数据集必须经过几个步骤...

java nlp weka text-mining feature-selection

回答 4 投票 0

字符串分析：按单词百分比将字符串分成n个部分

我需要计算列表中包含的每个字符串的长度：list_strings = [“我很自私，急躁并且有些不安全。我犯了错误，我一发不可收拾，有时很难处理。 ..

python string text-mining

回答 2 投票 0

R：可以从每个句子（行）中提取单词组吗？并创建数据框（或矩阵）？

我为每个单词创建了列表，以从句子中提取单词，例如，像这样的你好] >>

r extract text-mining

回答 2 投票 0

从日期/时间的字符串信息中提取

我有一些文本通常以：“ 12分钟前-...”，“ 2小时前-...”“ 1天前-...”等开头。基本上，我了解以下信息：分钟时间日（从今天开始）I ...

python string text-mining

回答 1 投票 0

有没有从pdf中提取具有特定标题的文本的功能

我的pdf文档中有多个段落。每个段落都有一个唯一的标题。如何在我要查找的特定标题下从pdf中提取文本

python pdf google-apps-script text-mining

回答 1 投票 0

text-mining 相关问题

最新问题