text-mining 相关问题

文本挖掘是从非结构化(文本)信息中获取高质量信息的过程。

gensim word2vec词嵌入如何提取1个单词句子的训练单词对?

请参考下图(word2vec跳过图如何从输入句子中提取训练数据集-单词对的过程)。例如。 “我爱你。” ==> [[I,love),(I,you)]请问单词是什么...

回答 1 投票 0

生物医学名称实体识别的预先训练框架

是否存在经过培训的生物医学名称实体识别框架?谢谢和亲切的问候。

回答 1 投票 0

R:如何删除语料库中除特定单词以外的单词

在语料库“ tkn_pb”中,我想删除所有单词,除了我选择的某些关键字(例如,“ attack”和“ gunman”)。可以这样做吗?

回答 1 投票 0

如何清除包含“句点”的缩写(例如“。”,“ st。”,“ rd。”),但保留“。”在句子结尾吗?

我正在研究R中的句子级LDA,目前正在尝试使用来自openNLP包中的send_detect()函数将文本数据拆分为单个句子。但是,我的文本数据...

回答 1 投票 1

R中的文本挖掘:计算2-3个词组

我在Stackoverflow中找到了一段非常有用的代码-使用R TM包查找2到3个单词的短语(信用@patrick perry)以显示语料库中2到3个单词的短语的频率:...

回答 1 投票 0

Python-正则表达式功能的异常处理

[第一次访问该网站,到处搜索适当的答案,如果格式不正确,请通知我。问题:在将正则表达式应用于Python时如何应用异常处理...

回答 1 投票 0

删除数据框中的空行并检查相似性

我在使用数据框内的正则表达式(findall)选择不为空的字段时遇到一些困难,正在查找文本源中包含的单词:text =“小心,否则警察会抓捕...

回答 2 投票 0

基于数字/数字的文本比较

我需要通过仅从以下两个文本中提取数字来比较文本:text_1 =“ source =”先前的低点是27,523,记录于1900年5月。1.35万亿(2,250万美元)计划...

回答 1 投票 -1

从数据框格式的文本列中提取单词

我需要从另一列创建一个新列。数据集是通过以下代码创建的(我仅提取了几行):将熊猫导入为pd new_dataframe = pd.DataFrame({“ Name”:['John','Lukas','...

回答 2 投票 5

通过for循环以不同的名称存储多个语料库

我希望将每个股票行情录包含多个文本文档,并将其存储为单个语料库。我已经读过有关创建“列表中的列表”的信息,但这对我不起作用。例如,“文本挖掘和...

回答 1 投票 1

合并两列以创建日期时间对象

我需要通过组合数据框中的两列来创建日期时间。我原始的数据集包含以下列:日期时间05/29/2020 00:12 05/29/2020 00:32 05/28 / ...] >>

回答 1 投票 0

从数据帧中提取单词

我需要从另一列创建一个新列。数据集是通过以下代码创建的(我仅提取了几行):将熊猫导入为pd new_dataframe = pd.DataFrame({“ Name”:['John','Lukas','...

回答 2 投票 1

R中的文本挖掘-如何从文本分析中排除完整的短语/句子

我正在对调查进行约160个单独的回复。我已经运行了R代码,以在清理后产生一个简单的wordcloud和一些敏感性分析。但是,分析包括来自...

回答 2 投票 0

R中的文本挖掘:创建语料库会创建不寻常的文本

我正在阅读一个文本文件,下面是我的代码。它读起来很好,但是在整个语料库中的随机位置放置了\ t。示例:文本文件5中的原始文件。如果您以...

回答 1 投票 0

Character-Matrix-如何按行操作?

我有一个字符数据矩阵charMatrix

回答 3 投票 2

特征选择文本挖掘

我们正在完成一项有关文本分类的任务,我们使用了一种无监督的机器学习模型。在进行文本聚类之前,数据集必须经过几个步骤...

回答 4 投票 0

字符串分析:按单词百分比将字符串分成n个部分

我需要计算列表中包含的每个字符串的长度:list_strings = [“我很自私,急躁并且有些不安全。我犯了错误,我一发不可收拾,有时很难处理。 ..

回答 2 投票 0

R:可以从每个句子(行)中提取单词组吗?并创建数据框(或矩阵)?

我为每个单词创建了列表,以从句子中提取单词,例如,像这样的你好] >>

回答 2 投票 0

从日期/时间的字符串信息中提取

我有一些文本通常以:“ 12分钟前-...”,“ 2小时前-...”“ 1天前-...”等开头。基本上,我了解以下信息:分钟时间日(从今天开始)I ...

回答 1 投票 0

有没有从pdf中提取具有特定标题的文本的功能

我的pdf文档中有多个段落。每个段落都有一个唯一的标题。如何在我要查找的特定标题下从pdf中提取文本

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.