text-processing 相关问题

机制化电子文本的创建或操作。

删除python中的某些文本模式

我正在尝试删除.txt文件中的某种文本模式,该模式类似于:“”第一个块中的示例删除词。保留的第一句话。...中的示例删除词。]]] >

回答 2 投票 -1

从python列中删除某些长度的字符

我正在尝试从CSV的特定列('sys_tags')中删除一系列字符。 n = 20个dataframe ['sys_tags']。value_counts()[:20] .index.tolist()输出:['IAM〜3rd','IAM〜3rd,IAM〜KI-000',...

回答 1 投票 -3

将目录及其子目录的内容转换为JSON

我从此堆栈交换问题中获得以下perl脚本,该脚本将目录的内容转换为JSON。使用File :: Find;使用JSON;使用严格使用警告;我的$ dirs = {};我的$ ...

回答 1 投票 1

字符列中每个单词的频率[关闭]

我有一个数据框,我想通过DTM或TDM获得句子中每个单词的权重。从这些权重中,我想获得最大权重以及带有该权重的单词,然后我要...

回答 1 投票 -2

使用AWK创建基于一个文件的文件夹以及基于另一个文件的那些文件夹中的文件

我有一个相当复杂的子任务:在一个目录中基于一个文件(PF.csv)创建文件夹/目录,并在另一个目录中基于另一个文件(FC.py)创建文件。要使用的两个输入文件...

回答 1 投票 0

十六进制转储格式的转义百分号(%)

问题我试图发出一个十六进制字符串,例如:echo hello | hexdump -ve'/ 1“ _%02X”';回声,但用%代替。实际vs预期回声hexdump -ve'/ 1“ %%% 02X”';回声失败,并带有...

回答 1 投票 1

捕获包含搜索模式的整个XML标签

我需要捕获一个包含特定模式的XML标记,以便将其复制到另一个文件中。复杂的是,标签会重复多次并且内部的行数会有所不同。输入:&...

回答 1 投票 0


如何使用python regex从不同类型的日期格式的文本中提取日期

我正在执行ocr问题,我有500张图像,并且已经从图像中提取了文本并另存为CSV,因为该文本具有不同的日期格式,所以我想提取日期。从那个文本。 ...

回答 2 投票 0

如何使用python regex从不同类型日期格式的文本中提取日期

我正在做ocr问题,我有500张图像,我已经从图像中提取了文本并另存为CSV,在该文本中,日期格式不同,因此我想从该文本中提取日期。 ...

回答 2 投票 0


从文本中提取单词并从中创建向量

[假设我有一个包含以下文本的txt文件:类型:水果标题:零售日期:2015-11-10国家:英国产品:苹果,百香果,芒果文档:NDA导出:2.10我阅读了此文件.. 。

回答 1 投票 -1

vim中的十进制数字乘以固定数量

我有一个具有以下内容的文件:设置x 0.00456 y 0.05896。我想将数字乘以固定的数量(比如说1000)。数字并不总是存在于同一列中,所以任何内容都可以...

回答 1 投票 0

spacy-lookup标点干扰

Spacy-lookup是非常大的词典的实体匹配器,它使用FlashText模块。在下面的第二种情况下,标点符号似乎阻止了它与实体的匹配。有人吗...

回答 1 投票 0

如何分割由R中的点连接的两个单词?

我有一个包含新闻文章的大型数据框。我注意到有些文章用点将两个单词连接起来,如以下示例所示。政府表示必须退出。.I ...

回答 1 投票 0

当键/值是某些东西时,如何仅打印某些文本块?

因此,如果我有类似这样的信息,我只想在“帐户已禁用:错误”时捕获或打印出帐户信息。 $ ipa用户查找---------------匹配2个用户---------------用户登录:...

回答 2 投票 0

圈出单词并提取双字母组

我想从给定的单词中提取每个双连词,并放入一个文本文件中。例如:苹果->苹果公司总裁->我发现的总统身份...

回答 3 投票 0

从名词中获取口头名词

言语名词是由动词形成或对应于动词的名词。我正在寻找一种算法,当给定一个名词时,它会返回相应的动词(如果输入的名词是语言……

回答 1 投票 1

是否可以使用python交换文本文件中的两行文本?

[我正在尝试编写一个python脚本,该脚本将接收一个文件(将其称为input.txt),并寻找以文本“移至第一个边界点”结尾的行。然后它需要替换此行...

回答 1 投票 -5

文本处理忽略下划线的第二次出现

数据从下划线的第二次出现中将被忽略,应对此进行排序,并且需要消除重复。 awk -F_'{print $ 2}'file1 >>文件2;排序文件1 | uniq;我尝试了****** FROM ** ...

回答 1 投票 -1

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.