text-processing 相关问题

机制化电子文本的创建或操作。

从文档中读取多行行并执行操作

我有一个试图在主文档上运行的脚本。该脚本将查看带有完整文件名和路径并用双引号引起来的txt文档。然后,它使用文件名和父文件夹(...

回答 2 投票 0

如何捕获特定字符之前和之后的所有组

我正在尝试捕获所有之前的小组;我还需要捕获没有以;结尾的最后一组。这是我的声明和代码。正则表达式:(((\ * | \ / | \)| \(| [-+] \ d + | [-+]?\ d * \。\ d + | \ d + | \ ...

回答 2 投票 0

如何从Python数据中删除多余的逗号

我有一个CSV文件,通过该文件我试图将数据加载到包含2列的SQL表中。我有2列,数据用逗号分隔,标识下一个字段。第二列...

回答 2 投票 -1

使用正则表达式分隔文本/文本处理

我有一个段落,需要用特定的关键字列表分隔。这是文本(单个字符串):“评估注释:怀疑是自己母亲的虐待。日期3/13/2019 ID:#N / A联系人:不...

回答 2 投票 0

从python单词包中搜索文本

假设我有很多关键词。例如:['利润低','亏损增加','利润降低']我有一个pdf文档,我从中解析了整个文本,现在我想得到匹配...

回答 3 投票 0

如何在多个文件上使用awk?

我正在使用Linux。我写了一些看起来像这样的代码:对于{10..20}:{00..59}中的x;做awk -F';' '/'“ $ x”'/ {y + = $ 7} END {print y}'Data26092019;完成了如何在多个文件上使用此命令,例如...

回答 1 投票 0

使用另一个列表作为参考隔离并追加列表中的项目

我尽力弄清楚如何将一个列表中的项目附加到新列表中。列表中的数据实际上是来自ipconfig / all的信息。因为我想将各部分中的项目分开...

回答 1 投票 0

是否有用于比较两个文本数据集的Python函数?

数据集:我有两个不同的文本数据集(用于训练和测试),每个数据集包含30,000个句子。一部分数据如下:“富尔顿县大陪审团在星期五说...

回答 1 投票 0

如何从单词列表中提取第一个字母并将其组合为单个字符串

[就像标题说的...我正在尝试编写一个函数:将每行的第一个字母添加到字符串中。理想情况下,还要清除文本(删除标点符号等)。这里是一些代码...

回答 1 投票 -3

如何定义一个函数来读取文本文件,并返回其所有行的首字母的字符串(python)

[就像标题说的...我正在尝试编写一个函数:将每行的第一个字母添加到字符串中。理想情况下,还要清除文本(删除标点符号等)。这里是一些代码...

回答 1 投票 -3

如何在Grep中使用向后引用

我有一个带有后向引用的正则表达式。如何在bash脚本中使用它?例如我要打印与(。*)grep -E“ CONSTRAINT \`(。*)\`FOREIGN KEY” temp.txt匹配的内容。如果将它应用于...

回答 2 投票 8

如何加强对来自多个CSV文件看起来跌宕脚本

我需要提高我下面的脚本,这需要一个包含近百万独特线的输入文件。对每行,它在3查找文件不同的价值观,我打算在我加入...

回答 3 投票 2

C#正则表达式的性能相对于纯JS

我在正则表达式的JS速度的很好的经验。我决定做一个小的比较。我跑下面的代码字符串:var str =“正则表达式是正则表达式的模式...

回答 2 投票 6

“ASCII”编解码器不能在位置28进行解码字节写入0xAD:顺序不在范围内(128)

我实现了应用,在那里我有一个场景,那就是它正常化之后,但在阅读我收到以下错误的文件读取文件:下面是我尝试高清unicodeToAscii(...

回答 1 投票 -2

sed:删除除最后n个字符外的所有字符

我正在尝试删除文本字符串中除其余11个字符之外的所有字符。该字符串是Sample Text_that-would $ normally〜be,here--pe_-l4_mBY,而我要结束的只是-...

回答 5 投票 2

检查变量包含特定文本字符串的bash

我想检查$ URL的内容包含V =之后的任意位置https://youtube.com/watch?示例输出(注意到本的和v的缺失实例=):> HTTPS:?//youtube.com/watch ...

回答 2 投票 0

如何使用sed只替换文件中的第一个匹配项?

我想在任何现有的#includes之前用额外的include指令更新大量的C ++源文件。对于这类任务,我通常使用一个带有sed的小bash脚本来重写...

回答 20 投票 183

使用Linux中的文件名和文件内容创建CSV文件

我有一个包含超过400K文本文件的文件夹。名称为deID.RESUL_12433287659.txt_234323456.txt deID.RESUL_34534563649.txt_345353567.txt deID.RESUL_44235345636.txt_537967875.txt deID ....

回答 1 投票 -1

在编辑距离内查找长字符串中的单词,忽略空格

我正在寻找一种算法,在忽略空格的同时,在查询字符串中有效地搜索给定编辑距离内的单词。对于例如如果我需要建立索引的话是:OHIO,......

回答 1 投票 0

仅在sed或awk匹配后替换空格

有这一系列的线条,我需要修改00:00 07:45 01. Alva 07:45 14:40 02. White Cliffs 14:40 20:22 03. Ribcage#1 20:22 25:04 04. I是Oidipus赛后(可能...

回答 9 投票 3

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.