text-processing 相关问题

机制化电子文本的创建或操作。

SAM 对齐：提取查询序列中的特定区域及其 CIGAR 字符串中的封闭部分

我需要对已进行全局比对的DNA序列的给定区域执行局部比对，并更新全局CIGAR字符串的相应部分。步骤如下...

python bioinformatics text-processing

回答 1 投票 0

如何可靠地拦截（并取消）contenteditable中的所有输入？

我需要捕获 contenteditable 元素中的所有输入并处理代码中的输入。基本上，我需要的是防止输入事件更改元素中的数据并知道数据是什么

javascript dom-events contenteditable text-processing

回答 1 投票 0

使用Python进行文本处理

我需要从 25,000,000 条记录中提取 1,500,000 条记录并对它们进行分组。要提取的记录的组和 UUID 在单独的文件 (200MB) 中定义，格式如下： >集群...

python text-processing

回答 1 投票 0

在Python中处理文件

各位程序员早上好。我有一个关于使用 Python 查找文件中特定行的问题。一种方法是使用 if line.startswith(word) 或使用 if not line.startswith(word...

python optimization text-processing

回答 1 投票 0

如何在给定索引处拆分字符串节点数组？

我可能需要使用其他数据结构，但我现在坚持使用这个解决方案。对此有任何建议将不胜感激。现在我有这个数据结构：常量数据 = [ { id: '节点...

javascript algorithm text text-processing

回答 1 投票 0

如何“标准化”对象数组？

我不确定“标准化”一词在我的情况下是否正确，所以如果您指出正确的术语，我将不胜感激。我在 DOM 节点方法中发现了这个术语，称为标准化，它的作用有点......

algorithm text-processing

回答 1 投票 0

有没有办法在Python中将Wikitext转换为Markdown？

是否有一个Python库可以接受wiki文本（如mediawiki中使用的）输入并将其转换为markdown？

python mediawiki markdown text-processing

回答 6 投票 0

我应该使用哪种哈希算法来比较文本片段？

我有大量的文本，我需要将它们相互比较以检查它们是否相似。每篇文章长约10000字。因此我将预先计算......的哈希值

python algorithm hash text-processing similarity

回答 3 投票 0

AWS Textract OCR 将 PDF 读取为单行，而不是保留换行符

您好，我是 AWS Textract 新手。我正在使用 Amazon Textract 从 PDF 文件中提取文本。但是，输出不会保留原始 PDF 中的换行符。例如，在 PDF 中有...

pdf ocr text-processing amazon-textract

回答 1 投票 0

转换数据以执行逻辑回归

我有一个数据集，其中包含2010年至2023年的板球比赛数据。我附上了数据样本以供参考：团队_1 团队_2 地面比赛日期孟加拉国斯里兰卡米尔普尔 2010-0...

python scikit-learn text-processing

回答 1 投票 0

计算第二列中对应于文件第一列的字符串出现次数

我有这个输入文本文件： CD196_RS15035 正常等位基因 CD196_RS15035 正常等位基因 CD196_RS15035 等位基因截断 CD196_RS15035 等位基因截断 CD196_RS...

linux awk text-processing

回答 2 投票 0

如何使用正则表达式或通配符将多行压缩为单行/更少行？

我想通过用通配符替换更改的值，将具有一些公共元素的多行字符串压缩为单行或更少的行。例子输入： Lorem ipsum dolor 坐在我...

regex wildcard text-processing pattern-recognition

回答 1 投票 0

找不到型号“en_core_web_lg”。它似乎不是 Python 包或数据目录的有效路径。即使它们在同一目录中

我正在尝试不同的文本处理模型。我正在尝试使用 spacy，它的模型是 en_core_web_lg。导入spacy 导入 spacy. 语言从 spacy_langDetect 导入 LanguageDetector 来自 spacy.lang...

python nlp spacy tokenize text-processing

回答 1 投票 0

使用 awk 替换固定位置文件中的字段值

这里的要求是将位置9-12替换为空白，例如，在所有固定大小的记录中。我用了猫文件| awk '{sub(substr($0,9,12)," ",$0);print}' 有效，除非有空格

awk text-processing

回答 3 投票 0

使用 awk 将文件中的固定位置替换为值

这里的要求是将位置9-12替换为空白。我用了猫文件| awk '{sub(substr($0,9,12)," ",$0);print}' 有效，除非前面有空白 9. 试图表明...

awk text-processing

回答 2 投票 0

用一些常见的字符串标准化 pandas 列中的文本

我有以下 DataFrame df id1 id2 文本列 key1 220 ABC公司 key1 220 ABC私人有限公司 key2 300 PQR有限公司密钥 2 300 PQR key2 300 PQR 其他客...

python pandas nlp text-processing

回答 1 投票 0

使用 python 自然语言工具包阅读孟加拉语

我想在 NLTK 的 CategorizedPlainCorpusReader 中阅读孟加拉语文本。对于我在 gedit 文本编辑器中的孟加拉文本文件的快照： sublime 文本编辑器中的文件快照：从快照哟...

python nlp text-processing

回答 2 投票 0

如何从源文件中提取单个函数

我正在做一个关于 Linux 内核中非常长和复杂的函数的小型学术研究。我想弄清楚是否有充分的理由编写 600 或 800 行长的函数......

c regex text-processing code-metrics mcc

回答 6 投票 0

从 Spark 中的文本数据中删除 html 代码

我正在处理 Stack Exchange 数据转储，我想从经常出现的代码中清理问题的主体。我尝试使用 BeautifulSoup 但它留下了出现在鳕鱼内部的文本......

pyspark nlp text-processing

回答 1 投票 0

如何在读取文本文件时保留空行 Python

读取带有空行的通用文本文件，即没有制表符，某些行没有空格。我想用这些空行作为分隔符来处理程序中的文件，但我无法阻止它们......

python text text-processing

回答 1 投票 0

text-processing 相关问题

最新问题