text-processing 相关问题

机制化电子文本的创建或操作。

保留列的每组重复项中最常见的行

我有一个相对复杂的 Bash 问题。我有一个两列 CSV 文件,其中第一列中包含重复值,以及这些重复值中的重复项(第二列中...

回答 1 投票 0

在 bash 中查找文件中最常见的行

我有一个字符串文件: 字符串-字符串-123 字符串-字符串-123 字符串-字符串-123 字符串-字符串-12345 字符串-字符串-12345 字符串-字符串-12345-123 如何检索 bash 中最常见的行(str...

回答 3 投票 0

用正则表达式之间的文本替换正则表达式

假设我想改变 \hl{abc} \{} { } \hl{12} 到 ABC \{} } { 12 即我想从它们内部的内容中删除 \hl{ 和 } 。我怎样才能在 vim 中做到这一点?我正在考虑 :s/\hl{.*}//g 但是...

回答 2 投票 0

将 github actions 中的单词列表转换为 json 数组并用作策略矩阵

我在 github actions 中有一个 shell Bash 中带有空格的单词列表。例如 你好1 你好2 你好3 目标是将此列表转换为 JSON 数组格式,将其写入输出变量并使用 i...

回答 2 投票 0

如何检索当前行指定光标位置之前和之后指定边界字符的文本?

边界字符的示例可以是:“”、''、()、空格、^$(如果未明确指定任何其他边界字符,则为行的开头和结尾)。边界字符应该很容易

回答 1 投票 0

uʍop-ǝpᴉsdn 文本如何工作?

这是我发现的一个网站,可以生成任何英文文本的颠倒版本。 它是如何工作的? unicode有颠倒的字符吗?或者是什么? 如何编写自己的文本翻转功能?

回答 7 投票 0

“ascii”编解码器无法解码位置 0 中的字节 0xef:序号不在范围内(128):BookNLP

我正在尝试在 Colab 中的 txt 文件上运行 BookNLP 模型,但我不断收到错误。 代码: input_file=“爱丽丝.txt” 输出目录=“爱丽丝” book_id=“爱丽丝” 书本LP。

回答 1 投票 0

组合文本嵌入

将文本嵌入组合成一个然后在向量数据库中搜索的最佳方法是什么? 我正在尝试创建一个推荐系统,因此当用户单击另一个类别时,我会得到嵌入的文本...

回答 1 投票 0

为什么 sort -u 或 uniq 不删除串联文本文件中的重复项?

我正在尝试编写一个 bash 脚本,从我的盒子中的不同位置获取三个用户字典,并将它们组合起来,删除重复项,然后将它们写回到各自的区域。 然而...

回答 2 投票 0

如何让grep用NULL字符分隔输出?

假设我们正在对一堆文件进行多行正则表达式模式搜索,并且我们想要从 grep 中提取匹配项。默认情况下,grep 输出由换行符分隔的匹配项,但由于我们正在做

回答 4 投票 0

如何将带有一些无组织工作表的 Excel 文件解析为 csv?

我有一个 Excel 凭证文件,我想解析它并从中创建一个干净的 csv,我不知道如何处理这个问题,该文件也没有完全组织起来,这使得我不得不思考......

回答 1 投票 0

寻找Python库来删除文本中的无关字符和空格

我正在开发一个涉及处理文本数据的项目。我的目标是纠正与文本中不必要的字符和空格特别相关的错误。我正在寻找有关 sui 的建议...

回答 1 投票 0

为什么我的Python脚本没有调用GPT-3.5-turbo API?

情况 我的 Python 脚本编译并成功运行。它创建输出文件 (edited.txt),但不会向该文件写入任何内容。 API仪表板显示没有使用情况,所以我猜测脚本......

回答 1 投票 0

如何使用 shell 从 CSV 中提取包含引号的列?

我有一个 CSV 文件,但与相关问题不同,它有一些列包含带逗号的双引号字符串,例如 foo、bar、baz、quux 11,"第一行,第二列",13.0,6 210、“第二栏……

回答 2 投票 0

如何使用 shell 从 CSV 中提取包含引号逗号的列?

我有一个 CSV 文件,但与相关问题不同,它有一些列包含带逗号的双引号字符串,例如 foo、bar、baz、quux 11,"第一行,第二列",13.0,6 210、“第二栏……

回答 2 投票 0

确定错误类型及其在文本中的位置

我有一个 Excel 文件,其中有数千行,其中包含有关合同履行的信息。使用模板将数据加载到系统中。但有时模板会被填满

回答 1 投票 0

如何使用 jq 为每个根级对象键打印一行?

我想通过以紧凑模式(-c)打印来压缩json文件的空间,但我想在每个根级对象之后添加一个新行。 例如,对于以下对象 { “一”:{...

回答 1 投票 0

如何使用sed复制十六进制格式的行?

我有一个内存转储文件,我可以在sublime中以十六进制格式查看它,它如下所示: 7f45 4c46 0201 0100 0000 0000 0000 0000 0400 3e00 0100 0000 0000 0000 0000 0000 4000 000...

回答 1 投票 0

将空格分隔的不完整单词组合成有意义的单词

我是 NLP 新手,在任何地方都找不到合适的解决方案。我想将句子中以空格分隔的不完整单词组合成完整单词。 例如,以下句子 incomp...

回答 1 投票 0

如何使用jq打印由制表符“”分隔的JSON数组元素

我正在尝试使用 .import 函数将 json 文档导入到 sqlite3 数据库中。据我所知, sqlite3 .import 期望 JSON 数据每行一行,并且项目数匹配...

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.