我有一个文本文件,我想删除其中的特定模式

问题描述 投票:0回答:1

我尝试使用 AWK 和 SED 命令在 BASH 中进行编码,但没有获得所需的输出,请帮助我使用简单的代码来解决我的问题。看我有一个包含这样内容的文本文件。

>AC201869.46386.47908 Regiella insecticola
AGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGCAGCGGGGAGTAGCTTGCTACTCTGCCGGCGAGCGGC
>JQ765428.1.1430 Pantoea dispersa
GCAGCTACACATGCAAGTCGAACGGCAGCACAGAAGAGCTTGCTCTTTGGGTGGCGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCCGATGGA

我需要如下输出。

>Regiella insecticola
AGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGCAGCGGGGAGTAGCTTGCTACTCTGCCGGCGAGCGGC
>Pantoea dispersa
GCAGCTACACATGCAAGTCGAACGGCAGCACAGAAGAGCTTGCTCTTTGGGTGGCGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCCGATGGA

我尝试了这样的命令和其他命令,但它们不起作用

sed 's/[1-9]/./g' silva_species_assignment_v132.fa -> textfile.txt 
awk sed fasta
1个回答
0
投票

以下简单的

sed
脚本将删除
>
和第一个空格之间的所有内容。

sed 's/^>[^ ]* />/' file.fasta >newfile.fasta
© www.soinside.com 2019 - 2024. All rights reserved.