我尝试使用 AWK 和 SED 命令在 BASH 中进行编码,但没有获得所需的输出,请帮助我使用简单的代码来解决我的问题。看我有一个包含这样内容的文本文件。
>AC201869.46386.47908 Regiella insecticola
AGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGCAGCGGGGAGTAGCTTGCTACTCTGCCGGCGAGCGGC
>JQ765428.1.1430 Pantoea dispersa
GCAGCTACACATGCAAGTCGAACGGCAGCACAGAAGAGCTTGCTCTTTGGGTGGCGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCCGATGGA
我需要如下输出。
>Regiella insecticola
AGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGCAGCGGGGAGTAGCTTGCTACTCTGCCGGCGAGCGGC
>Pantoea dispersa
GCAGCTACACATGCAAGTCGAACGGCAGCACAGAAGAGCTTGCTCTTTGGGTGGCGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCCGATGGA
我尝试了这样的命令和其他命令,但它们不起作用
sed 's/[1-9]/./g' silva_species_assignment_v132.fa -> textfile.txt
以下简单的
sed
脚本将删除 >
和第一个空格之间的所有内容。
sed 's/^>[^ ]* />/' file.fasta >newfile.fasta