排序并删除一行中的重复单词

Question

sort

命令让我可以按字母顺序排列行并删除重复的行。我需要类似的东西，可以对单行上的单词进行排序，将它们按顺序排列，并删除任何重复项。有这个命令吗？

例如：

zebra ant spider spider ant zebra ant

更改为：

ant spider zebra

第一个单词之前或最后一个单词之后没有空格。

Answer 1

这对我有用：

$ echo "zebra ant spider spider ant zebra ant" | xargs -n1 | sort -u | xargs
ant spider zebra

您可以使用

xargs -n1

将单行中的单词列表转换为单列，使用

sort -u

并使用

xargs

转换回单行。

Answer 2

shell 的构建是为了解析

[:blank:]

单独的单词列表。因此 xargs 的使用是完全多余的。 “独特”的东西可以完成，但它只是更容易使用排序。

echo $(printf '%s\n' zebra ant spider spider ant zebra ant | sort -u)

Answer 3

使用

tr

将空格更改为新行，然后使用

sort

，最后将新行更改回空格。

echo $(tr ' ' '\n' <<< "zebra ant spider spider ant zebra ant" | sort -u)

Answer 4

在此之前的所有答案一次只能对一行进行排序。以下可用于将此类行的完整列表通过管道传输到它会打印每行的唯一单词的排序列表。

单行：

awk '{ delete a; for (i=1; i<=NF; i++) a[$i]++; n=asorti(a, b); for (i=1; i<n; i++) printf b[i]" "; print b[n] }'

作为可执行脚本文件

sort_line_words

:

#!/usr/bin/env -S awk -f
# original source:
# https://stackoverflow.com/a/25823667/586229
#
# Usage:
#   awk -f sort_line_words < INPUT_FILE > OUTPUT_FILE
#   cat INPUT_FILE | sort_line_words
# Example:
#   awk -f sort_line_words < input.txt > output.txt
#   cat input.txt | sort_line_words | sort -u

{
    delete a
    for (i = 1; i <= NF; i++) {
        a[$i]++
        n = asorti(a, b)
    }
    for (i = 1; i < n; i++) {
        printf b[i]" "
    }
    print b[n]
}

感谢@jaypai 在此使用了很多语法。

示例：

$ cat file
group label wearable edit_group edit_group_order label_max camera_elevation camera_distance name label_min label_max value_min value_max camera_angle camera_elevation id
id group label wearable edit_group clothing_morph value_min value_max name value_default clothing_morph group
id label show_simple wearable name edit_group edit_group_order group clothing_morph clothing_morph camera_distance label_min label_max value_min value_max camera_distance camera_angle
id group label wearable name edit_group clothing_morph value_min value_max value_default
group label wearable id clothing_morph edit_group edit_group_order label_min label_max value_min value_max name camera_distance camera_angle camera_elevation
id group label wearable edit_group name label_min label_max value_min value_max wearable
name id group wearable edit_group id group wearable id group wearable id group wearable value_min value_max

$ cat file | sort_line_words
camera_angle camera_distance camera_elevation edit_group edit_group_order group id label label_max label_min name value_max value_min wearable
clothing_morph edit_group group id label name value_default value_max value_min wearable
camera_angle camera_distance clothing_morph edit_group edit_group_order group id label label_max label_min name show_simple value_max value_min wearable
clothing_morph edit_group group id label name value_default value_max value_min wearable
camera_angle camera_distance camera_elevation clothing_morph edit_group edit_group_order group id label label_max label_min name value_max value_min wearable
edit_group group id label label_max label_min name value_max value_min wearable
edit_group group id name value_max value_min wearable

Answer 5

使用

python

$ echo "zebra ant spider spider ant zebra ant" | python -c 'import sys; print(" ".join(sorted(set(sys.stdin.read().split()))))'
ant spider zebra

Answer 6

使用

perl

：

perl -lane '
  %a = map { $_ => 1 } @F;
  print join qq[ ], sort keys %a;
' <<< "zebra ant spider spider ant zebra ant"

结果：

ant spider zebra

Answer 7

使用

awk

：

awk '{for(i=1;i<=NF;i++) a[$i]++} END{for(i in a) printf i" ";print ""}' INPUT_FILE

测试：

[jaypal:~/Temp] cat file
zebra ant spider spider ant zebra ant
[jaypal:~/Temp] awk '{for (i=1;i<=NF;i++) a[$i]++} END{for (i in a) printf i" ";print ""}' file
zebra spider ant

排序并删除一行中的重复单词

问题描述投票：0回答：7

7个回答

使用
`python`

使用
`awk`
：

测试：

最新问题

排序并删除一行中的重复单词

问题描述 投票：0回答：7

7个回答

使用python

使用awk：

测试：

最新问题

问题描述投票：0回答：7

使用
`python`

使用
`awk`
：