“ls”如何对文件名排序?

问题描述 投票:0回答:2

我正在尝试编写一个函数来模仿 Unix 中 ls 命令的输出。我最初尝试使用 scandir 和 alphasort 来执行此操作,这确实打印了目录中的文件,并且确实对它们进行了排序,但由于某种原因,这个排序列表似乎与文件名的相同“排序列表”不匹配这给出了。

例如,如果我有一个目录包含 file.cFILE.cls.c

ls
按顺序显示它们:
file.c FILE.c ls.c
。 但是当我使用 alphasort/scandir 对它进行排序时,它将它们排序为:
FILE.c file.c ls.c

ls
如何对目录中的文件进行排序,从而给出如此不同的排序结果?

c linux bash sorting unix
2个回答
8
投票

要模拟默认的

ls -1
行为,请通过调用

使您的程序能够识别区域设置
setlocale(LC_ALL, "");

靠近

main()
的开头,然后使用

count = scandir(dir, &array, my_filter, alphasort);

其中

my_filter()
是一个函数,对于以点
.
开头的名称返回 0,对于所有其他名称返回 1。
alphasort()
是一个 POSIX 函数,使用区域设置排序顺序,与
strcoll()
相同的顺序。

基本实现类似于

#define  _POSIX_C_SOURCE 200809L
#define  _ATFILE_SOURCE
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <locale.h>
#include <string.h>
#include <dirent.h>
#include <stdio.h>
#include <errno.h>

static void my_print(const char *name, const struct stat *info)
{
    /* TODO: Better output; use info too, for 'ls -l' -style output? */
    printf("%s\n", name);
}

static int my_filter(const struct dirent *ent)
{
    /* Skip entries that begin with '.' */
    if (ent->d_name[0] == '.')
        return 0;

    /* Include all others */
    return 1;
}

static int my_ls(const char *dir)
{
    struct dirent **list = NULL;
    struct stat     info;
    DIR            *dirhandle;
    int             size, i, fd;

    size = scandir(dir, &list, my_filter, alphasort);
    if (size == -1) {
        const int cause = errno;

        /* Is dir not a directory, but a single entry perhaps? */
        if (cause == ENOTDIR && lstat(dir, &info) == 0) {
            my_print(dir, &info);
            return 0;
        }

        /* Print out the original error and fail. */
        fprintf(stderr, "%s: %s.\n", dir, strerror(cause));
        return -1;
    }

    /* We need the directory handle for fstatat(). */
    dirhandle = opendir(dir);
    if (!dirhandle) {
        /* Print a warning, but continue. */
        fprintf(stderr, "%s: %s\n", dir, strerror(errno));
        fd = AT_FDCWD;
    } else {
        fd = dirfd(dirhandle);
    }

    for (i = 0; i < size; i++) {
        struct dirent *ent = list[i];

        /* Try to get information on ent. If fails, clear the structure. */
        if (fstatat(fd, ent->d_name, &info, AT_SYMLINK_NOFOLLOW) == -1) {
            /* Print a warning about it. */
            fprintf(stderr, "%s: %s.\n", ent->d_name, strerror(errno));
            memset(&info, 0, sizeof info);
        }

        /* Describe 'ent'. */
        my_print(ent->d_name, &info);
    }

    /* Release the directory handle. */
    if (dirhandle)
        closedir(dirhandle);

    /* Discard list. */
    for (i = 0; i < size; i++)
        free(list[i]);
    free(list);

    return 0;
}

int main(int argc, char *argv[])
{
    int arg;

    setlocale(LC_ALL, "");

    if (argc > 1) {
        for (arg = 1; arg < argc; arg++) {
            if (my_ls(argv[arg])) {
                return EXIT_FAILURE;
            }
        }
    } else {
        if (my_ls(".")) {
            return EXIT_FAILURE;
        }
    }

    return EXIT_SUCCESS;
}

请注意,我故意让它变得比您的目的严格需要的更复杂,因为我不希望您只是复制和粘贴代码。您将更容易编译、运行和研究该程序,然后移植所需的更改 - 可能只是一行

setlocale("", LC_ALL);
! -- 对于你自己的程序,而不是尝试向你的老师/讲师/助教解释为什么代码看起来像是从其他地方逐字复制的。

上面的代码甚至适用于在命令行上指定的文件(

cause == ENOTDIR
部分)。它还使用单个函数
my_print(const char *name, const struct stat *info)
来打印每个目录条目;为此,它会为每个条目调用
stat

不是构造目录条目的路径并调用

lstat()
,而是打开目录句柄,并使用
my_ls()
收集信息,其方式与
fstatat(descriptor, name, struct stat *, AT_SYMLINK_NOFOLLOW)
基本相同,但
lstat()
是从
name
指定的目录开始的相对路径(
descriptor
,如果
dirfd(handle)
是开放的
handle
)。

确实,为每个目录条目调用 stat 函数之一是“慢”的(特别是如果您执行

DIR *

样式输出)。然而,

/bin/ls -1
的输出是供人类消费的;并且经常通过
ls
more
来让人们在闲暇时查看它。这就是为什么我个人认为“额外的” stat() 调用(即使不是真正需要的时候)在这里不是问题。我认识的大多数人类用户都倾向于使用
less
或(我最喜欢的)
ls -l
。 (
ls -laF --color=auto
表示仅当标准输出是终端时才使用 ANSI 颜色;即当
auto
时。)

换句话说,现在您已经有了

isatty(fileno(stdout)) == 1

顺序,我建议您将输出修改为类似于

ls -1
(dash ell,而不是 dash one)。您只需修改
ls -l
即可。
    


3
投票

当然,这会随着语言的变化而变化。尝试:

my_print()

并且:

$ LANG=C ls -1 FILE.c file.c ls.c

这与
“整理顺序”

有关。无论如何衡量都不是一个简单的问题。

© www.soinside.com 2019 - 2024. All rights reserved.