我正在尝试编写一个函数来模仿 Unix 中 ls 命令的输出。我最初尝试使用 scandir 和 alphasort 来执行此操作,这确实打印了目录中的文件,并且确实对它们进行了排序,但由于某种原因,这个排序列表似乎与文件名的相同“排序列表”不匹配这给出了。
例如,如果我有一个目录包含 file.c、FILE.c 和 ls.c。
ls
按顺序显示它们:file.c FILE.c ls.c
。
但是当我使用 alphasort/scandir 对它进行排序时,它将它们排序为:FILE.c file.c ls.c
ls
如何对目录中的文件进行排序,从而给出如此不同的排序结果?
要模拟默认的
ls -1
行为,请通过调用 使您的程序能够识别区域设置
setlocale(LC_ALL, "");
靠近
main()
的开头,然后使用
count = scandir(dir, &array, my_filter, alphasort);
其中
my_filter()
是一个函数,对于以点 .
开头的名称返回 0,对于所有其他名称返回 1。 alphasort()
是一个 POSIX 函数,使用区域设置排序顺序,与 strcoll()
相同的顺序。
基本实现类似于
#define _POSIX_C_SOURCE 200809L
#define _ATFILE_SOURCE
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <locale.h>
#include <string.h>
#include <dirent.h>
#include <stdio.h>
#include <errno.h>
static void my_print(const char *name, const struct stat *info)
{
/* TODO: Better output; use info too, for 'ls -l' -style output? */
printf("%s\n", name);
}
static int my_filter(const struct dirent *ent)
{
/* Skip entries that begin with '.' */
if (ent->d_name[0] == '.')
return 0;
/* Include all others */
return 1;
}
static int my_ls(const char *dir)
{
struct dirent **list = NULL;
struct stat info;
DIR *dirhandle;
int size, i, fd;
size = scandir(dir, &list, my_filter, alphasort);
if (size == -1) {
const int cause = errno;
/* Is dir not a directory, but a single entry perhaps? */
if (cause == ENOTDIR && lstat(dir, &info) == 0) {
my_print(dir, &info);
return 0;
}
/* Print out the original error and fail. */
fprintf(stderr, "%s: %s.\n", dir, strerror(cause));
return -1;
}
/* We need the directory handle for fstatat(). */
dirhandle = opendir(dir);
if (!dirhandle) {
/* Print a warning, but continue. */
fprintf(stderr, "%s: %s\n", dir, strerror(errno));
fd = AT_FDCWD;
} else {
fd = dirfd(dirhandle);
}
for (i = 0; i < size; i++) {
struct dirent *ent = list[i];
/* Try to get information on ent. If fails, clear the structure. */
if (fstatat(fd, ent->d_name, &info, AT_SYMLINK_NOFOLLOW) == -1) {
/* Print a warning about it. */
fprintf(stderr, "%s: %s.\n", ent->d_name, strerror(errno));
memset(&info, 0, sizeof info);
}
/* Describe 'ent'. */
my_print(ent->d_name, &info);
}
/* Release the directory handle. */
if (dirhandle)
closedir(dirhandle);
/* Discard list. */
for (i = 0; i < size; i++)
free(list[i]);
free(list);
return 0;
}
int main(int argc, char *argv[])
{
int arg;
setlocale(LC_ALL, "");
if (argc > 1) {
for (arg = 1; arg < argc; arg++) {
if (my_ls(argv[arg])) {
return EXIT_FAILURE;
}
}
} else {
if (my_ls(".")) {
return EXIT_FAILURE;
}
}
return EXIT_SUCCESS;
}
请注意,我故意让它变得比您的目的严格需要的更复杂,因为我不希望您只是复制和粘贴代码。您将更容易编译、运行和研究该程序,然后移植所需的更改 - 可能只是一行
setlocale("", LC_ALL);
! -- 对于你自己的程序,而不是尝试向你的老师/讲师/助教解释为什么代码看起来像是从其他地方逐字复制的。
上面的代码甚至适用于在命令行上指定的文件(
cause == ENOTDIR
部分)。它还使用单个函数 my_print(const char *name, const struct stat *info)
来打印每个目录条目;为此,它会为每个条目调用 stat
。
不是构造目录条目的路径并调用
lstat()
,而是打开目录句柄,并使用 my_ls()
收集信息,其方式与 fstatat(descriptor, name, struct stat *, AT_SYMLINK_NOFOLLOW)
基本相同,但 lstat()
是从name
指定的目录开始的相对路径(descriptor
,如果 dirfd(handle)
是开放的 handle
)。确实,为每个目录条目调用 stat 函数之一是“慢”的(特别是如果您执行
DIR *
样式输出)。然而,
/bin/ls -1
的输出是供人类消费的;并且经常通过 ls
或 more
来让人们在闲暇时查看它。这就是为什么我个人认为“额外的” stat() 调用(即使不是真正需要的时候)在这里不是问题。我认识的大多数人类用户都倾向于使用 less
或(我最喜欢的)ls -l
。 (ls -laF --color=auto
表示仅当标准输出是终端时才使用 ANSI 颜色;即当 auto
时。)换句话说,现在您已经有了
isatty(fileno(stdout)) == 1
顺序,我建议您将输出修改为类似于
ls -1
(dash ell,而不是 dash one)。您只需修改 ls -l
即可。