我正在尝试拆分该类型的行:
GM 1 2 3 ! this is a comment
分开评论部分。有几种可能的注释分隔符,!,'和#。 strtok
是明显的解决方案:
card->card_str = strtok(line_buf, "!'#");
生产GM 1 2 3
和this is a comment
。但是,对于这个角色,我需要在第二个字符串中保留分隔符,所以在这种情况下! this is a comment
。是否有捷径可寻?
strtok
很少是解析工作的正确工具,因为它有许多怪癖和副作用。
为了您的目标,您可以使用strcspn()
:
void parse_input_line(const char *line) {
size_t len = strcspn(line, "!'#");
char *p = malloc(len + 1);
if (p != NULL) {
memcpy(p, line, len);
p[len] = '\0';
card->card_str = p;
card->card_comment = p[len] ? strdup(p + len) : NULL;
}
}
或者,您可以使用strpbrk
:
void parse_input_line(const char *line) {
const char *sep = strpbrk(line, "!'#");
if (sep == NULL) {
// no comment
card->card_str = strdup(line);
card->card_comment = NULL;
} else {
size_t len = sep - line;
char *p = malloc(len + 1);
if (p != NULL) {
memcpy(p, line, len);
p[len] = '\0';
card->card_str = p;
card->card_comment = strdup(sep);
}
}
}
您可以使用strndup
使代码更具可读性:
void parse_input_line(const char *line) {
size_t len = strcspn(line, "!'#");
if (p[len] == '\0') {
/* no comment */
card->card_str = strdup(line);
card->card_comment = NULL;
} else {
card->card_str = strndup(line, len);
card->card_comment = strdup(p + len);
}
}
strndup
可能并非在所有系统上都可用,这是一个简单的实现:
size_t strnlen(const char *s, size_t n) {
size_t len;
for (len = 0; len < n; len++) {
if (s[len] == '\0')
break;
}
return len;
}
char *strndup(const char *s, size_t n) {
size_t len = strnlen(s, n);
char *p = malloc(len + 1);
if (p != NULL) {
memcpy(p, s, len);
p[len] = '\0';
}
return p;
}