通过fgets从txt文件中检索到的文本的某些部分在c中丢失了

问题描述 投票:0回答:2

我正在通过fgets读取一个名为“dictionary.txt”的文件并打印出来,但是当我运行程序时,“dictionary.txt”中10%的头文本会丢失。

我怀疑是否缓冲区的大小很小,但将MAX_INT更改为更大的数字也无济于事。

#include <stdio.h>
#include<string.h>
#define MAX_INT 50000

void main() {
    FILE *fp;
    char* inp = (char*)malloc(sizeof(char)*MAX_INT);
    int i;
    int isKorean = 0;
    char* buffer[MAX_INT];
    char* ptr = (char*)malloc(sizeof(char)*MAX_INT);

    if (fp = fopen("C://Users//user//Desktop//dictionary.txt", "r")) {
        while (fgets(buffer, sizeof(buffer), fp)) {
            ptr = strtok(buffer, "/"); //a line is looking like this : Umberto/영어("English" written in Korean)
            for (i = 0; i < strlen(ptr); i++) {
                if ((ptr[i] & 0x80) == 0x80) isKorean = 1; //check whether it's korean
                if (!isKorean) printf("%c", ptr[i]); //if it's not korean, then print one byte
                else {
                    printf("%c%c", ptr[i], ptr[i + 1]); //if it's korean, then print two bytes
                    i++;
                }
                isKorean = 0;
                printf("\n");
            }
            ptr = strtok(NULL, " ");
            printf("tagger:%s\n", ptr); //print the POS tagger of the word(it's in dictionary)
        }

        fclose(fp);
    }
}
c size buffer
2个回答
0
投票

函数fgets有这个syncpsis:

char *
 fgets(char * restrict str, int size, FILE * restrict stream);

那么为什么要将buffer作为指针数组? char buffer[MAX_INT]是我们需要的。 以下陈述:if (fp = fopen("/Users/weiyang/code/txt", "r"))不安全,最好在分配后添加括号。


0
投票

好的,我找到了答案。

通过在“ptr = strtok(NULL,”“);”之后添加以下内容刚刚工作。我还必须对tagger部分做一些事情,因为它也是用韩文写的。

ptr = strtok(NULL, " ");
			for (i = 0; i < strlen(ptr); i++) {
				printf("%c%c", ptr[i], ptr[i + 1]); //if it's korean, then print two bytes
				i++;
			}
© www.soinside.com 2019 - 2024. All rights reserved.