读取器包中的Read.Table与Read_Table - Readr添加的额外列

问题描述 投票:0回答:1

我正在尝试使用readr包读取zip文件。我原来的csv文件有170列。

使用常规read.table函数将zip文件读入R时,不会添加额外的列:

data1 <- read.table(unz(zip_file,csv_file), skip = 10, header=T, quote="\"", sep=",")

当我尝试用read_table重现这个时,如下所示:

data2 <- read_table(unz(zip_file,csv_file), skip = 10)

还有更多的额外列。

当我使用read.table时有170列,使用read_table时有1461列。

下面是excel的一些列的列表(这样你就可以了解原始的内容)并且我想知道如何使用read_table函数来读取所有内容而不添加额外的列:

Column Names: 
A
B
C
D (A)
D (B)
E F
G
A B C : 2017 D E - F G: H I
J.org - B : L -- K.org: F C
2016 TEST TESTING : Baltimore TEST TESt: H B

我认为有一堆空格,破折号,冒号等会导致read_table添加额外的列。

如何避免使用额外的列但同时保持列的原始格式?

谢谢!

r readr
1个回答
1
投票

如果你使用readr::read_csv它应该工作而不添加额外的列,因为它正确地从你的CSV文件中选择适当的分隔符。

data2 <- read_csv(unz(zip_file,csv_file), skip = 10)

© www.soinside.com 2019 - 2024. All rights reserved.