尝试write.table时未实现的类型列表

问题描述 投票:26回答:6

我有以下data.table(data.frame)调用输出:

> head(output)
        Id                                           Title IsProhibited
1 10000074                             Renault Logan, 2005            0
2 10000124              Ñêëàäñêîå ïîìåùåíèå, 345 ì<U+00B2>            0
3 10000175                                          Ñó-øåô            0
4 10000196             3-ê êâàðòèðà, 64 ì<U+00B2>, 3/5 ýò.            0
5 10000387        Samsung galaxy S4 mini GT-I9190 (÷¸ðíûé)            0
6 10000395 Êàðòèíà ""Êðûì. Ïîñåëîê Àðîìàò"" (õîëñò, ìàñëî)            0

我试图将其导出为CSV,如下所示:

> write.table(output, 'output.csv', sep = ',', row.names = FALSE, append = T)

但是,这样做时我收到以下错误:

Error in .External2(C_writetable, x, file, nrow(x), p, rnames, sep, eol,  : 
unimplemented type 'list' in 'EncodeElement'
In addition: Warning message:
In write.table(output, "output.csv", sep = ",", row.names = FALSE,  :
  appending column names to file

我已经尝试将Title转换为字符串,因此它不再像list那样:

toString(output$Title)

但是,我得到了同样的错误。我的类型是:

> class(output)
[1] "data.frame"
> class(output$Id)
[1] "integer"
> class(output$Title)
[1] "list"
> class(output$IsProhibited)
[1] "factor"

谁能告诉我如何将data.frame导出为CSV?

我注意到的另一个奇怪的事情是,如果我写head(output)我的文本编码不正确(如上所示),而如果我只是写output$Title[0:3]它将正确显示文本如下:

> output$Title[0:3]
[[1]]
[1] "Renault Logan, 2005"

[[2]]
[1] "Складское помещение, 345 м²"

[[3]]
[1] "Су-шеф"

关于那个的任何想法?它与我最初的问题有关吗?

编辑:这是我的新输出:

Id  Title   IsProhibited    
10000074    Renault Logan, 2005 0   
10000124    СкладÑкое помещение, 345 м<U+00B2>    0   
10000175    Су-шеф 0   
10000196    3-к квартира, 64 м<U+00B2>, 3/5 ÑÑ‚.  0   
10000387    Samsung galaxy S4 mini GT-I9190 (чёрный)  0   
10000395    Картина \\"Крым. ПоÑелок Ðромат\"\" (холÑÑ‚     маÑло)"    0
10000594    КальÑн 25 Ñм  0   
10000612    1-к квартира, 45 м<U+00B2>, 6/17 ÑÑ‚. 0   
10000816    Гараж, 18 м<U+00B2>   0   
10000831    Платье    0   
10000930    Карбюраторы К-22И, К-22Г от газ 21 и газ 51 0   

请注意线ID 10000395是如何搞砸的?它似乎包含了它自己的引用,它们搞乱了CSV。我该如何解决这个问题?

r dataframe write.table
6个回答
20
投票

正如评论中所提到的,你应该能够做这样的事情(未经测试)将你的list“扁平”成一个字符向量:

output$Title <- vapply(output$Title, paste, collapse = ", ", character(1L))

如前所述,如果你想尝试unlist方法,你可以用output$Title中的各个值“扩展”每一行,如下所示:

x <- vapply(output$Title, length, 1L)          ## How many items per list element
output <- output[rep(rownames(output), x), ]   ## Expand the data frame
output$Title <- unlist(output$Title, use.names = FALSE)  ## Replace with raw values

18
投票

这样做,无论您有多少列:

df <- apply(df,2,as.character)

然后做write.csv


9
投票

data.table包中有一个新函数(在2016年11月引入),它可以很好地处理将data.table对象写入csv,即使在data.table列是列表的情况下也是如此。

fwrite(data.table, file ="myDT.csv")

7
投票

另一种简单方案。也许一个或多个列的类型为list,因此我们需要将它们转换为“字符”或数据框。所以有两个简单的解决方案

  1. 使用 - 转换每列“as.character” df$col1 = as.character(df$col1) df$col2 = as.character(df$col2) .......等等
  2. 最好的将df转换为“矩阵” df = as.matrix(df)

现在将df写入csv。适合我。


1
投票

假设

  • 你要保存的路径是Path,即path=Path
  • df是您要保存的数据帧,

按照这些步骤:

  1. 将qazxsw poi保存为文本文档: qazxsw poi
  2. 将文本文件读入R: df
  3. 现在保存为csv: write.table(df,"Path/df.txt",sep="|")

而已。


0
投票

这些都是优雅的解决方案。

对于喜欢一些R代码到现成包的好奇读者来说,这里是一个R函数,它返回一个非列表数据帧,可以导出并保存为.csv。

输出是有问题的“麻烦”数据框架。

Data = read.table("Path/df.txt",sep="|")

在数据框“输出”上应用该函数:

write.csv(Data, "Path/df.csv")

接下来,您可以通过apply()确认新的(newDF)数据框没有“列出”。这应该成功返回FALSE。

df_unlist<-function(df){

df<-as.data.frame(df)

nr<-nrow(df)

c.names<-colnames(df)

lscols<-as.vector(which(apply(df,2,is.list)==TRUE))

if(length(lscols)!=0){

for(i in lscols){

temp<-as.vector(unlist(df[,i]))

if(length(temp)!=nr){

adj<-nr-length(temp)

temp<-c(rep(0,adj),temp)

}

df[,i]<-temp

} #end for

df<-as.data.frame(df)

colnames(df)<-c.names
}
return(df)
}

继续将新数据帧newDF作为.csv文件保存到您选择的路径中。

newDF<-df_unlist(output)
© www.soinside.com 2019 - 2024. All rights reserved.