我正在使用csvparser解析一个巨大的csv(1.2GB)并尝试从解析的csv中获取某些列数据。我试图在处理后将数据推送到数组,但只将空数组作为输出。我该如何修复此代码?
var parse = require('csv-parse');
var output = []
var parser = parse({
delimiter: '\t',
columns: true
}, function(err, csvLine) {
for (var l = 0; l < csvLine.length; l++) {
output.push(csvLine[l].id)
}
});
console.log(output)
fs.createReadStream('file.csv', {
encoding: 'utf8'
}).pipe(parser);
console.log(output)
的输出总是一个空数组。请帮我解决这个问题。
我试着理解这里的帖子 - Save csv-parse output to a variable。但我无法理解和修复代码。
因为异步。行console.log(输出)在声明变量的声明之后运行。那时输出变量没有值。
当所有数据从csv读取时,你必须在循环后访问输出变量,如下所示。
var parse = require('csv-parse');
var fs = require('fs');
var output = []
var parser = parse({
delimiter: ',',
columns: true
}, function(err, csvLine) {
for (var l = 0; l < csvLine.length; l++) {
output.push(csvLine[l].visitortype)
}
console.log(output)
});
fs.createReadStream('file.csv', {
encoding: 'utf8'
}).pipe(parser);
使用fast-csv
将文件解析为ReadableStream
,然后使用异步迭代(for await
)逐行处理它。它更简单。
const csv = require("fast-csv")
let myList=[];
const csvStream = csv.fromPath(filename);
for await(const row of csvStream) {
myList.push(row[1]); // get the second column
}