我具有以下设置来解析csv文件:
package main
import (
"fmt"
"os"
"encoding/csv"
)
type CsvLine struct {
Id string
Array1 [] string
Array2 [] string
}
func ReadCsv(filename string) ([][]string, error) {
f, err := os.Open(filename)
if err != nil {
return [][]string{}, err
}
defer f.Close()
lines, err := csv.NewReader(f).ReadAll()
if err != nil {
return [][]string{}, err
}
return lines, nil
}
func main() {
lines, err := ReadCsv("./data/sample-0.3.csv")
if err != nil {
panic(err)
}
for _, line := range lines {
fmt.Println(line)
data := CsvLine{
Id: line[0],
Array1: line[1],
Array2: line[2],
}
fmt.Println(data.Id)
fmt.Println(data.Array1)
fmt.Println(data.Array2)
}
}
以及我的csv文件中的以下设置:
594385903dss,"['fhjdsk', 'dfjdskl', 'fkdsjgooiertio']","['jflkdsjfl', 'fkjdlsfjdslkfjldks']"
87764385903dss,"['cxxc', 'wqeewr', 'opi', 'iy', 'qw']","['cvbvc', 'gf', 'mnb', 'ewr']"
我的理解是,应将可变长度列表解析为切片,是否可以直接通过csv阅读器执行此操作? (csv输出是通过python项目生成的。)
帮助/建议表示赞赏。
CSV没有“可变长度数组”的概念,它只是一个用逗号分隔的值列表。该格式在RFC 4180中进行了描述,而这正是encoding/csv
包所实现的格式。
您只能从CSV行中获取字符串切片。如何解释这些值取决于您。如果要进一步拆分数据,则必须对数据进行后期处理。
例如,可以使用encoding/csv
包简单地处理您拥有的东西>
regexp
正在测试:
regexp
输出(在
var r = regexp.MustCompile(`'[^']*'`) func split(s string) []string { parts := r.FindAllString(s, -1) for i, part := range parts { parts[i] = part[1 : len(part)-1] } return parts }
上尝试):
s := `['one', 'two', 'three']` fmt.Printf("%q\n", split(s)) s = `[]` fmt.Printf("%q\n", split(s)) s = `['o,ne', 't,w,o', 't,,hree']` fmt.Printf("%q\n", split(s))
使用此Go Playground函数,这就是处理的样子:
["one" "two" "three"] [] ["o,ne" "t,w,o" "t,,hree"]
此输出(在
split()
上尝试):
for _, line := range lines {
data := CsvLine{
Id: line[0],
Array1: split(line[1]),
Array2: split(line[2]),
}
fmt.Printf("%+v\n", data)
}