将可变长度数组从csv解析为结构

问题描述 投票:0回答:1

我具有以下设置来解析csv文件:

package main

import (
    "fmt"
    "os"
    "encoding/csv"
)

type CsvLine struct {
    Id string
    Array1 [] string
    Array2 [] string
}


func ReadCsv(filename string) ([][]string, error) {

    f, err := os.Open(filename)
    if err != nil {
        return [][]string{}, err
    }
    defer f.Close()

    lines, err := csv.NewReader(f).ReadAll()
    if err != nil {
        return [][]string{}, err
    }
    return lines, nil
}


func main() {

    lines, err := ReadCsv("./data/sample-0.3.csv")
    if err != nil {
        panic(err)
    }

    for _, line := range lines {
                fmt.Println(line)
        data := CsvLine{
            Id: line[0],
            Array1: line[1],
            Array2: line[2],
        }
        fmt.Println(data.Id)
        fmt.Println(data.Array1)
        fmt.Println(data.Array2)
    }
}

以及我的csv文件中的以下设置:

594385903dss,"['fhjdsk', 'dfjdskl', 'fkdsjgooiertio']","['jflkdsjfl', 'fkjdlsfjdslkfjldks']"
87764385903dss,"['cxxc', 'wqeewr', 'opi', 'iy', 'qw']","['cvbvc', 'gf', 'mnb', 'ewr']"

我的理解是,应将可变长度列表解析为切片,是否可以直接通过csv阅读器执行此操作? (csv输出是通过python项目生成的。)

帮助/建议表示赞赏。

string csv go slice
1个回答
3
投票

CSV没有“可变长度数组”的概念,它只是一个用逗号分隔的值列表。该格式在RFC 4180中进行了描述,而这正是encoding/csv包所实现的格式。

您只能从CSV行中获取字符串切片。如何解释这些值取决于您。如果要进一步拆分数据,则必须对数据进行后期处理。

例如,可以使用encoding/csv包简单地处理您拥有的东西>

regexp

正在测试:

regexp

输出(在var r = regexp.MustCompile(`'[^']*'`) func split(s string) []string { parts := r.FindAllString(s, -1) for i, part := range parts { parts[i] = part[1 : len(part)-1] } return parts } 上尝试):

s := `['one', 'two', 'three']`
fmt.Printf("%q\n", split(s))
s = `[]`
fmt.Printf("%q\n", split(s))
s = `['o,ne', 't,w,o', 't,,hree']`
fmt.Printf("%q\n", split(s))

使用此Go Playground函数,这就是处理的样子:

["one" "two" "three"]
[]
["o,ne" "t,w,o" "t,,hree"]

此输出(在split()上尝试):

for _, line := range lines {
    data := CsvLine{
        Id:     line[0],
        Array1: split(line[1]),
        Array2: split(line[2]),
    }
    fmt.Printf("%+v\n", data)
}
© www.soinside.com 2019 - 2024. All rights reserved.