从包含信息的字符串创建具有初始化属性的对象列表

问题描述 投票:9回答:4

我有一个看起来像这样的字符串:

random text 12234
another random text 

User infos: 

User name : John
ID : 221223
Date : 23.02.2018
Job: job1

User name : Andrew
ID : 378292
Date : 12.08.2017
Job: job2

User name : Chris
ID : 930712
Date : 05.11.2016
Job : job3

some random text

而这堂课:

class User
{
   public string UserName { get; set; }
   public string ID { get; set; }
   public string Date { get; set; }
   public string Job { get; set; }
   public User(string _UserName, string _ID, string _Date, string _Job)
   {
       UserName = _UserName
       ID = _ID;
       Date = _Date;
       Job = _Job;
   }
}

我想用该字符串创建一个包含信息的用户列表。

我试过这样做:

   List<User> Users = new List<User>();

    string Data = (the data above)
    string[] lines = Data.Split(new string[] { Environment.NewLine }, StringSplitOptions.RemoveEmptyEntries);

    List<string> UserNames = new List<string>();
    List<string> IDs = new List<string>();
    List<string> Dates = new List<string>();
    List<string> Jobs = new List<string>();

    foreach (var line in lines)
    {
        if (line.StartsWith("User name : "))
        {
            UserNames.Add(Line.Remove(0, 12));                 
        }

        if (Line.StartsWith("ID : "))
        {
            IDs.Add(Line.Remove(0, 5));
        }

        if (Line.StartsWith("Date : "))
        {
           Dates.Add(Line.Remove(0, 7));
        }

        if (Line.StartsWith("Job : "))
        {
           Jobs.Add(Line.Remove(0, 6));
        }        
    }
    var AllData = UserNames.Zip(IDs, (u, i) => new { UserName = u, ID = i });

    foreach (var data in AllData)
    {
        Users.Add(new User(data.UserName, data.ID, "date", "job"));
    }

但我只能使用此代码组合两个列表。此外,我为每个用户提供了4个以上的值(上面的字符串只是一个简短的例子)。

有更好的方法吗?谢谢。

c# string list class object
4个回答
8
投票

因为它似乎总是4行信息,你可以通过分裂的数组4循环lines。在每一步,你将分割冒号:并收集最后一项,这是所需的值:

编辑:在这种情况下,我建议寻找数据的START。

int startIndex = Data.IndexOf("User name");

编辑2:

也以另一行文字结尾

然后你可以使用LastIndexOf找到重要信息的结尾:

int endIndex = Data.LastIndexOf("Job");
int lengthOfLastLine = Data.Substring(endIndex).IndexOf(Environment.NewLine);
endIndex += lengthOfLastLine;

然后简单地从startindex开始直到结束时使用SubString

string [] lines = Data.Substring(startIndex, endIndex - startIndex)
                     .Split(new string[] { Environment.NewLine }, StringSplitOptions.RemoveEmptyEntries);
List<User> allUsers = new List<UserQuery.User>();

for (int i = 0; i < lines.Length; i += 4)
{
    string name = lines[i].Split(':').Last().Trim();
    string ID   = lines[i + 1].Split(':').Last().Trim();
    string Date = lines[i + 2].Split(':').Last().Trim();
    string Job  = lines[i + 3].Split(':').Last().Trim();
    allUsers.Add(new User(name, ID, Date, Job));
}

啊,你应该把Trim带走。该解决方案应该是可读的。在我的解决方案中,4的硬编码步长实际上很烦人

免责声明:只有格式不变,此解决方案才有效。如果行的顺序应该改变,它将返回错误的结果


3
投票

您可以直接创建用户列表,而不是检查每一行以将每个行添加到列表中。你去:

  1. 拆分双新线
  2. 按新线拆分
  3. 建立每个用户

码:

var users = data.Split(new[] {"\n\n" }, StringSplitOptions.None).Select(lines =>
{
    var line = lines.Split(new[] { "\n" }, StringSplitOptions.None);
    return new User(line[0].Substring(11), line[1].Substring(4), line[2].Substring(6), line[3].Substring(5));
});

Try it online!

作为@Mong Zhu回答,删除前后的所有内容。在这一点上,这是我不会试图解决的另一个问题。在解析数据之前和之后消除噪音。


2
投票

对于一个强大,灵活和自我记录的解决方案,您可以轻松添加新字段,忽略所有无关文本,并满足您的文件格式的变化(例如,这似乎是例如,“ ID:“仅在第3条记录中”,我会使用Regex和一些LINQ来返回记录集合,如下所示:

    using System.Text.RegularExpressions;

    public class Record
    {
        public string Name { get; set; }
        public string ID { get; set; }
        public string Date { get; set; }
        public string Job { get; set; }
    }
    public List<Record> Test()
    {
        string s = @"User name : John
        ID : 221223
        Date : 23.02.2018
        Job: job1

        User name : Andrew
        ID : 378292
        Date : 12.08.2017
        Job: job2

        User name : Chris
        ID: 930712
        Date : 05.11.2016
        Job: job3
        ";
        Regex r = new Regex(@"User\sname\s:\s(?<name>\w+).*?ID\s:\s(?<id>\w+).*?Date\s:\s(?<date>[0-9.]+).*?Job:\s(?<job>\w\w+)",RegexOptions.Singleline);
        r.Matches(s);
        return (from Match m in r.Matches(s)
                 select new Record
                 {
                     Name = m.Groups["name"].Value,
                     ID = m.Groups["id"].Value,
                     Date = m.Groups["date"].Value,
                     Job = m.Groups["job"].Value
                 }).ToList();
    }

2
投票

CSV格式似乎是你正在寻找的(因为你想在这个文件中添加一些标题,实际的CSV星在第6行):

random text 12234
another random text 

User infos: 

UserName;ID;Date;Job
John;221223;23.02.2018;job1
Andrew;378292;12.08.2017;job2
Chris;930712;05.11.2016;job3

然后你可以读取这个文件并解析它:

var lines = File.ReadAllLines("pathToFile");
var dataStartIndex = lines.IndexOf("UserName;ID;Date;Job");
var Users = lines.Skip(dataStartIndex + 1).Select(s =>
{
   var splittedStr = s.Split(';');
   return new User(splittedStr[0], splittedStr[1], splittedStr[2], splittedStr[3]);
}).ToList();

如果您正在使用控制台条目,则跳过标题部分,让用户在不同的字符串上为每个用户输入逗号分隔值。以同样的方式解析它:

var splittedStr = ReadLine().Split(';');
var userToAdd = new User(splittedStr[0], splittedStr[1], splittedStr[2] , splittedStr[3]);
Users.Add(userToAdd);
© www.soinside.com 2019 - 2024. All rights reserved.