我想知道是否有人能想出一种方法来以更高效的内存方式实现数组,这种方式会自动组织成范围。例;
List testList = new List{1,2,3,4,5,6,7...};
VS
List<Range> testList = new List<Range>{1-3000,3002,4000-5000...};
在此之前,我已经提出一个问题,只是为了确认这是否实际上是一个更有效的内存替代方案。然而,这个问题与实际应用有关,如何实现这个范围列表解决方案。
我想这可能需要一个自定义列表解决方案,它将是一个整体和范围的混合。我想象能够.Add([int])到列表,此时它将确定该值是否会导致添加范围或者只是将int值添加到列表中。
例
RangeList rangeList = new RangeList{1, 4, 7-9};
rangeList.Add(2);
//rangeList -> 1-2, 4, 7-9
rangeList.Add(3);
//rangeList -> 1-3, 4, 7-9
具体到我的实施细节
在我的特殊情况下,我正在逐行分析一个非常大的文档。需要识别满足特定标准的行,然后需要向用户呈现整个行索引列表。
显然,显示“33-32019行标识”优于“33,34,35行......等”。对于这种情况,数字将始终为正数。
我要做的第一件事是创建一个代表你的范围的类。您可以提供一些方便,例如格式化为字符串,以及从int进行隐式转换(这有助于稍后实现范围列表)
public class Range
{
public int Start{get; private set;}
public int End{get; private set;}
public Range(int startEnd) : this(startEnd,startEnd)
{
}
public Range(int start, int end)
{
this.Start = start;
this.End = end;
}
public static implicit operator Range(int i)
{
return new Range(i);
}
public override string ToString()
{
if(Start == End)
return Start.ToString();
return String.Format("{0}-{1}",Start,End);
}
}
然后,您可以开始RangeList
的简单实现。通过提供Add
方法,您可以使用类似于List<T>
的列表初始化器:
public class RangeList : IEnumerable<Range>
{
private List<Range> ranges = new List<Range>();
public void Add(Range range)
{
this.ranges.Add(range);
}
public IEnumerator<Range> GetEnumerator()
{
return this.ranges.GetEnumerator();
}
IEnumerator IEnumerable.GetEnumerator(){
return this.GetEnumerator();
}
}
此时您可以编写一些测试代码:
var rangeList = new RangeList(){
new Range(1,10),
15
};
foreach(var range in rangeList)
Console.WriteLine(range);
// Outputs:
// 1-10
// 15
此时的实例:http://rextester.com/NCZSA71850
接下来要做的是提供Add
的重载,它接受一个int并找到正确的范围或添加一个新的。一个天真的实现可能如下所示(假设在范围上添加了Update
方法)
public void Add(int i)
{
// is it within or contiguous to an existing range
foreach(var range in ranges)
{
if(i>=range.Start && i<=range.End)
return; // already in a range
if(i == range.Start-1)
{
range.Update(i,range.End);
return;
}
if(i == range.End + 1)
{
range.Update(range.Start,i);
return;
}
}
// not in any ranges
ranges.Add(i);
}
此时的实例:http://rextester.com/CHX64125
然而,这有一些缺陷
Add(11)
)Add(7)
这将是在最后而不是在中间。您可以通过在每次添加后应用排序来解决这两个问题,并使用一些逻辑来确定是否应合并范围
private void SortAndMerge()
{
ranges.Sort((a,b) => a.Start - b.Start);
var i = ranges.Count-1;
do
{
var start = ranges[i].Start;
var end = ranges[i-1].End;
if(end == start-1)
{
// merge and remove
ranges[i-1].Update(ranges[i-1].Start,ranges[i].End);
ranges.RemoveAt(i);
}
} while(i-- >1);
}
每次更改列表后都需要调用它。
public void Add(Range range)
{
this.ranges.Add(range);
SortAndMerge();
}
public void Add(int value)
{
// is it within or contiguous to an existing range
foreach(var range in ranges)
{
if(value>=range.Start && value<=range.End)
return; // already in a range
if(value == range.Start-1)
{
range.Update(value,range.End);
SortAndMerge();
return;
}
if(value == range.End + 1)
{
range.Update(range.Start,value);
SortAndMerge();
return;
}
}
// not in any ranges
ranges.Add(value);
SortAndMerge();
}
这里的实例:http://rextester.com/SYLARF47057
还有一些可能的边缘情况,我敦促你解决。
UPDATE
以下将使此工作按预期工作。这将合并任何添加的范围/整数,并按正常方式返回它们。我只更改了Add(Range)方法,我认为这是一种相当干净的方法。
public void Add(Range rangeToAdd)
{
var mergableRange = new List<Range>();
foreach (var range in ranges)
{
if (rangeToAdd.Start == range.Start && rangeToAdd.End == range.End)
return; // already exists
if (mergableRange.Any())
{
if (rangeToAdd.End >= range.Start - 1)
{
mergableRange.Add(range);
continue;
}
}
else
{
if (rangeToAdd.Start >= range.Start - 1
&& rangeToAdd.Start <= range.End + 1)
{
mergableRange.Add(range);
continue;
}
if (range.Start >= rangeToAdd.Start
&& range.End <= rangeToAdd.End)
{
mergableRange.Add(range);
continue;
}
}
}
if (!mergableRange.Any()) //Standalone range
{
ranges.Add(rangeToAdd);
}
else //merge overlapping ranges
{
mergableRange.Add(rangeToAdd);
var min = mergableRange.Min(x => x.Start);
var max = mergableRange.Max(x => x.End);
foreach (var range in mergableRange) ranges.Remove(range);
ranges.Add(new Range(min, max));
}
SortAndMerge();
}
最后,我们需要在if (ranges.Count > 1)
方法中使用SortAndMerge()
来防止在添加第一个范围时出现索引错误。
有了这个,我认为这完全满足了我的问题。