在多维表中查找重复项

问题描述 投票:2回答:2

下面的略微修改版本允许我从多维表(字典样式)中过滤出唯一的字段值。

[url] http://rosettacode.org/wiki/Remove_duplicate_elements#Lua

items = {1,2,3,4,1,2,3,4,"bird","cat","dog","dog","bird"}`
flags = {}
io.write('Unique items are:')
for i=1,#items do
if not flags[items[i]] then
  io.write(' ' .. items[i])
  flags[items[i]] = true
end
end
io.write('\n')`

我所迷惑的是,如果不是……那么……结束”部分实际上是在做什么。对我来说,这很傻,但嘿,它有效;-)现在,我想知道引擎盖下发生了什么。

我希望多维数据集不会冒犯任何人,我指的是一个由多行组成的表,每行在每行上包含多个键值对。

这是我使用的代码,没有很好的适应性,但足以过滤字段名上的唯一值

 for i=1,#table,1 do 

 if not table2[table[i].fieldname] then
    table2[table[i].fieldname] = true 
 end 
 end

 for k,v in pairs(table2) do
     print(k)
 end
lua duplicates key-value lua-table
2个回答
1
投票
function findDuplicates(t)
    seen = {} --keep record of elements we've seen
    duplicated = {} --keep a record of duplicated elements
    for i = 1, #t do
        element = t[i]  
        if seen[element] then  --check if we've seen the element before
            duplicated[element] = true --if we have then it must be a duplicate! add to a table to keep track of this
        else
            seen[element] = true -- set the element to seen
        end
    end 
    return duplicated
end 

if seen[element] then的逻辑是,我们检查是否已经seen表格​​中的元素。好像它们的密钥不存在一样,将返回nill,它被评估为假(这与布尔值false not相同,在lua中有两种类型的假!)。

您可以像这样使用此功能:

t = {'a','b','a','c','c','c','d'}
for key,_ in pairs(findDuplicates(t)) do
    print(key)
end 

但是该功能不适用于多维表,但是此功能将:

function findDuplicates(t)
    seen = {} --keep record of elements we've seen
    duplicated = {} --keep a record of duplicated elements
    local function traverse(subt)
        for i=1, #subt do
            element = subt[i]
            if type(element) == 'table' then
                traverse(element)
            else
                if seen[element] then 
                    duplicated[element] = true
                else
                    seen[element] = true
                end 
            end 
        end 
    end
    traverse(t)
    return duplicated
end 

示例用法:

t = {'a',{'b','a'},'c',{'c',{'c'}},'d'}
for k,_ in pairs(findDuplicates(t)) do
    print(k)
end 

输出

a
c

t = {a='a',b='b',c='c',d='c',e='a',f='d'}

function findDuplicates(t)
    seen = {}
    duplicated = {}
    for key,val in pairs(t) do
        if seen[val] then
            duplicated[val] = true
        else
            seen[val] = true
        end 
    end 
    return duplicated
end 

此方法与以前相同,但是检查相同的value是否与另一个key相关联,如果是,则将该值记为重复。


0
投票

最终这是对我有用的代码。我被要求将其作为单独的答案发布,所以去了。

for i=1,#table1,1 do 

 if not table2[table1[i].fieldname] then
    table2[table1[i].fieldname] = true 
 end 
 end

 for k,v in pairs(table2) do
     print(k)
 end
© www.soinside.com 2019 - 2024. All rights reserved.