查找具有类似产品的类别 - 低效率 - Go

问题描述 投票:1回答:1

你好,对不起,我的英语


我有一个类别和与每个类别相关的产品清单

cats = [cat1, cat2, cat3]

prod = {
 cat1 = [a, b, c]
 cat2 = [d, e, c]
 cat3 = [z, x, w]
}

我想要什么

{
    group1: [cat1, cat2]
    group2: [cat3]
}

我需要对与您的产品有相同之处的类别进行分组。

一切都为我工作,但我有 400,000 类,做两个循环的量不好。我的算法需要4天才能完成

我刚开始使用golang,有谁知道如何处理这个问题?谢谢大家

  • 小组可以是任何规模的
  • 不同类别的产品数量不同
  • 相似性百分比可能会改变

func main() {

    cats, prod := getDataDB()

    for _, cat1 := range cats {

        for _, cat2 := range cats {

            result := percentageSimilarity(prod[cat1], prod[cat2])

            if result > 50{
                // save group
            }
        
        }
        
    }

}

func percentageSimilarity(a, b []string) int {

    sum := 0
    percentage := 0

    if len(a) > len(b) {

        for _, key := range a {

            if contains(b, key) {
                sum++
            }

        }

        percentage = sum * 100 / len(b)

    } else {

        for _, key := range b {

            if contains(a, key) {
                sum++
            }

        }

        percentage = sum * 100 / len(a)

    }

    return percentage

}

func contains(s []string, e string) bool {
    for _, a := range s {
        if a == e {
            return true
        }
    }
    return false
}
algorithm performance go maps slice
1个回答
1
投票

首先,从最少的产品到最多的产品进行分类。

接着,创建一个 地图 从产品到包含该产品的类别数组。

现在做这样的事情。

for each category
   create empty category_shared_products map from category to count of shared products
   for each product
      for each other_category containing that product
          add/increment category_shared_products[other_category]
   decide what to merge this category into (if anything)

有很多细节要做对。 但现在我们不看每一对类别,而只看实际上有共同产品的类别对。

© www.soinside.com 2019 - 2024. All rights reserved.