仅使用参数子集作为标识符来缓存 Python 函数结果

Question

有没有一种简单的方法可以基于单个标识符参数在 python 中缓存函数结果？例如，假设我的函数有 3 个参数

arg1

、

arg2

和

id

。有没有一种简单的方法可以仅根据

id

的值来缓存函数结果？也就是说，只要

id

取相同的值，缓存函数就会返回相同的结果，无论

arg1

和

arg2

如何。

背景： 我有一个耗时且重复调用的函数，其中

arg1

和

arg2

是由大型 numpy 数组组成的列表和字典。因此，

functools.lru_cache

不能按原样工作。然而，

arg1

和

arg2

的特定组合只有少数。因此，我的想法是手动指定一些

id

，它为

arg1

和

arg2

的每种可能组合采用唯一值。

Answer 1

def cache(fun):
    cache.cache_ = {}
    def inner(arg1, arg2, id):
        if id not in cache.cache_:
            print(f'Caching {id}') # to check when it is cached
            cache.cache_[id] = fun(arg1, arg2, id)
        return cache.cache_[id]
    return inner
    
@cache
def function(arg1, arg2, arg3):
    print('something')

您可以按照 DarrylG 的建议创建自己的装饰器。您可以在

print(cache.cache_)

内执行

if id not in cache.cache_:

以检查它是否仅缓存

id

的较新值。

您可以使用

cache_

将 cache.cache_ 设为函数属性

PEP 232

。然后当您想要重置

cache_

时，您可以使用

cache.cache_.clear()

。这将使您可以直接访问缓存结果的字典。

function(1, 2, 'a')
function(11, 22, 'b')
function(11, 22, 'a')
function([111, 11], 222, 'a')

print(f'Cache {cache.cache_}') # view previously cached results
cache.cache_.clear() # clear cache
print(f'Cache {cache.cache_}') # cache is now empty

# call some function again to populate cache
function(1, 2, 'a')
function(11, 22, 'b')
function(11, 22, 'a')
function([111, 11], 222, 'a')

编辑：解决 @Bob (OP) 的新评论，在大多数情况下返回对同一对象的引用就足够了，但 OP 的用例似乎需要答案的新副本，可能是由于

function(arg1, arg2, arg3)

被视为的性质基于

arg1

、

arg_2

和

arg3

的唯一性（在“

cache

”函数中唯一性仅使用

id

定义）。在这种情况下，返回对可变对象的相同引用将导致不良行为。正如同一条评论中提到的，

inner

函数中的return语句应该从

return cache.cache_[id]

更改为

return copy.deepcopy(cache.cache_[id])

。

Answer 2

我认为你可以将过多的参数移至单独的函数（调用者），如下所示：

import functools

def get_and_update(a, b, c):
    return {'a': a, 'b': b, 'c': c}

# ->

@functools.lru_cache
def get_by_a(a):
    return {}

def get_and_update(a, b, c):
    res = get_by_a(a)
    res.update(a=a, b=b, c=c)
    return res

x1 = get_and_update('x', 1, 2)
x2 = get_and_update('x', 2, 3)
assert x1 is x2
print(x1, x2, sep='\n')

{'a': 'x', 'b': 2, 'c': 3}
{'a': 'x', 'b': 2, 'c': 3}

Answer 3

另一个变化：我认为您可以使用 @python_user 提到的函数属性来绕过缓存参数。您也可以使用全局变量，但这不太好。

from functools import cache

@cache
def f(n):
    if n < len(f.precompute): 
        return f.precompute[n]

    return compute(n)

仅使用参数子集作为标识符来缓存 Python 函数结果

问题描述投票：0回答：3

3个回答

最新问题

仅使用参数子集作为标识符来缓存 Python 函数结果

问题描述 投票：0回答：3

3个回答

最新问题

问题描述投票：0回答：3