我正在尝试将Celery作为任务管理来运行,并且在组中运行多个任务时遇到了麻烦。组中的所有任务完成后,我想收集结果。如果组中只有1个任务,则工作流工作正常,它等待所有任务完成。但是,如果组中有2个或更多任务,或者我没有正确运行它,它将失败。下面是代码示例
@celery2.task(name='square')
def square(a):
log.info(f'In square group {a}')
return a**a
@celery2.task(name='add_one')
def add_one(a):
b = a+1
return b
@celery2.task(name='add_one_and_square')
def add_one_and_square(a):
return (add_one.s(a) | square.s())
@celery2.task(name='collect')
def collect(a):
return a
@celery2.task(name='group-task')
def group_square(num):
return group([(add_one_and_square(i)) for i in range(num)])
正在运行的芹菜工作流:
res = (add.s(2,3) | group_square.s()|collect.s())
res.apply_async()
下面是从输出中捕获的数据,我看到创建的签名不确定这是否是正确的方法或如何在单个组中运行任务链,因此其行为类似于组中单个任务。
{'task': 'celery.group',
'args': [],
'kwargs': {'tasks': [{'task': 'celery.chain',
'args': [],
'kwargs': {'tasks': [{'task': 'add_one',
'args': [0],
'kwargs': {},
'options': {},
'subtask_type': None,
'immutable': False,
'chord_size': None},
{'task': 'square',
'args': [],
'kwargs': {},
'options': {},
'subtask_type': None,
'immutable': False,
'chord_size': None}]},
'options': {},
'subtask_type': 'chain',
'immutable': False,
'chord_size': None},
{'task': 'celery.chain',
'args': [],
'kwargs': {'tasks': [{'task': 'add_one',
'args': [1],
'kwargs': {},
'options': {},
'subtask_type': None,
'immutable': False,
'chord_size': None},
{'task': 'square',
'args': [],
'kwargs': {},
'options': {},
'subtask_type': None,
'immutable': False,
'chord_size': None}]},
'options': {},
'subtask_type': 'chain',
'immutable': False,
'chord_size': None},
{'task': 'celery.chain',
'args': [],
'kwargs': {'tasks': [{'task': 'add_one',
'args': [2],
'kwargs': {},
'options': {},
'subtask_type': None,
'immutable': False,
'chord_size': None},
{'task': 'square',
'args': [],
'kwargs': {},
'options': {},
'subtask_type': None,
'immutable': False,
'chord_size': None}]},
'options': {},
'subtask_type': 'chain',
'immutable': False,
'chord_size': None},
{'task': 'celery.chain',
'args': [],
'kwargs': {'tasks': [{'task': 'add_one',
'args': [3],
'kwargs': {},
'options': {},
'subtask_type': None,
'immutable': False,
'chord_size': None},
{'task': 'square',
'args': [],
'kwargs': {},
'options': {},
'subtask_type': None,
'immutable': False,
'chord_size': None}]},
'options': {},
'subtask_type': 'chain',
'immutable': False,
'chord_size': None},
{'task': 'celery.chain',
'args': [],
'kwargs': {'tasks': [{'task': 'add_one',
'args': [4],
'kwargs': {},
'options': {},
'subtask_type': None,
'immutable': False,
'chord_size': None},
{'task': 'square',
'args': [],
'kwargs': {},
'options': {},
'subtask_type': None,
'immutable': False,
'chord_size': None}]},
'options': {},
'subtask_type': 'chain',
'immutable': False,
'chord_size': None}]},
'options': {},
'subtask_type': 'group',
'immutable': False,
'chord_size': None}
我将不胜感激。谢谢!
我认为在另一个celery任务中运行celery任务是一种不好的做法,在某些情况下可能导致死锁(我认为它也在文档中的某处)。如果您想这样做-可以更安全地运行aync。
在您的情况下,我建议在group_square
任务中添加收集呼叫。类似于:
@celery2.task(name='group-task')
def group_square(num):
canvas_flow = group([(add_one_and_square.si(i)) for i in range(num)]) | collect.s()
return canvas_flow.apply_async()
现在group_square的结果将是ResultAsync
之类的东西。您可以随时检查.ready()
,然后获取.result()
。