我有嵌套函数调用,其中也应用了多处理。 izip或重复或似乎正在制作对象的副本而不是通过引用传递,同时也进行了一些打包和解包。
这是按呼叫顺序的结构:
def main():
print 'Rel_list id main: %s' % str(id(rel_list))
par_objective(folder.num_proc, batch, r, folder.d, vocab_len, \
rel_list, lambdas)
def par_objective(num_proc, data, params, d, len_voc, rel_list, lambdas):
pool = Pool(processes=num_proc)
# non-data params
oparams = [params, d, len_voc, rel_list]
print 'Rel_list id paro: %s' % str(id(rel_list))
result = pool.map(objective_and_grad, izip(repeat(oparams),split_data))
def objective_and_grad(par_data):
(params, d, len_voc, rel_list),data = par_data
print 'Rel_list id obag: %s' % str(id(rel_list))
输出:
ID IN MAIN
Rel_list id main: 140694049352088
ID IN PAR_OBJECTIVE
Rel_list id paro: 140694049352088
IDs IN OBJECTIVE_AND_GRAD (24 Processes):
Rel_list id obag: 140694005483424
Rel_list id obag: 140694005481840
Rel_list id obag: 140694311306232
Rel_list id obag: 140694048889168
Rel_list id obag: 140694057601144
Rel_list id obag: 140694054472232
Rel_list id obag: 140694273611104
Rel_list id obag: 140693878744632
Rel_list id obag: 140693897912976
Rel_list id obag: 140693753182328
Rel_list id obag: 140694282174976
Rel_list id obag: 140693900442800
Rel_list id obag: 140694271314328
Rel_list id obag: 140694276073736
Rel_list id obag: 140694020435696
Rel_list id obag: 140693901952208
Rel_list id obag: 140694694615376
Rel_list id obag: 140694271773512
Rel_list id obag: 140693899163264
Rel_list id obag: 140694047135792
Rel_list id obag: 140694276808432
Rel_list id obag: 140694019346088
Rel_list id obag: 140693897455016
Rel_list id obag: 140694067166024
Rel_list id obag: 140694278467024
Rel_list id obag: 140694010924280
Rel_list id obag: 140694026060576
BACK TO MAIN, RINSE AND REPEAT
Rel_list id main: 140694049352088
Rel_list id paro: 140694049352088
正如您所看到的,列表的id在main()和par_obj()中是相同的,但在传递到多处理池时会发生更改
多处理以写时复制方式分叉并且列表永远不会改变,但是id的更改,这是否意味着内存被复制或只是id被更改?
有没有办法检查是否复制了内存?如果这些是副本,为什么要复制?
你的python对象正在被修改;您正在创建对它们的其他引用,因此会更改对象中的引用计数并由OS创建副本。
子进程需要访问的任何Python对象都必须具有来自主进程的独立引用计数。因此,Python多处理不会简单地使用相同的内存区域,因此总是需要一个副本。