Python izip和重复内存行为

问题描述 投票:3回答:1

我有嵌套函数调用,其中也应用了多处理。 izip或重复或似乎正在制作对象的副本而不是通过引用传递,同时也进行了一些打包和解包。

这是按呼叫顺序的结构:

def main():
    print 'Rel_list id main: %s' % str(id(rel_list))
    par_objective(folder.num_proc, batch, r, folder.d, vocab_len, \
                                          rel_list, lambdas)

def par_objective(num_proc, data, params, d, len_voc, rel_list, lambdas):
    pool = Pool(processes=num_proc) 

    # non-data params
    oparams = [params, d, len_voc, rel_list]

    print 'Rel_list id paro: %s' % str(id(rel_list))
    result = pool.map(objective_and_grad, izip(repeat(oparams),split_data))


 def objective_and_grad(par_data):
    (params, d, len_voc, rel_list),data = par_data

    print 'Rel_list id obag: %s' % str(id(rel_list))

输出:

ID IN MAIN
Rel_list id main: 140694049352088
ID IN PAR_OBJECTIVE
Rel_list id paro: 140694049352088
IDs IN OBJECTIVE_AND_GRAD (24 Processes):
Rel_list id obag: 140694005483424
Rel_list id obag: 140694005481840
Rel_list id obag: 140694311306232
Rel_list id obag: 140694048889168
Rel_list id obag: 140694057601144
Rel_list id obag: 140694054472232
Rel_list id obag: 140694273611104
Rel_list id obag: 140693878744632
Rel_list id obag: 140693897912976
Rel_list id obag: 140693753182328
Rel_list id obag: 140694282174976
Rel_list id obag: 140693900442800
Rel_list id obag: 140694271314328
Rel_list id obag: 140694276073736
Rel_list id obag: 140694020435696
Rel_list id obag: 140693901952208
Rel_list id obag: 140694694615376
Rel_list id obag: 140694271773512
Rel_list id obag: 140693899163264
Rel_list id obag: 140694047135792
Rel_list id obag: 140694276808432
Rel_list id obag: 140694019346088
Rel_list id obag: 140693897455016
Rel_list id obag: 140694067166024
Rel_list id obag: 140694278467024
Rel_list id obag: 140694010924280
Rel_list id obag: 140694026060576

BACK TO MAIN, RINSE AND REPEAT
Rel_list id main: 140694049352088
Rel_list id paro: 140694049352088

正如您所看到的,列表的id在main()和par_obj()中是相同的,但在传递到多处理池时会发生更改

多处理以写时复制方式分叉并且列表永远不会改变,但是id的更改,这是否意味着内存被复制或只是id被更改?

有没有办法检查是否复制了内存?如果这些是副本,为什么要复制?

python repeat izip
1个回答
4
投票

你的python对象正在被修改;您正在创建对它们的其他引用,因此会更改对象中的引用计数并由OS创建副本。

子进程需要访问的任何Python对象都必须具有来自主进程的独立引用计数。因此,Python多处理不会简单地使用相同的内存区域,因此总是需要一个副本。

© www.soinside.com 2019 - 2024. All rights reserved.