从多处理库中检索值

问题描述 投票:0回答:1

我正在尝试使用多处理库来比较我的处理器在 1 核和 2 核上的性能。 因此,我使用 1 个循环、1 个核心上的 2 个循环以及 2 个核心上的 2 个循环(1 个核心/循环)来计算出一个很棒的产品。问题是 D1.resultD2.result 的值是 0,尽管它们预计是“半/循环”的乘积。 代码如下:

import random
from multiprocessing import Process as Task, freeze_support
N = 10 ** 3
l = [random.randint(2 ** 999, 2 ** 1000 - 1) for x in range(N)]
# ---------------------------------------------------------------
class Loop:
    def __init__(self):
        self.result=0
    def boucle(self,start,end):
        self.result = l[start]
        for v in l[start+1:end]:
            self.result = self.result*v
# ---------------------------------------------------------------
if __name__=="__main__":
    print("1 Loop without multiprocessing")
    A=Loop()
    sta = time.time()
    ra=A.boucle(0,N)
    end = time.time()
    print("--> Time :", end - sta)
    #----------------------------------------------------------------------
    print("2 Loops without multiprocessing")
    B1=Loop()
    B2=Loop()
    sta = time.time()
    rb1 = B1.boucle(0, N//2)
    rb2 = B2.boucle(N//2, N)
    rb = B1.result*B2.result
    end = time.time()
    print("--> Time :", end - sta)
    if rb - A.result == 0 :  
        check="OK"
    else :
        check="fail"
    print("--> Check :", check)
    # ----------------------------------------------------------------------
    print("2 Loops with multiprocessing")
    freeze_support()
    D1=Loop()
    D2=Loop()
    v1 = Task(target=D1.boucle, args=(0,N//2))
    v2 = Task(target=D2.boucle, args=(N//2,N))
    sta = time.time()
    v1.start()
    v2.start()
    v1.join()
    v2.join()
    rd = D1.result*D2.result
    end = time.time()
    print("D1",D1.result)
    print("D2",D2.result)
    print("--> Time :", end - sta)
    if rd - A.result == 0 :    
        check="OK"
    else :
        check="fail"
    print("--> Check :", check)

这段代码的结果是:

1 Loop without multiprocessing
--> Time : 0.5025153160095215
2 Loops without multiprocessing
--> Time : 0.283463716506958
--> Check : OK
2 Loops with multiprocessing
D1 0
D2 0
--> Time : 0.2579989433288574
--> Check : fail

Process finished with exit code 0

为什么 D1 0D2 0 而不是循环的结果?

python python-3.x variables multiprocessing cpu-cores
1个回答
0
投票

当显示 D1 和 D2 时,就会显示此代码的问题: 在多处理中,任务在分叉进程中执行。这个过程得到了数据的副本。 在每个分叉进程中,都会正确计算该值,但永远不会将其发送回主进程。

要解决此问题,您可以:

  • 使用共享内存来存储结果,但在这种情况下,您仅限于 C 类型。您的数字不适合 64 位(C 中的最大整数大小),因此这不是一个好的解决方案。

  • 使用进程池,因此将使用队列共享数据,并且您将能够管理真正的Python类型。

最后一个选项要求“boucle”函数返回结果。

这是代码:

import random
from multiprocessing import Process as Task, freeze_support, Pool
import time

N = 10 ** 3
l = [random.randint(2 ** 999, 2 ** 1000 - 1) for x in range(N)]


# ---------------------------------------------------------------
class Loop:
    def __init__(self):
        self.result = 0

    def boucle(self, start, end):
        self.result = l[start]

        for v in l[start + 1:end]:
            self.result = self.result * v

        return self.result


# ---------------------------------------------------------------
if __name__ == "__main__":
    print("1 Loop without multiprocessing")
    A = Loop()
    sta = time.time()
    ra = A.boucle(0, N)
    end = time.time()
    print("--> Time :", end - sta)
    # ----------------------------------------------------------------------

    print("2 Loops without multiprocessing")
    B1 = Loop()
    B2 = Loop()
    sta = time.time()
    rb1 = B1.boucle(0, N // 2)
    rb2 = B2.boucle(N // 2, N)
    rb = B1.result * B2.result
    end = time.time()
    print("--> Time :", end - sta)
    if rb - A.result == 0:
        check = "OK"
    else:
        check = "fail"
    print("--> Check :", check)
    # ----------------------------------------------------------------------
    print("2 Loops with multiprocessing")
    freeze_support()
    D1 = Loop()
    D2 = Loop()

    pool = Pool(processes=2)

    with pool:
        sta = time.time()
        sta = time.time()
        rb1 = pool.apply_async(B1.boucle, (0, N // 2))
        rb2 = pool.apply_async(B2.boucle, (N // 2, N))

        v1 = rb1.get()
        v2 = rb2.get()

        rd = v1 * v2
        end = time.time()

        print("D1", D1.result)
        print("D2", D2.result)
    print("--> Time :", end - sta)
    if rd - A.result == 0:
        check = "OK"
    else:
        check = "fail"
    print("--> Check :", check)

结果:

1 Loop without multiprocessing
--> Time : 0.3473360538482666
2 Loops without multiprocessing
--> Time : 0.18696999549865723
--> Check : OK
2 Loops with multiprocessing
D1 0
D2 0
--> Time : 0.1116642951965332
--> Check : OK

您还可以将映射与池一起使用来取回值,但在这种情况下我没有尝试过,因为您只调用2个函数,并且池工作人员通过“函数包 - 请参阅 maxtaskperchild”获取任务,因此这是可能的只有一名工人会承担这两项职能

© www.soinside.com 2019 - 2024. All rights reserved.