python中如何同时起两个进程

在Python中，可以使用multiprocessing库来同时启动两个或多个进程。使用multiprocessing库、创建Process对象、使用start方法启动进程、使用join方法等待进程结束。以下是详细描述如何在Python中同时启动两个进程的方法。

使用multiprocessing库

multiprocessing是Python中的一个强大的库，它允许开发者创建多个进程，以便在多核CPU上执行并行任务。通过使用这个库，可以轻松地在Python中实现并行计算，从而提高程序的性能和效率。

创建Process对象

Process对象是multiprocessing库中的一个关键组件。通过创建Process对象，可以定义要在新进程中执行的目标函数，并将其作为参数传递给Process构造函数。这个目标函数可以是任何可调用对象，例如函数、方法或类实例。

from multiprocessing import Process
def task1():
    print("Task 1 is running")
def task2():
    print("Task 2 is running")
if __name__ == "__main__":
    process1 = Process(target=task1)
    process2 = Process(target=task2)

在上面的示例中，我们定义了两个函数task1和task2，然后创建了两个Process对象process1和process2，分别将这两个函数作为目标函数传递给Process构造函数。

使用start方法启动进程

一旦创建了Process对象，可以使用start方法启动进程。调用start方法后，Python会在后台创建一个新的进程，并执行目标函数。

process1.start()
process2.start()

在上面的示例中，我们通过调用process1.start()和process2.start()来启动两个进程。这样，task1和task2函数将分别在两个独立的进程中并行执行。

使用join方法等待进程结束

当需要等待进程执行完成时，可以使用join方法。调用join方法后，主进程将阻塞，直到目标进程执行完成。

process1.join()
process2.join()

在上面的示例中，我们通过调用process1.join()和process2.join()来等待process1和process2进程的执行完成。这样，主进程将在两个进程执行完成后继续执行。

通过上述步骤，可以在Python中实现同时启动两个进程。接下来，我们将详细讨论如何使用multiprocessing库创建和管理多个进程，并深入探讨一些高级用法和最佳实践。

一、使用`multiprocessing`库

multiprocessing库是Python标准库的一部分，它提供了一组API，用于创建和管理多个进程。与多线程编程不同，multiprocessing库使用进程而不是线程来实现并行性。进程之间是完全隔离的，它们拥有自己的内存空间，这样可以避免线程之间的数据竞争和锁问题。

1、创建和启动进程

要使用multiprocessing库创建和启动进程，首先需要导入Process类。然后，可以定义目标函数，并创建Process对象，将目标函数传递给Process构造函数。最后，调用start方法启动进程。

from multiprocessing import Process
def worker(name):
    print(f"Worker {name} is running")
if __name__ == "__main__":
    process = Process(target=worker, args=("John",))
    process.start()
    process.join()

在上面的示例中，我们定义了一个目标函数worker，并在__main__块中创建了一个Process对象，将worker函数和参数"John"传递给Process构造函数。然后，我们调用start方法启动进程，并使用join方法等待进程执行完成。

2、传递参数给进程

可以使用args参数将参数传递给目标函数。args参数应该是一个元组，即使只有一个参数，也需要在后面添加逗号。

from multiprocessing import Process
def worker(name, age):
    print(f"Worker {name} is {age} years old")
if __name__ == "__main__":
    process = Process(target=worker, args=("John", 30))
    process.start()
    process.join()

在上面的示例中，我们将两个参数"John"和30传递给目标函数worker。

二、进程间通信

在多进程编程中，进程之间是相互隔离的，它们拥有各自独立的内存空间。为了在进程之间传递数据，可以使用multiprocessing库提供的通信机制，例如队列（Queue）和管道（Pipe）。

1、使用队列（Queue）

队列是一个先进先出（FIFO）的数据结构，它可以用于在进程之间传递数据。multiprocessing库中的Queue类提供了一个简单的接口，用于在进程之间传递数据。

from multiprocessing import Process, Queue
def producer(queue):
    for i in range(5):
        queue.put(i)
        print(f"Produced {i}")
def consumer(queue):
    while True:
        item = queue.get()
        if item is None:
            break
        print(f"Consumed {item}")
if __name__ == "__main__":
    queue = Queue()
    producer_process = Process(target=producer, args=(queue,))
    consumer_process = Process(target=consumer, args=(queue,))
    producer_process.start()
    consumer_process.start()
    producer_process.join()
    queue.put(None)
    consumer_process.join()

在上面的示例中，我们定义了两个函数producer和consumer，分别用于生产和消费数据。我们创建了一个Queue对象，并将其传递给producer和consumer函数。在主进程中，我们启动了生产者进程和消费者进程，并使用join方法等待它们执行完成。

2、使用管道（Pipe）

管道是一种双向通信机制，它允许两个进程之间进行双向数据传输。multiprocessing库中的Pipe函数返回两个Connection对象，分别表示管道的两端。

from multiprocessing import Process, Pipe
def sender(conn):
    for i in range(5):
        conn.send(i)
        print(f"Sent {i}")
    conn.close()
def receiver(conn):
    while True:
        item = conn.recv()
        if item is None:
            break
        print(f"Received {item}")
if __name__ == "__main__":
    parent_conn, child_conn = Pipe()
    sender_process = Process(target=sender, args=(parent_conn,))
    receiver_process = Process(target=receiver, args=(child_conn,))
    sender_process.start()
    receiver_process.start()
    sender_process.join()
    parent_conn.send(None)
    receiver_process.join()

在上面的示例中，我们定义了两个函数sender和receiver，分别用于发送和接收数据。我们使用Pipe函数创建了一个管道，并分别将管道的两端传递给sender和receiver函数。在主进程中，我们启动了发送者进程和接收者进程，并使用join方法等待它们执行完成。

三、共享数据

在多进程编程中，进程之间的数据是隔离的，因此需要使用特殊的机制来共享数据。multiprocessing库提供了Value和Array类，用于在进程之间共享数据。

1、使用`Value`类共享数据

Value类用于在进程之间共享单个数据值。可以使用Value类创建一个共享变量，并将其传递给多个进程。

from multiprocessing import Process, Value
def increment(shared_value):
    for _ in range(1000):
        shared_value.value += 1
if __name__ == "__main__":
    shared_value = Value('i', 0)
    processes = [Process(target=increment, args=(shared_value,)) for _ in range(4)]
    for process in processes:
        process.start()
    for process in processes:
        process.join()
    print(f"Final value: {shared_value.value}")

在上面的示例中，我们使用Value类创建了一个共享变量shared_value，并将其传递给多个进程。每个进程对共享变量进行递增操作。最终，我们打印出共享变量的最终值。

2、使用`Array`类共享数据

Array类用于在进程之间共享数组。可以使用Array类创建一个共享数组，并将其传递给多个进程。

from multiprocessing import Process, Array
def increment(shared_array):
    for i in range(len(shared_array)):
        shared_array[i] += 1
if __name__ == "__main__":
    shared_array = Array('i', [0, 1, 2, 3, 4])
    processes = [Process(target=increment, args=(shared_array,)) for _ in range(4)]
    for process in processes:
        process.start()
    for process in processes:
        process.join()
    print(f"Final array: {list(shared_array)}")

在上面的示例中，我们使用Array类创建了一个共享数组shared_array，并将其传递给多个进程。每个进程对共享数组中的每个元素进行递增操作。最终，我们打印出共享数组的最终值。

四、使用进程池

当需要创建大量进程时，可以使用multiprocessing库中的Pool类。Pool类提供了一种便捷的方法来创建和管理进程池，并可以使用进程池执行并行任务。

1、创建进程池

可以使用Pool类创建进程池，并指定进程池中的进程数量。然后，可以使用apply或map方法将任务分配给进程池中的进程。

from multiprocessing import Pool
def square(x):
    return x * x
if __name__ == "__main__":
    with Pool(4) as pool:
        results = pool.map(square, [1, 2, 3, 4, 5])
    print(results)

在上面的示例中，我们使用Pool类创建了一个包含4个进程的进程池，并使用map方法将square函数应用于列表中的每个元素。最终，我们打印出结果列表。

2、使用`apply`方法

apply方法用于将任务分配给进程池中的一个进程，并返回结果。apply方法是同步的，它会阻塞主进程，直到任务完成。

from multiprocessing import Pool
def square(x):
    return x * x
if __name__ == "__main__":
    with Pool(4) as pool:
        result = pool.apply(square, (5,))
    print(result)

在上面的示例中，我们使用apply方法将square函数应用于单个元素5，并返回结果。

3、使用`map`方法

map方法用于将任务分配给进程池中的多个进程，并返回结果列表。map方法是同步的，它会阻塞主进程，直到所有任务完成。

from multiprocessing import Pool
def square(x):
    return x * x
if __name__ == "__main__":
    with Pool(4) as pool:
        results = pool.map(square, [1, 2, 3, 4, 5])
    print(results)

在上面的示例中，我们使用map方法将square函数应用于列表中的每个元素，并返回结果列表。

4、使用`apply_async`方法

apply_async方法用于将任务分配给进程池中的一个进程，并返回AsyncResult对象。apply_async方法是异步的，它不会阻塞主进程，可以在任务执行的同时执行其他操作。

from multiprocessing import Pool
def square(x):
    return x * x
if __name__ == "__main__":
    with Pool(4) as pool:
        result = pool.apply_async(square, (5,))
        print(result.get())

在上面的示例中，我们使用apply_async方法将square函数应用于单个元素5，并返回AsyncResult对象。我们使用get方法获取任务的结果。

5、使用`map_async`方法

map_async方法用于将任务分配给进程池中的多个进程，并返回AsyncResult对象。map_async方法是异步的，它不会阻塞主进程，可以在任务执行的同时执行其他操作。

from multiprocessing import Pool
def square(x):
    return x * x
if __name__ == "__main__":
    with Pool(4) as pool:
        result = pool.map_async(square, [1, 2, 3, 4, 5])
        print(result.get())

在上面的示例中，我们使用map_async方法将square函数应用于列表中的每个元素，并返回AsyncResult对象。我们使用get方法获取任务的结果列表。

五、最佳实践

在使用multiprocessing库进行多进程编程时，有一些最佳实践可以帮助您编写高效、可靠的代码。

1、使用`main`块

在Windows操作系统上，创建新进程时，模块的__name__属性会被设置为"__main__"，这会导致无限递归。为了避免这种情况，应该将创建新进程的代码放在__main__块中。

if __name__ == "__main__":
    process = Process(target=worker, args=("John",))
    process.start()
    process.join()

2、使用进程池

当需要创建大量进程时，使用进程池可以显著提高性能和效率。进程池通过复用进程来减少进程创建和销毁的开销，从而提高程序的执行速度。

from multiprocessing import Pool
def square(x):
    return x * x
if __name__ == "__main__":
    with Pool(4) as pool:
        results = pool.map(square, [1, 2, 3, 4, 5])
    print(results)

3、避免竞争条件

在多进程编程中，竞争条件是指多个进程同时访问共享资源，可能导致数据不一致的情况。为了避免竞争条件，可以使用进程间通信机制（如队列和管道）或同步机制（如锁）。

from multiprocessing import Process, Value, Lock
def increment(shared_value, lock):
    for _ in range(1000):
        with lock:
            shared_value.value += 1
if __name__ == "__main__":
    shared_value = Value('i', 0)
    lock = Lock()
    processes = [Process(target=increment, args=(shared_value, lock)) for _ in range(4)]
    for process in processes:
        process.start()
    for process in processes:
        process.join()
    print(f"Final value: {shared_value.value}")

在上面的示例中，我们使用Lock类创建了一个锁对象，并将其传递给多个进程。在对共享变量进行操作时，使用with lock语句确保操作是原子的，从而避免竞争条件。

4、使用`terminate`方法

在某些情况下，可能需要终止正在运行的进程。可以使用terminate方法立即终止进程。

from multiprocessing import Process
import time
def worker():
    while True:
        print("Working...")
        time.sleep(1)
if __name__ == "__main__":
    process = Process(target=worker)
    process.start()
    time.sleep(5)
    process.terminate()
    process.join()

在上面的示例中，我们创建并启动了一个进程，该进程在无限循环中打印消息。主进程等待5秒钟后，使用terminate方法终止子进程。

5、处理异常

在多进程编程中，子进程中的异常不会自动传播到主进程。因此，需要在子进程中捕获异常，并通过进程间通信机制将异常信息传递给主进程。

from multiprocessing import Process, Queue
import traceback
def worker(queue):
    try:
        raise ValueError("An error occurred")
    except Exception as e:
        queue.put(traceback.format_exc())
if __name__ == "__main__":
    queue = Queue()
    process = Process(target=worker, args=(queue,))
    process.start()
    process.join()
    if not queue.empty():
        error_message = queue.get()
        print("Exception in worker process:")
        print(error_message)