測試開發通過秘籍二：進程，線程和協程你都真的懂嗎

熱愛技術的小牛測試開發通關秘籍二：進程，線程和協程進程、線程、協程是計算機并發編程的三個重要概

測試開發通關秘籍二：進程，線程和協程

進程、線程、協程是計算機并發編程的三個重要概念，每一個都在處理多任務時提供了不同的性能和靈活性。以下是對它們的詳細解釋：

1. 進程 (Process)

定義：進程是操作系統分配資源的基本單位，每個進程有自己的內存空間、數據棧等資源。一個程序可以同時運行多個進程，每個進程在系統中獨立存在，擁有獨立的地址空間。
應用場景：適合需要隔離資源的獨立任務（如服務器中多個應用程序的并行運行）。
開銷：進程的創建和銷毀成本較高，進程間通信（IPC）也相對復雜，因為需要通過文件、管道、消息隊列或共享內存等機制實現。

2. 線程 (Thread)

定義：線程是CPU調度的基本單位，是進程內部的更小執行單元。一個進程可以包含多個線程，這些線程共享同一個進程的內存空間和系統資源，因此它們之間的切換開銷比進程要低得多。
應用場景：適用于輕量級并發任務的場景，如計算密集型任務或需要共享資源的任務。
開銷：線程的創建和銷毀比進程小，但線程之間由于共享資源而需要同步機制（如鎖）來防止數據競爭和死鎖問題。

3. 協程 (Coroutine)

定義：協程是一種更高級的并發方式，屬于用戶態的“輕量級線程”，可以在一個線程內部通過控制權的讓出和切換實現并發，且不依賴操作系統的調度。Python的async和await關鍵字使得協程的實現更加直觀。
應用場景：適合I/O密集型的并發任務，如網絡請求、數據庫查詢等。
開銷：協程切換的開銷最小，因為不涉及內核態切換；協程之間的切換通常是非搶占式的，由程序顯式控制。

4. 協程解決的問題

協程主要解決了 I/O密集型任務的并發性能 問題。傳統的多線程方式雖然能并發處理I/O操作，但線程的切換成本較高，且受制于Python的全局解釋器鎖（GIL），難以充分利用CPU資源。協程通過單線程來完成高并發任務，在等待I/O時可以切換到其他任務，極大地提高了處理效率。同時，協程避免了多線程的鎖機制，編寫和調試代碼更簡潔。

好的，通過示例代碼展示協程和線程在處理I/O密集型任務時的區別，可以更清楚地理解兩者的應用場景和優勢。

假設我們有一個任務，需要同時處理多個I/O操作，比如等待多個網絡請求的響應。我們可以分別使用協程和線程來實現，然后對比它們的執行效率。

示例代碼

假設我們有一個 fetch_data 函數，模擬執行一個耗時的I/O操作（例如網絡請求）：

import time
import threading
import asyncio

# 模擬耗時的I/O操作
def fetch_data_sync(n):
    print(f"Thread {n}: Start fetching data")
    time.sleep(2)  # 模擬網絡請求的耗時操作
    print(f"Thread {n}: Finished fetching data")

使用線程實現并發

以下代碼通過多線程的方式來執行多個fetch_data_sync任務：

def run_with_threads():
    threads = []
    for i in range(5):
        t = threading.Thread(target=fetch_data_sync, args=(i,))
        threads.append(t)
        t.start()

    # 等待所有線程完成
    for t in threads:
        t.join()

start = time.time()
run_with_threads()
end = time.time()
print(f"Threads Execution Time: {end - start} seconds")

分析：

通過 threading.Thread 創建并啟動多個線程，來實現并發執行的效果。
每個線程在執行time.sleep(2)時，CPU將被切換到其他線程，但由于線程切換是內核態的，需要一定的開銷。
當線程數增多時，系統資源的開銷也隨之增加，容易受到全局解釋器鎖（GIL）影響。

使用協程實現并發

協程版本通過 asyncio 模塊實現，利用協程在等待I/O時自動切換任務：

async def fetch_data_async(n):
    print(f"Coroutine {n}: Start fetching data")
    await asyncio.sleep(2)  # 異步等待模擬I/O
    print(f"Coroutine {n}: Finished fetching data")

async def run_with_coroutines():
    tasks = [fetch_data_async(i) for i in range(5)]
    await asyncio.gather(*tasks)

start = time.time()
asyncio.run(run_with_coroutines())
end = time.time()
print(f"Coroutines Execution Time: {end - start} seconds")

分析：

async def 定義了異步函數，await 使得協程在asyncio.sleep期間自動切換到其他任務，最大化了CPU的利用效率。
協程的切換是用戶態的，不涉及系統級的線程切換，開銷小且沒有GIL的限制。
asyncio.gather 可以并行執行多個協程，大幅減少了總耗時。

5.總結

線程：
- 適合多任務并發，但線程切換有系統開銷，尤其在 I/O 密集型任務中。
- Python的GIL限制使得多線程在計算密集型任務中難以充分利用多核優勢。
協程：
- 使用 await 進行異步等待，適合I/O密集型任務。
- 沒有線程切換的系統開銷，執行速度快、資源消耗小。
- 在這種I/O密集型任務中，協程的性能通常優于線程，因為協程切換的成本更低。

6. 全局解釋器鎖GIL

在Python中，全局解釋器鎖（Global Interpreter Lock, GIL）是一個互斥鎖，它確保在任何時刻只有一個線程可以執行Python字節碼。GIL的存在使得多線程在執行計算密集型任務時難以真正并發，導致了性能瓶頸。

GIL的影響

GIL的主要影響體現在計算密集型任務上。即使有多個線程在執行計算密集的任務，Python也會因為GIL的存在，限制多線程的并行執行。GIL允許只有一個線程占用CPU執行，其他線程必須等待該線程釋放GIL才能運行，這導致了線程間的頻繁切換，并影響性能。

為了更直觀地理解GIL的影響，我們可以用一個示例代碼進行演示。

示例代碼

以下代碼創建多個線程，每個線程執行一個計算密集型任務（例如，計算大量數字的平方和）。

import threading
import time

# 定義一個計算密集型任務
def compute():
    print(f"Thread {threading.current_thread().name} starting computation")
    total = 0
    for i in range(10**7):  # 大量計算
        total += i * i
    print(f"Thread {threading.current_thread().name} finished computation")

# 創建并啟動多個線程
def run_with_threads():
    threads = []
    for i in range(4):  # 創建4個線程
        t = threading.Thread(target=compute, name=f"Thread-{i+1}")
        threads.append(t)
        t.start()

    for t in threads:
        t.join()  # 等待所有線程完成

start = time.time()
run_with_threads()
end = time.time()
print(f"Execution Time with Threads: {end - start} seconds")

解釋

GIL的影響：每個線程會頻繁地爭奪GIL。雖然我們創建了4個線程，但由于GIL的存在，實際上只有一個線程可以在任意時間執行Python字節碼，導致線程之間不斷切換，帶來額外的切換開銷。
性能瓶頸：在理想的多核環境下，4個線程的計算時間應接近單線程的1/4，但由于GIL的限制，實際運行時間會遠高于此，因為Python解釋器需要在不同線程間切換GIL。

GIL對多線程的限制示意

如果同樣的計算密集型任務使用單線程執行，反而可能會更快，因為單線程情況下沒有GIL切換的開銷，反而提升了性能。可以嘗試將 run_with_threads() 改為單線程執行，觀察執行時間：

# 單線程執行計算密集型任務
def run_with_single_thread():
    compute()  # 直接調用一次

start = time.time()
run_with_single_thread()
end = time.time()
print(f"Execution Time with Single Thread: {end - start} seconds")

通常情況下，單線程運行的速度可能會接近多線程的總耗時，因為它避免了線程切換帶來的開銷。

總結

GIL導致的性能瓶頸在計算密集型任務中特別明顯，這時多線程不如單線程或多進程有效。多進程可以繞過GIL，因為每個進程都有自己的GIL，能夠充分利用多核CPU，實現真正的并行計算。

本文由mdnice多平臺發布

posted @ 2024-11-01 21:22 熱愛技術的小牛閱讀(591) 評論(0) 收藏舉報

刷新頁面返回頂部

熱愛技術的小牛

熱愛技術的小牛

熱愛技術，熱愛科技。

測試開發通過秘籍二：進程，線程和協程你都真的懂嗎

測試開發通關秘籍二：進程，線程和協程

1. 進程 (Process)

2. 線程 (Thread)

3. 協程 (Coroutine)

4. 協程解決的問題

示例代碼

使用線程實現并發

使用協程實現并發

5.總結

6. 全局解釋器鎖GIL

GIL的影響

示例代碼

解釋

GIL對多線程的限制示意

總結

公告

熱愛技術的小牛

熱愛技術，熱愛科技。

測試開發通過秘籍二：進程，線程和協程你都真的懂嗎

測試開發通關秘籍二： 進程，線程和協程

1. 進程 (Process)

2. 線程 (Thread)

3. 協程 (Coroutine)

4. 協程解決的問題

示例代碼

使用線程實現并發

使用協程實現并發

5.總結

6. 全局解釋器鎖GIL

GIL的影響

示例代碼

解釋

GIL對多線程的限制示意

總結

公告

測試開發通關秘籍二：進程，線程和協程