我們知道,在CPython中,有一個全局解釋器鎖,英文叫globalinterpreterlock,簡稱GIL,是一個互斥鎖,用來保護Python世界里的對象,防止同一時刻多個線程執行Python的字節碼,從而確保線程安全,這導致了Python的線程無法利用多核CPU的優勢,因此有人說Python的多線程是偽多線程,性能不高,那么Python將來有可能去除GIL嗎?
要回答這個問題,先從GIL的起源進行分析。
GIL的起源
Python第一次發布是在1991年,當時的CPU都是單核,單核中,多線程主要為了一邊做IO,一邊做CPU計算而設計的,Python編譯器是由C語言編寫的,因此也叫CPython,那時候很多編程語言沒有自動內存管理的功能,為了實現自動垃圾回收,Python為每一個對象進行了引用計數,當引用計數為0的時候說明該對象可以回收,從而釋放內存了,比如:
>>>importsys>>>data={'gzh':'Python七號'}>>>var1=data>>>sys.getrefcount(data)3>>>
這里data對象就有3個引用,一個是本身,一個是變量var1,一個是getrefcount函數的參數,如果此時又有一個線程引用了data,那么引用計數再增加1,如果某個線程使用了data后運行結束,那么引用計數就減少1,多線程對同一個變量「引用計數」進行修改,就會遇到raceconditions(競爭),為了避免raceconditions,最簡單有效的辦法就是加一個互斥鎖。
如果對每一個對象都加鎖,有可能引發另一個問題,就是死鎖,而且頻繁的獲取和釋放會導致性能下降,最簡單有效的方法就是加一個解釋器鎖,線程在執行任何字節碼時都先獲取解釋器鎖,這就避免了死鎖,而且不會有太多的性能消耗。當時CPU都是單核,而且這種GIL設計簡單,并不會影響性能,因此一直沿用至今天。GIL存在最主要的原因,就是因為Python的內存管理不是線程安全的,這就是GIL產生并存在的主要緣由。
嘗試消除GIL
CPU進入多核時代后,可以同時做多個計算任務,GIL才真正變成問題。在1999年,有個叫GregStein的大佬基于Python1.5版本消除了GIL,取代代之的是在可變數據結構上加上更細粒度的鎖,也提交了補丁用于去除對全局可變對象的依賴,然后在標準測試時表明去除GIL后單線程比不去除時慢了近2倍,測試的機器還是當時性能最好Windows機器。也就是說除去了GIL后,你使用2個CPU才能獲取比原來1個CPU稍微好一點的性能,這種提升明顯得不償失,GregStein的嘗試也就失敗告終。
Python之父GuidovanRossum也歡迎社區的志愿者去嘗試去除GIL,只要不降低單線程的性能,但他也提到,去掉GIL不是一件容易的事。
Python開發者郵件列表中也偶爾會有去除GIL的議題,但是以下需求必須滿足:
簡單。從長遠來看該方案必須是可實施、可維護的。
并發。去除GIL必須能提升多線程的性能。
速度。去除GIL不能降低單線程的性能。
滿足CPython的特性。該方案必須支持CPython的功能,比如__del__和弱引用。
API的兼容性。該方案應與所有現有CPython擴展使用的宏在源方面兼容。
及時銷毀不可達對象,回收內存。
有序銷毀,比如不可達對象X引用了A,那么應該在銷毀A之前先銷毀X(有些垃圾回收算法并不能做到這一點)。
有些需求不容易被滿足,比如4,5,7,目前,還沒有人滿足以上需求的同時去除GIL成功的。
積重難返
這些年Python實在太火了,很多優秀的庫都是基于CPython進行編寫的,很多都是90年代的C擴展庫,如果要除去GIL,那么很多基于GIL編寫的C擴展便無法使用,也就是去了GIL,Python生態有很多擴展或三方庫者無法使用。
還有一個很明顯的例子,Python解釋器不止有CPython,還有用Java編寫的Python,.NET實現的IronPython,這些解釋器完全沒有GIL,可是有多少人為它們編寫擴展呢?
Python之所以如此火爆,與它有著豐富的三方庫開箱即用有著很大的關系,積重難返,去除GIL很困難。
為什么Python3一開始時不去除GIL
Python3在最開始時是有機會實現很多新功能,在此過程中,打破了一些現有的C擴展,然后需要更新和移植更改以配合Python3,這也是Python3一開始不被社區所接受的原因。
與Python2相比,刪除GIL將使Python3在單線程性能方面更慢,而且很多優秀的擴展將不能再使用,如果真的這樣,可以想象Python3不可能有未來,最終的結果是Python3仍然保持有GIL。
但Python3也為現有的GIL帶來了重大改進,在Python3.2版本中,確保了計算密集型線程和I/O密集型線程并存時,I/O密集型長期獲取不到GIL而無法執行的問題,提升了多線程的性能。
最后的話
Python因為內存管理不是線程安全的,因此自出生起就自帶GIL,然后很多擴展都是在GIL的保護下編寫的,時間一長積重難反,Python3一開始也因去除GIL導致單線程性能下降的問題而保留GIL,現在已經是Python3.9版本了,將來Python去除GIL的可能性微乎其微,換句話說,去除GIL的Python也就不是我們認識的Python了。
不過不必沮喪,GIL影響的也僅僅是多線程執行計算密集型的任務罷了,這種場景大多數程序員都很少遇到,即使有,可以使用多進程來避免GIL的影響,或者使用其他編程語言實現,任何編程語言或技術都不是十全十美的,發揮所長是最重要的,即使有GIL,我也不在乎,也會依然使用Python。
以上內容為大家介紹了Python有可能刪除GIL嗎?希望對大家有所幫助,如果想要了解更多Python相關知識,請關注IT培訓機構:千鋒教育。http://www.dietsnews.net/