編碼原則
建議1:理解 Pythonic 概念—-詳見 Python 中的《Python之禪》
建議2:編寫 Pythonic 代碼
●避免不規范代碼,比如只用大小寫區分變量、使用容易混淆的變量名、害怕過長變量名等。有時候長的變量名會使代碼更加具有可讀性。
●深入學習 Python 相關知識,比如語言特性、庫特性等,比如Python演變過程等。深入學習一兩個業內公認的 Pythonic 的代碼庫,比如Flask等。
建議3:理解 Python 與 C 的不同之處,比如縮進與 {},單引號雙引號,三元操作符?, Switch-Case 語句等。
建議4:在代碼中適當添加注釋
建議5:適當添加空行使代碼布局更加合理
建議6:編寫函數的 4 個原則
●函數設計要盡量短小,嵌套層次不宜過深
●函數聲明應該做到合理、簡單、易用
●函數參數設計應該考慮向下兼容
●一個函數只做一件事,盡量保證函數粒度的一致性
建議7:將常量集中在一個文件,且常量名盡量使用全大寫字母
編程慣用法
建議8:利用 assert 語句來發現問題,但要注意,斷言 assert 會影響效率
建議9:數據交換值時不推薦使用臨時變量,而是直接 a, b = b, a
建議10:充分利用惰性計算(Lazy evaluation)的特性,從而避免不必要的計算
建議11:理解枚舉替代實現的缺陷(最新版 Python 中已經加入了枚舉特性)
建議12:不推薦使用 type 來進行類型檢查,因為有些時候 type 的結果并不一定可靠。如果有需求,建議使用 isinstance 函數來代替
建議13:盡量將變量轉化為浮點類型后再做除法(Python3 以后不用考慮)
建議14:警惕eval()函數的安全漏洞,有點類似于 SQL 注入
建議15:使用 enumerate() 同時獲取序列迭代的索引和值
建議16:分清 == 和 is 的適用場景,特別是在比較字符串等不可變類型變量時(詳見評論)
建議17:盡量使用 Unicode。在 Python2 中編碼是很讓人頭痛的一件事,但 Python3 就不用過多考慮了
建議18:構建合理的包層次來管理 Module
編程慣用法2
建議19:有節制的使用 from…import 語句,防止污染命名空間
建議20:優先使用 absolute import 來導入模塊(Python3中已經移除了relative import)
建議21:i+=1 不等于 ++i,在 Python 中,++i 前邊的加號僅表示正,不表示操作
建議22:習慣使用 with 自動關閉資源,特別是在文件讀寫中
建議23:使用 else 子句簡化循環(異常處理)
建議24:遵循異常處理的幾點基本原則
●注意異常的粒度,try 塊中盡量少寫代碼
●謹慎使用單獨的 except 語句,或 except Exception 語句,而是定位到具體異常
●注意異常捕獲的順序,在合適的層次處理異常
●使用更加友好的異常信息,遵守異常參數的規范
建議25:避免 finally 中可能發生的陷阱
建議26:深入理解 None,正確判斷對象是否為空。
建議27:連接字符串應優先使用 join 函數,而不是+操作
建議28:格式化字符串時盡量使用 format 函數,而不是 % 形式
建議29:區別對待可變對象和不可變對象,特別是作為函數參數時
建議30:[], {}和():一致的容器初始化形式。使用列表解析可以使代碼更清晰,同時效率更高
建議31:函數傳參數,既不是傳值也不是傳引用,而是傳對象或者說對象的引用
建議32:警惕默認參數潛在的問題,特別是當默認參數為可變對象時
建議33:函數中慎用變長參數 args 和 kargs
●這種使用太靈活,從而使得函數簽名不夠清晰,可讀性較差
●如果因為函數參數過多而是用變長參數簡化函數定義,那么一般該函數可以重構
建議34:深入理解 str()和 repr() 的區別
●兩者之間的目標不同:str 主要面向客戶,其目的是可讀性,返回形式為用戶友好性和可讀性都比較高的字符串形式;而 repr 是面向 Python 解釋器或者說Python開發人員,其目的是準確性,其返回值表示 Python 解釋器內部的定義
●在解釋器中直接輸入變量,默認調用repr函數,而print(var)默認調用str函數
●repr函數的返回值一般可以用eval函數來還原對象
●兩者分別調用對象的內建函數 str ()和 repr ()
建議35:分清靜態方法 staticmethod 和類方法 classmethod 的使用場景
庫的使用
建議36:掌握字符串的基本用法
建議37:按需選擇 sort() 和 sorted() 函數
●sort() 是列表在就地進行排序,所以不能排序元組等不可變類型。
●sorted() 可以排序任意的可迭代類型,同時不改變原變量本身。
建議38:使用copy模塊深拷貝對象,區分淺拷貝(shallow copy)和深拷貝(deep copy)
建議39:使用 Counter 進行計數統計,Counter 是字典類的子類,在 collections 模塊中
建議40:深入掌握 ConfigParse
建議41:使用 argparse 模塊處理命令行參數
建議42:使用 pandas 處理大型 CSV 文件
●Python 本身提供一個CSV文件處理模塊,并提供reader、writer等函數。
●Pandas 可提供分塊、合并處理等,適用于數據量大的情況,且對二維數據操作更方便。
建議43:使用 ElementTree解析XML
建議44:理解模塊 pickle 的優劣
●優勢:接口簡單、各平臺通用、支持的數據類型廣泛、擴展性強
●劣勢:不保證數據操作的原子性、存在安全問題、不同語言之間不兼容
建議45:序列化的另一個選擇 JSON 模塊:load 和 dump 操作
建議46:使用 traceback 獲取棧信息
建議47:使用 logging 記錄日志信息
建議48:使用 threading 模塊編寫多線程程序
建議49:使用 Queue 模塊使多線程編程更安全
設計模式
建議50:利用模塊實現單例模式
建議51:用 mixin 模式讓程序更加靈活
建議52:用發布-訂閱模式實現松耦合
建議53:用狀態模式美化代碼
內部機制
建議54:理解 build-in 對象
建議55:__init__ ()不是構造方法,理解 new ()與它之間的區別
建議56:理解變量的查找機制,即作用域
●局部作用域
●全局作用域
●嵌套作用域
●內置作用域
建議57:為什么需要self參數
建議58:理解 MRO(方法解析順序)與多繼承
建議59:理解描述符機制
建議60:區別 getattr ()與 getattribute ()方法之間的區別
建議61:使用更安全的 property
建議62:掌握元類 metaclass
建議63:熟悉 Python 對象協議
建議64:利用操作符重載實現中綴語法
建議65:熟悉 Python 的迭代器協議
建議66:熟悉 Python 的生成器
建議67:基于生成器的協程和 greenlet,理解協程、多線程、多進程之間的區別
建議68:理解 GIL 的局限性
建議69:對象的管理和垃圾回收
使用工具輔助項目開發
建議70:從 PyPI 安裝第三方包
建議71:使用 pip 和 yolk 安裝、管理包
建議72:做 paster 創建包
建議73:理解單元測試的概念
建議74:為包編寫單元測試
建議75:用測試驅動開發(TDD)提高代碼的可測性
建議76:使用 Pylint 檢查代碼風格
●代碼風格審查
●代碼錯誤檢查
●發現重復以及不合理的代碼,方便重構
●高度的可配置化和可定制化
●支持各種 IDE 和編輯器的集成
●能夠基于 Python 代碼生成 UML 圖
●能夠與 Jenkins 等持續集成工具相結合,支持自動代碼審查
建議77:進行高效的代碼審查
建議78:將包發布到 PyPI
性能剖析與優化
建議79:了解代碼優化的基本原則
建議80:借助性能優化工具
建議81:利用 cProfile 定位性能瓶頸
建議82:使用 memory_profiler 和 objgraph 剖析內存使用
建議83:努力降低算法復雜度
建議84:掌握循環優化的基本技巧
●減少循環內部的計算
●將顯式循環改為隱式循環,當然這會犧牲代碼的可讀性
●在循環中盡量引用局部變量
●關注內層嵌套循環
建議85:使用生成器提高效率
建議86:使用不同的數據結構優化性能
建議87:充分利用 set 的優勢
建議88:使用 multiprocessing 模塊克服 GIL 缺陷
建議89:使用線程池提高效率
建議90:使用 Cythonb 編寫擴展模塊