迭代器(Iterator)概述
迭代器是訪問集合內元素的一種方式。迭代器對象從集合的第一個元素開始訪問,直到所有的元素都被訪問一遍后結束。
迭代器不能回退,只能往前進行迭代。這并不是什么很大的缺點,因為人們幾乎不需要在迭代途中進行回退操作。
迭代器也不是線程安全的,在多線程環境中對可變集合使用迭代器是一個危險的操作。但如果小心謹慎,或者干脆貫徹函數式思想堅持使用不可變的集合,那這也不是什么大問題。
對于原生支持隨機訪問的數據結構(如tuple、list),迭代器和經典for循環的索引訪問相比并無優勢,反而丟失了索引值(可以使用內建函數enumerate()找回這個索引值,這是后話)。但對于無法隨機訪問的數據結構(比如set)而言,迭代器是唯一的訪問元素的方式。
迭代器的另一個優點就是它不要求你事先準備好整個迭代過程中所有的元素。迭代器僅僅在迭代至某個元素時才計算該元素,而在這之前或之后,元素可以不存在或者被銷毀。這個特點使得它特別適合用于遍歷一些巨大的或是無限的集合,比如幾個G的文件,或是斐波那契數列等等。這個特點被稱為延遲計算或惰性求值(Lazyevaluation)。
迭代器更大的功勞是提供了一個統一的訪問集合的接口。只要是實現了__iter__()方法的對象,就可以使用迭代器進行訪問。
3.2.使用迭代器
使用內建的工廠函數iter(iterable)可以獲取迭代器對象:
>>>lst=range(2)
>>>it=iter(lst)
>>>it
使用迭代器的next()方法可以訪問下一個元素:
>>>it.next()
如果是Python2.6+,還有內建函數next(iterator)可以完成這一功能:
>>>next(it)
如何判斷迭代器還有更多的元素可以訪問呢?Python里的迭代器并沒有提供類似has_next()這樣的方法。
那么在這個例子中,我們已經訪問到了最后一個元素1,再使用next()方法會怎樣呢?
>>>it.next()
Traceback(mostrecentcalllast):
File"",line1,in
StopIteration
Python遇到這樣的情況時將會拋出StopIteration異常。事實上,Python正是根據是否檢查到這個異常來決定是否停止迭代的。
這種做法與迭代前手動檢查是否越界相比各有優點。但Python的做法總有一些利用異常進行流程控制的嫌疑。
了解了這些情況以后,我們就能使用迭代器進行遍歷了。
it=iter(lst)
try:
whileTrue:
val=it.next()
printval
exceptStopIteration:
pass
實際上,因為迭代操作如此普遍,Python專門將關鍵字for用作了迭代器的語法糖。在for循環中,Python將自動調用工廠函數iter()獲得迭代器,自動調用next()獲取元素,還完成了檢查StopIteration異常的工作。上述代碼可以寫成如下的形式,你一定非常熟悉:
forvalinlst:
printval
首先Python將對關鍵字in后的對象調用iter函數獲取迭代器,然后調用迭代器的next方法獲取元素,直到拋出StopIteration異常。對迭代器調用iter函數時將返回迭代器自身,所以迭代器也可以用于for語句中,不需要特殊處理。
常用的幾個內建數據結構tuple、list、set、dict都支持迭代器,字符串也可以使用迭代操作。你也可以自己實現一個迭代器,如上所述,只需要在類的__iter__方法中返回一個對象,這個對象擁有一個next()方法,這個方法能在恰當的時候拋出StopIteration異常即可。但是需要自己實現迭代器的時候不多,即使需要,使用生成器會更輕松。下一篇我們將討論生成器的部分。
*異常并不是非拋出不可的,不拋出該異常的迭代器將進行無限迭代,某些情況下這樣的迭代器很有用。這種情況下,你需要自己判斷元素并中止,否則就死循環了!
使用迭代器的循環可以避開索引,但有時候我們還是需要索引來進行一些操作的。這時候內建函數enumerate就派上用場咯,它能在iter函數的結果前加上索引,以元組返回,用起來就像這樣:
foridx,eleinenumerate(lst):
printidx,ele
以上內容為大家介紹了Python迭代器概述,希望對大家有所幫助,如果想要了解更多Python相關知識,請關注IT培訓機構:千鋒教育。