我們知道,對文件的讀取操作需要將文件中的數據加載到內存中,而上面所用到的read()方法會一次性把文件中所有的內容全部加載到內存中。這明顯是不合理的,當遇到一個幾個G的的文件時,必然會耗光機器的內存。這里我們來介紹下Python中讀取文件的相關方法:
方法描述
read()一次讀取文件所有內容,返回一個str
read(size)每次最多讀取指定長度的內容,返回一個str;在Python2中size指定的是字節長度,在Python3中size指定的是字符長度
readlines()一次讀取文件所有內容,按行返回一個list
readline()每次只讀取一行內容
此外,還要兩個與文件指針位置相關的方法
方法描述
seek(n)將文件指針移動到指定字節的位置
tell()獲取當前文件指針所在字節位置
下面來看下操作實例
1.讀取指定長度的內容
Python2
withopen('song.txt','r')asf:
print(f.read(12).decode('utf-8'))
輸出結果:
匆匆那年
結果說明:Python2中read(size)方法的size參數指定的要讀取的字節數,而song.txt文件是UTF-8編碼的內容,一個漢字占3個字節,因此12個字節剛好是4個漢字。
Python3
withopen('song.txt','r',encoding='utf-8')asf:
print(f.read(12))
輸出結果:
匆匆那年我們究竟說
結果說明:Python3中read(size)方法的size參數指定的要讀取的字符數,這與文件的字符編碼無關,就是返回12個字符。
2.讀取文件中的一行內容
Python2
withopen('song.txt','r',encoding='utf-8')asf:
print(f.readline())
Python3
withopen('song.txt','r')asf:
print(f.readline().decode('utf-8'))
輸出結果都一樣:
匆匆那年我們究竟說了幾遍再見之后再拖延
3.遍歷打印一個文件中的每一行
這里我們只以Python3來進行實例操作,Python2僅僅是需要在讀取到內容后進行手動解碼而已,上面已經有示例。
方式一:先一次性讀取所有行到內存,然后再遍歷打印
withopen('song.txt','r',encoding='utf-8')asf:
forlineinf.readlines():
print(line)
輸出結果:
匆匆那年我們究竟說了幾遍再見之后再拖延
可惜誰有沒有愛過不是一場七情上面的雄辯
匆匆那年我們一時匆忙撂下難以承受的諾言
只有等別人兌現
這種方式的缺點與read()方法是一樣的,都是會消耗大量的內存空間。
方式二:通過迭代器一行一行的讀取并打印
withopen('song.txt','r',encoding='utf-8',newline='')asf:
forlineinf:
print(line)
輸出結果:
匆匆那年我們究竟說了幾遍再見之后再拖延
可惜誰有沒有愛過不是一場七情上面的雄辯
匆匆那年我們一時匆忙撂下難以承受的諾言
只有等別人兌現
另外,發現上面的輸出結果中行與行之間多了一個空行。這是因為文件每一行的默認都有換行符,而print()方法也會輸出換行,因此就多了一個空行。去掉空行也比較簡單:可以用line.rstrip()去除字符串右邊的換行符,也可以通過print(line,end='')避免print方法造成的換行。
file類的其他方法:
方法描述
flush()刷新緩沖區數據,將緩沖區中的數據立刻寫入文件
next()返回文件下一行,這個方法也是file對象實例可以被當做迭代器使用的原因
truncate([size])截取文件中指定字節數的內容,并覆蓋保存到文件中,如果不指定size參數則文件將被清空;Python2無返回值,Python3返回新文件的內容字節數
write(str)將字符串寫入文件,沒有返回值
writelines(sequence)向文件寫入一個字符串或一個字符串列表,如果字符串列表中的元素需要換行要自己加入換行符
fileno()返回一個整型的文件描述符,可以用于一些底層IO操作上(如,os模塊的read方法)
isatty()判斷文件是否被連接到一個虛擬終端,是則返回True,否則返回False
以上內容為大家介紹了Python文件讀取相關方法,希望對大家有所幫助,如果想要了解更多Python相關知識,請關注IT培訓機構:千鋒教育。