python中可以使用chardet模塊檢測字符串/文件編碼。
1、chardet下載與安裝
下載地址:http://pypi.python.org/pypi/chardet
下載chardet后,解壓chardet壓縮包,直接將chardet文件夾放在應用程序目錄下,就可以使用importchardet開始使用chardet了,也可以將chardet拷貝到Python系統目錄下,這樣你所有的python程序只要用importchardet就可以了。
pythonsetup.pyinstall
使用中,chardet.detect()返回字典,其中confidence是檢測精確度,encoding是編碼形式。
示例:
網頁編碼判斷:
>>>importurllib
>>>rawdata=urllib.urlopen('http://www.google.cn/').read()
>>>importchardet
>>>chardet.detect(rawdata)
{'confidence':0.98999999999999999,'encoding':'GB2312'}
文件編碼判斷
importchardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#這里試著換成read(5)也可以,但是換成readlines()后報錯
enc=chardet.detect(ff)
printenc['encoding']
tt.close()
以上內容為大家介紹了python如何查看編碼,希望對大家有所幫助,如果想要了解更多Python相關知識,請關注IT培訓機構:千鋒教育。