中文字幕在线观看地址,非洲无码精品蜜桃一区二区,久久综合色色网

python中可以使用base64來處理字符編碼問題，Base64是一種用64個字符來表示任意二進制數(shù)據的方法。

用記事本打開exe、jpg、pdf這些文件時，我們都會看到一大堆亂碼，因為二進制文件包含很多無法顯示和打印的字符，所以，如果要讓記事本這樣的文本處理軟件能處理二進制數(shù)據，就需要一個二進制到字符串的轉換方法。Base64是一種最常見的二進制編碼方法。

Base64的原理很簡單，首先，準備一個包含64個字符的數(shù)組：

['A','B','C',...'a','b','c',...'0','1',...'+','/']

然后，對二進制數(shù)據進行處理，每3個字節(jié)一組，一共是3x8=24bit，劃為4組，每組正好6個bit

這樣我們得到4個數(shù)字作為索引，然后查表，獲得相應的4個字符，就是編碼后的字符串。

所以，Base64編碼會把3字節(jié)的二進制數(shù)據編碼為4字節(jié)的文本數(shù)據，長度增加33%，好處是編碼后的文本數(shù)據可以在郵件正文、網頁等直接顯示。

如果要編碼的二進制數(shù)據不是3的倍數(shù)，最后會剩下1個或2個字節(jié)怎么辦?Base64用\x00字節(jié)在末尾補足后，再在編碼的末尾加上1個或2個=號，表示補了多少字節(jié)，解碼的時候，會自動去掉。

Python內置的base64可以直接進行base64的編解碼：

>>>importbase64

>>>base64.b64encode('binary\x00string')

'YmluYXJ5AHN0cmluZw=='

>>>base64.b64decode('YmluYXJ5AHN0cmluZw==')

'binary\x00string'

由于標準的Base64編碼后可能出現(xiàn)字符+和/，在URL中就不能直接作為參數(shù)，所以又有一種"urlsafe"的base64編碼，其實就是把字符+和/分別變成-和_：

>>>base64.b64encode('i\xb7\x1d\xfb\xef\xff')

'abcd++/'

>>>base64.urlsafe_b64encode('i\xb7\x1d\xfb\xef\xff')

'abcd--__'

>>>base64.urlsafe_b64decode('abcd--__')

'i\xb7\x1d\xfb\xef\xff'

還可以自己定義64個字符的排列順序，這樣就可以自定義Base64編碼，不過，通常情況下完全沒有必要。

Base64是一種通過查表的編碼方法，不能用于加密，即使使用自定義的編碼表也不行。

Base64適用于小段內容的編碼，比如數(shù)字證書簽名、Cookie的內容等。

由于=字符也可能出現(xiàn)在Base64編碼中，但=用在URL、Cookie里面會造成歧義，所以，很多Base64編碼后會把=去掉：

#標準Base64:

'abcd'->'YWJjZA=='

#自動去掉=:

'abcd'->'YWJjZA'

去掉=后怎么解碼呢?因為Base64是把3個字節(jié)變?yōu)?個字節(jié)，所以，Base64編碼的長度永遠是4的倍數(shù)，因此，需要加上=把Base64字符串的長度變?yōu)?的倍數(shù)，就可以正常解碼了。

請寫一個能處理去掉=的base64解碼函數(shù)：

>>>base64.b64decode('YWJjZA==')

'abcd'

>>>base64.b64decode('YWJjZA')

Traceback(mostrecentcalllast):

...

TypeError:Incorrectpadding

>>>safe_b64decode('YWJjZA')

'abcd'

小結

Base64是一種任意二進制到文本字符串的編碼方法，常用于在URL、Cookie、網頁中傳輸少量二進制數(shù)據。

以上內容為大家介紹了Python培訓之怎么處理字符編碼問題，希望對大家有所幫助，如果想要了解更多Python相關知識，請關注 IT培訓機構:千鋒教育。

麻豆黑色丝袜jk制服福利网站-麻豆精品传媒视频观看-麻豆精品传媒一二三区在线视频-麻豆精选传媒4区2021-在线视频99-在线视频a