一、什么是字典?
字典是Python中的內(nèi)置數(shù)據(jù)類型之一,它是一個無序的鍵值對集合。字典中的鍵和值可以是任意數(shù)據(jù)類型,但是鍵必須唯一,值則可以重復(fù)。
使用字典可以方便地存儲和操作一組鍵值對數(shù)據(jù),比如存儲一本書的作者,出版社,出版日期等信息。
二、字典的讀取方式
1、遍歷
{
'name': 'Tom',
'age': 30,
'gender': 'male'
}
for key in dict:
print(key, dict[key])
這段代碼會遍歷整個字典,并輸出每一個鍵值對,輸出順序是不確定的,因為字典是一個無序的集合。遍歷字典的時間復(fù)雜度是O(n)。
2、使用items
{
'name': 'Tom',
'age': 30,
'gender': 'male'
}
for key, value in dict.items():
print(key, value)
使用items方法可以直接獲取字典中的鍵值對,這樣可以省略掉遍歷字典的過程,時間復(fù)雜度也是O(n)。
3、使用key
{
'name': 'Tom',
'age': 30,
'gender': 'male'
}
for key in dict.keys():
print(key)
使用key方法可以直接獲取字典中的所有鍵,這樣可以省略掉遍歷字典中的值的過程。時間復(fù)雜度也是O(n)。
三、優(yōu)化代碼效率
Python中提供了一些內(nèi)置模塊,可以用來優(yōu)化字典的相關(guān)操作,這些模塊包括:
1、numpy
import numpy as np
dict = {
'name': 'Tom',
'age': 30,
'gender': 'male'
}
keys = np.array(list(dict.keys()))
values = np.array(list(dict.values()))
print(keys)
print(values)
使用numpy模塊可以將字典中的鍵和值轉(zhuǎn)化為兩個數(shù)組。這樣就可以直接利用numpy的強大的數(shù)學(xué)計算能力進行字典數(shù)據(jù)的分析與處理,提高運行效率。
2、pandas
import pandas as pd
dict = {
'name': ['Tom', 'Jerry', 'John', 'Sophia'],
'age': [30, 25, 40, 35],
'gender': ['male', 'male', 'male', 'female']
}
df = pd.DataFrame(dict)
print(df)
使用pandas模塊可以將字典轉(zhuǎn)化為DataFrame格式。DataFrame是pandas中的一種數(shù)據(jù)格式,類似于Excel表格的形式。DataFrame將字典中的鍵作為表格的列名,將值作為數(shù)據(jù)單元格,可以方便地進行數(shù)據(jù)處理和分析。
3、collections
import collections
def convert_to_dict(obj):
if isinstance(obj, str):
obj = eval(obj)
if isinstance(obj, dict):
return obj
elif isinstance(obj, collections.Mapping):
return dict([(convert_to_dict(k), convert_to_dict(v)) for k, v in obj.items()])
elif isinstance(obj, collections.Iterable):
return [convert_to_dict(item) for item in obj]
else:
return obj
obj = '{"city": "Beijing", "population": [{"year": "2010", "count": 10383}, {"year": "2020", "count": 13000}]}'
dict = convert_to_dict(obj)
print(dict)
如果從其他應(yīng)用程序或網(wǎng)絡(luò)獲取的數(shù)據(jù)是json或者xml的格式,我們可以使用collections模塊中的Mapping和Iterable來將其轉(zhuǎn)換成字典格式進行處理。這樣可以提高數(shù)據(jù)的處理效率。
四、代碼示例
1、遍歷
dict = {
'name': 'Tom',
'age': 30,
'gender': 'male'
}
for key in dict:
print(key, dict[key])
2、使用items
dict = {
'name': 'Tom',
'age': 30,
'gender': 'male'
}
for key, value in dict.items():
print(key, value)
3、使用key
dict = {
'name': 'Tom',
'age': 30,
'gender': 'male'
}
for key in dict.keys():
print(key)
4、numpy
import numpy as np
dict = {
'name': 'Tom',
'age': 30,
'gender': 'male'
}
keys = np.array(list(dict.keys()))
values = np.array(list(dict.values()))
print(keys)
print(values)
5、pandas
import pandas as pd
dict = {
'name': ['Tom', 'Jerry', 'John', 'Sophia'],
'age': [30, 25, 40, 35],
'gender': ['male', 'male', 'male', 'female']
}
df = pd.DataFrame(dict)
print(df)
6、collections
import collections
def convert_to_dict(obj):
if isinstance(obj, str):
obj = eval(obj)
if isinstance(obj, dict):
return obj
elif isinstance(obj, collections.Mapping):
return dict([(convert_to_dict(k), convert_to_dict(v)) for k, v in obj.items()])
elif isinstance(obj, collections.Iterable):
return [convert_to_dict(item) for item in obj]
else:
return obj
obj = '{"city": "Beijing", "population": [{"year": "2010", "count": 10383}, {"year": "2020", "count": 13000}]}'
dict = convert_to_dict(obj)
print(dict)
五、總結(jié)
Python中的字典是一種無序的鍵值對集合,可以方便地存儲和操作一組鍵值對數(shù)據(jù)。我們可以使用多種方式來讀取字典,包括遍歷,使用items和key方法。如需對字典進行高效率數(shù)據(jù)處理,可以考慮使用Python內(nèi)置模塊numpy、pandas和collections。