python中Fearturetools三個基本概念
常規特征工程學方法通過人工構造特征,是一個繁瑣、費時且易出錯的過程。自動化特征工程是一個通過諸如Fearturetools之類的工具,從一組相關數據表中自動產生有用特征的過程。與手工生成的特征相比,該方法效率更高,重復性更高,并能更快的建立模型。
一、Featuretools是什么?
Featuretools是一個用于執行自動化特征工程的開源庫。
二、Featuretools基本的三個概念
1、FeaturePrimitives(特征基元):
生成特征的常用方法,分為聚合、轉換的方式。
特征加工方法
importfeaturetoolsasft
ft.list_primitives()
2、Entity(實體)
可以被看作類似PandasDataFrame,多個實體的集合稱為Entityset。
實體間可以根據關聯鍵添加關聯關系Relationship。
3、dfs(深度特征合成)
是從多個數據集創建新特征的過程,可以通過設置搜索的深度(max_depth)來控制所特征生成的復雜性。
以上就是python中Fearturetools三個基本概念,希望能對大家有所幫助。更多Python學習教程請關注IT培訓機構:千鋒教育。