交叉驗證(Cross-validation)是一種常用的模型評估方法,它的目的是評估模型的泛化能力,即模型在未知數據上的表現。交叉驗證將數據集劃分為訓練集和測試集,在訓練集上訓練模型,在測試集上測試模型性能,以此來評估模型的性能。常見的交叉驗證方法包括k折交叉驗證、留一法交叉驗證等。
具體來說,k折交叉驗證將數據集劃分為k個互不重疊的子集,每次用其中一個子集作為測試集,剩下的k-1個子集作為訓練集,在訓練集上訓練模型,在測試集上測試模型性能,重復k次,每次選取一個不同的子集作為測試集,最終得到k個模型的性能評估結果。留一法交叉驗證是一種特殊的k折交叉驗證,其中k等于數據集的大小,每次用一個樣本作為測試集,其余的樣本作為訓練集,重復n次,最終得到n個模型的性能評估結果。
交叉驗證的目的是評估模型的泛化能力,通過將數據集分成訓練集和測試集,可以避免模型在訓練數據上過度擬合,并且可以使用測試數據來評估模型在未知數據上的表現。交叉驗證可以減小模型評估的偏差和方差,提高模型評估的準確性和可靠性,是機器學習模型評估中不可或缺的一環。