交叉驗證(Cross-validation)是一種常用的機器學習模型評估方法,目的是用來驗證機器學習模型的泛化能力。在交叉驗證中,將原始數據分為訓練集和測試集,然后在訓練集上訓練模型,在測試集上測試模型性能,得到一個測試誤差。重復這個過程多次,每次選擇不同的訓練集和測試集,得到多個測試誤差,最終對這些測試誤差進行平均,作為模型的性能評估指標。
交叉驗證的目的是避免模型對某一數據集過擬合(Overfitting),即模型在訓練數據上表現良好,但在測試數據上表現很差的情況。通過交叉驗證,可以評估模型的泛化能力,提高模型的魯棒性。常用的交叉驗證方法包括 K-fold 交叉驗證、Leave-one-out 交叉驗證等。