分類技術(或分類法)是一種根據(jù)輸入數(shù)據(jù)建立分類模型的系統(tǒng)方法,分類法的例子包括決策分類法,基于規(guī)則的分類法,神經網絡,支持向量機和樸素貝葉斯分類法。這些技術都使用一種學習算法(learningalgorithm)確定分類模型,該模型能夠很好的擬合輸入數(shù)據(jù)中類標號和屬性集之間的聯(lián)系,學習算法得到的模型不僅要很好地擬合輸入數(shù)據(jù),還要能夠正確的預測未知樣本的類標號。因此,訓練算法的主要目標就是建立具有很好泛化能力模型,即建立能夠準確的預測未知樣本類標號的模型。
那我們首先說一下分類與回歸的區(qū)別。
回歸(regression)
回歸問題的應用場景(預測的結果是連續(xù)的,例如預測明天的溫度:23,24,25度等等)
所以說回歸問題通常是用來預測一個值,如預測房價,未來的天氣情況等等,例如一個產品的實際價格為500元,通過回歸分析預測值為501元,我們認為這是一個比較好的回歸分析。一個比較常見的回歸算法是線性回歸算法(LR)。另外,回歸分析用在神經網絡上,其最上層是不需要softmax函數(shù)的,而是直接對前一層累加即可。回歸是對真實值的一種逼近預測。
分類(classification)
分類問題的應用場景(預測的結果是離散的,例如預測明天天氣:陰,晴,雨等等)
例如判斷一幅圖片上的動物是一只貓還是一只狗,分類通常是建立在回歸之上,分類的最后一層通常要使用softmax函數(shù)進行判斷其所屬類別。分類并沒有逼近的概念,最終正確結果只有一個,錯誤的就是錯誤的,不會有相近的概念。最常見的分類方法是邏輯回歸,或者叫邏輯分類。
以上內容為大家介紹了Python分類技術,希望對大家有所幫助,如果想要了解更多Python相關知識,請關注IT培訓機構:千鋒教育。