線性回歸是一種用于建立輸入變量(自變量)和輸出變量(因變量)之間線性關系的模型。它是統計學和機器學習中最基本和常用的回歸方法之一。
線性回歸模型假設因變量和自變量之間存在線性關系,并嘗試使用一個線性方程來近似這種關系。線性回歸的目標是找到最佳擬合直線,以最小化觀測值與預測值之間的差異,即使殘差平方和最小。
線性回歸方程的一般形式為:
y = b0 + b1 * x1 + b2 * x2 + ... + bn * xn
其中y是因變量,x1,x2,...,xn是自變量,b0,b1,b2,...,bn是線性回歸方程的系數(也稱為回歸系數),表示y對應于每個自變量的貢獻。b0表示截距,它是在所有自變量等于0時,因變量的預測值。
線性回歸方程的目標是找到最佳的系數b0,b1,b2,...,bn,使預測值y'盡可能接近真實值y。為了找到這些系數,通常使用最小二乘法來擬合線性回歸模型,即通過最小化殘差平方和來選擇最佳系數。
簡單線性回歸是一種特殊的線性回歸,它只涉及一個自變量和一個因變量。其方程形式為:
y = b0 + b1 * x
其中y是因變量,x是自變量,b0是截距,b1是自變量x的系數,表示y對x的影響程度。