方法一:scikit-learn庫中調用linear_model
由于機器學習庫scikit-learn的廣泛流行,常用的方法是從該庫中調用linear_model來擬合數據。
雖然這可以提供機器學習的其他流水線特征(例如:數據歸一化,模型系數正則化,將線性模型傳遞到另一個下游模型)的其他優點,但是當一個數據分析師需要快速而簡便地確定回歸系數(和一些基本相關統計量)時,這通常不是最快速簡便的方法。
方法二:Scipy.polyfit( ) or numpy.polyfit( )
這是一個最基本的最小二乘多項式擬合函數(least squares polynomial fit function),接受數據集和任何維度的多項式函數(由用戶指定),并返回一組使平方誤差最小的系數。
對于簡單的線性回歸來說,可以選擇1維函數。但是如果你想擬合更高維的模型,則可以從線性特征數據中構建多項式特征并擬合模型。
方法三:Stats.linregress( )
這是一個高度專業化的線性回歸函數,可以在SciPy的統計模塊中找到。然而因為它僅被用來優化計算兩組測量數據的最小二乘回歸,所以其靈活性相當受限。因此,不能使用它進行廣義線性模型和多元回歸擬合。
但是,由于其特殊性,它是簡單線性回歸中最快速的方法之一。除了擬合的系數和截距項之外,它還返回基本統計量,如R2系數和標準差。
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com