日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

by28777 by28777域名查詢( 二 )



選擇適當(dāng)?shù)膮?shù)讓其最小化min,即可實(shí)現(xiàn)擬合求解過(guò)程 。通過(guò)上面的這個(gè)示例,我們就可以對(duì)線性回歸模型進(jìn)行如下定義:根據(jù)樣本x和y的坐標(biāo),去預(yù)估函數(shù)h,尋求變量之間近似的函數(shù)關(guān)系 。公式如下:

其中,n表示特征數(shù)目,表示每個(gè)訓(xùn)練樣本的第i個(gè)特種值 , 當(dāng)只有一個(gè)因變量x時(shí),稱為一元線性回歸,類似于;而當(dāng)多個(gè)因變量時(shí),成為多元線性回歸 。我們的目的是使最小化,從而最好的將樣本數(shù)據(jù)集進(jìn)行擬合,更好地預(yù)測(cè)新的數(shù)據(jù) 。
多項(xiàng)式回歸或邏輯回歸相關(guān)知識(shí)將在后面介紹 。
二.線性回歸分析線性回歸是數(shù)據(jù)挖掘中基礎(chǔ)的算法之一,其核心思想是求解一組因變量和自變量之間的方程,得到回歸函數(shù) , 同時(shí)誤差項(xiàng)通常使用最小二乘法進(jìn)行計(jì)算 。在本書常用的Sklaern機(jī)器學(xué)習(xí)包中將調(diào)用Linear_model子類的LinearRegression類進(jìn)行線性回歸模型計(jì)算 。
1.LinearRegressionLinearRegression回歸模型在Sklearn.linear_model子類下 , 主要是調(diào)用fit(x,y)函數(shù)來(lái)訓(xùn)練模型,其中x為數(shù)據(jù)的屬性,y為所屬類型 。sklearn中引用回歸模型的代碼如下:
from sklearn import linear_model #導(dǎo)入線性模型regr = linear_model.LinearRegression() #使用線性回歸print(regr)
輸出函數(shù)的構(gòu)造方法如下:
LinearRegression(copy_X=True,fit_intercept=True,n_jobs=1,normalize=False)
其中參數(shù)說(shuō)明如下:
copy_X:布爾型,默認(rèn)為True 。是否對(duì)X復(fù)制,如果選擇False,則直接對(duì)原始數(shù)據(jù)進(jìn)行覆蓋,即經(jīng)過(guò)中心化、標(biāo)準(zhǔn)化后,把新數(shù)據(jù)覆蓋到原數(shù)據(jù)上 。fit_intercept:布爾型,默認(rèn)為True 。是否對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行中心化 , 如果是True表示對(duì)輸入的訓(xùn)練數(shù)據(jù)進(jìn)行中心化處理,如果是False則輸入數(shù)據(jù)已經(jīng)中心化處理,后面的過(guò)程不再進(jìn)行中心化處理 。n_jobs:整型,默認(rèn)為1 。計(jì)算時(shí)設(shè)置的任務(wù)個(gè)數(shù) , 如果設(shè)置為-1表示使用所有的CPU 。該參數(shù)對(duì)于目標(biāo)個(gè)數(shù)大于1且規(guī)模足夠大的問(wèn)題有加速作用 。normalize:布爾型,默認(rèn)為False 。是否對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理 。LinearRegression類主要包括如下方法:

fit(X,y[,n_jobs])
對(duì)訓(xùn)練集X , y進(jìn)行訓(xùn)練,分析模型參數(shù),填充數(shù)據(jù)集 。其中X為特征 , y為標(biāo)記或類屬性 。
predict(X)
使用訓(xùn)練得到的估計(jì)器或模型對(duì)輸入的X數(shù)據(jù)集進(jìn)行預(yù)測(cè) , 返回結(jié)果為預(yù)測(cè)值 。數(shù)據(jù)集X通常劃分為訓(xùn)練集和測(cè)試集 。
decision_function(X)
使用訓(xùn)練得到的估計(jì)器或模型對(duì)數(shù)據(jù)集X進(jìn)行預(yù)測(cè) 。它與predict(X)區(qū)別在于該方法包含了對(duì)輸入數(shù)據(jù)的類型檢查和當(dāng)前對(duì)象是否存在coef_屬性的檢查,更安全 。
score(X, y[,]samples_weight)
返回對(duì)于以X為samples、y為target的預(yù)測(cè)效果評(píng)分 。
get_params([deep])
獲取該估計(jì)器(Estimator)的參數(shù) 。
**set_params(params)
設(shè)置該估計(jì)器(Estimator)的參數(shù) 。
coef_
存放LinearRegression模型的回歸系數(shù) 。
intercept_
存放LinearRegression模型的回歸截距 。
現(xiàn)在對(duì)前面的企業(yè)成本和利潤(rùn)數(shù)據(jù)集進(jìn)行線性回歸實(shí)驗(yàn) 。完整代碼如下:
# -*- coding: utf-8 -*-# By:Eastmount CSDN 2021-07-03from sklearn import linear_model #導(dǎo)入線性模型import matplotlib.pyplot as pltimport numpy as np#X表示企業(yè)成本 Y表示企業(yè)利潤(rùn)X = [[400], [450], [486], [500], [510], [525], [540], [549], [558], [590], [610], [640], [680], [750], [900]]Y = [[80], [89], [92], [102], [121], [160], [180], [189], [199], [203], [247], [250], [259], [289], [356]]print('數(shù)據(jù)集X: ', X)print('數(shù)據(jù)集Y: ', Y)#回歸訓(xùn)練clf = linear_model.LinearRegression()clf.fit(X, Y)#預(yù)測(cè)結(jié)果X2 = [[400], [750], [950]]Y2 = clf.predict(X2)print(Y2)res = clf.predict(np.array([1200]).reshape(-1, 1))[0]print('預(yù)測(cè)成本1200元的利潤(rùn):$%.1f' % res)#繪制線性回歸圖形plt.plot(X, Y, 'ks') #繪制訓(xùn)練數(shù)據(jù)集散點(diǎn)圖plt.plot(X2, Y2, 'g-') #繪制預(yù)測(cè)數(shù)據(jù)集直線plt.show()

推薦閱讀