日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

excel回歸分析怎么做 excel回歸分析


excel回歸分析怎么做 excel回歸分析


前面在《數(shù)據(jù)分析方法論及案例分享》中有提到回歸分析,它主要用來探究:哪些維度會(huì)影響現(xiàn)狀指標(biāo) 。
在數(shù)據(jù)量不大的情況下,我們可以直接用excel來進(jìn)行回歸分析 。畢竟,相對于SPSS、Python來說,excel的獲得和操作真的容易很多 。
回歸分析,分為線性回歸、非線性回歸 。這次先以線性回歸為例,分享一下如何用excel進(jìn)行分析,以及如何解讀分析結(jié)果 。
【如何調(diào)出excel中的回歸分析工具】
在工具欄的左上角,點(diǎn)擊“文件”
點(diǎn)擊文件
【excel回歸分析怎么做 excel回歸分析】將左側(cè)導(dǎo)航欄拉到底部,點(diǎn)擊“選項(xiàng)”
點(diǎn)擊選項(xiàng)
在彈出的面板上,點(diǎn)擊“加載項(xiàng)”
點(diǎn)擊加載項(xiàng)
在加載項(xiàng)面板上,點(diǎn)擊“轉(zhuǎn)到(G)”
點(diǎn)擊轉(zhuǎn)到
在可用加載宏列表中,勾選“分析工具庫”,并點(diǎn)擊“確定”
勾選分析工具庫
回到第一步的工具欄,點(diǎn)擊“數(shù)據(jù)”,在分析欄里就出現(xiàn)了“數(shù)據(jù)分析”工具
點(diǎn)擊數(shù)據(jù)
【如何使用回歸分析工具】
接下來,我通過一個(gè)具體的案例進(jìn)行操作和解讀 。
1.導(dǎo)入要分析的數(shù)據(jù)列表,確定分析目的 。
(1)數(shù)據(jù)列表的字段有“數(shù)據(jù)爬取時(shí)間”“銷量排名”“價(jià)格”“評論條數(shù)”“評分”“時(shí)間”,這是從某個(gè)電商平臺(tái)上每天爬取的商品相關(guān)數(shù)據(jù)(共547天):這個(gè)商品在547天中每天變化的銷量排名、價(jià)格、評論條數(shù)、評分等數(shù)據(jù) 。
商品相關(guān)數(shù)據(jù)
(2)本次回歸主要想探究:價(jià)格、評論條數(shù)、評分、時(shí)間這些維度對銷量排名的影響程度,哪些維度是真正有影響的因素;進(jìn)一步找到預(yù)測未來變化的回歸公式,即Y=β0+β1X 。
2.點(diǎn)擊“數(shù)據(jù)分析”,在彈出的面板上選擇“回歸”,并點(diǎn)擊“確定” 。
選擇回歸
3.在回歸參數(shù)設(shè)置面板上,輸入因變量Y,即“銷量排名”;輸入自變量X,即“價(jià)格”“評論條數(shù)”“評分”“時(shí)間” 。因?yàn)槲野蚜忻矂澾M(jìn)變量區(qū)域了,所以要勾選“標(biāo)志(L)” 。置信度一般默認(rèn)95% 。
設(shè)置參數(shù)
4.點(diǎn)擊“確定”,就會(huì)生成如下分析結(jié)論:
分析結(jié)論
【如何解讀線性回歸分析結(jié)論】
從案例上看,excel共輸出了三組結(jié)果,前兩組是針對整體,即把所有自變量當(dāng)作一個(gè)整體,第三組是針對個(gè)體,即每個(gè)自變量和因變量的關(guān)系 。
解讀分析結(jié)論
1.看整體
(1)R Square,即R2,表示因變量Y出現(xiàn)的變化,可以被所有自變量整體X解釋的比例 。在線性的情況下,R2的值越大越好 。如上圖所示,R2=0.4057,意味著有40.57%的“銷量排名”變化可以被“價(jià)格”“評論條數(shù)”“評分”“時(shí)間”共同解釋 。因?yàn)榱斜碇械臄?shù)據(jù)只是樣本,且自變量個(gè)數(shù)較多,所以看解釋性可以用Adjusted R Square(矯正后的R2) 。
擴(kuò)展知識(shí):R2=1-(RSS/TSS),RSS=e12+e22+e32+……+en2(取最小化的RSS),ei=真實(shí)樣本的Y值-回歸線的Y值,TSS=(真實(shí)樣本的Y值-真實(shí)樣本的Y的均值)2 。
Adjusted R2=1-[(n-1)(1-R2)/(n-p-1)],n是樣本數(shù)量,p是變量個(gè)數(shù) 。
(2)F,表示因變量Y和所有自變量整體X的關(guān)聯(lián)程度,越大越存在關(guān)聯(lián) 。但并不意味著Y跟任一X都有關(guān)聯(lián) 。
擴(kuò)展知識(shí):F=[(TSS-RSS)/p]/[RSS*(n-p-1)]
2.看個(gè)體
(1)P-value,越接近0,相關(guān)性越顯著 。如上圖所示,價(jià)格、時(shí)間、評論條數(shù)、評分的P值都很接近0,說明每個(gè)自變量對銷量排名都顯著相關(guān) 。
(2)t Stat,絕對值越大,相關(guān)性越顯著 。正負(fù)符號代表相關(guān)的方向 。如上圖所示,價(jià)格和評論條數(shù)的t值大于0,說明價(jià)格越高,評論條數(shù)越多,那么銷量排名就越靠后;評分和時(shí)間的t值大于0,說明時(shí)間越久,評分越高,那么銷量排名就越靠前 。

推薦閱讀