日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

別再亂套模型了,我用Excel發(fā)現(xiàn)了數(shù)據(jù)分析的本質(zhì):回歸分析

最近很多人都問(wèn)我,為什么感覺數(shù)據(jù)分析越學(xué)越亂,經(jīng)常是學(xué)了一大堆名詞,真正遇到問(wèn)題的時(shí)候卻更多是直接套用模型,很難將這些理論聯(lián)系起來(lái) 。
這其實(shí)就回歸到了一個(gè)至關(guān)重要的問(wèn)題:數(shù)據(jù)分析的本質(zhì)是什么?
事物都是萬(wàn)變不離其宗的,一切外在的方法都是為了事物本質(zhì)而服務(wù)的,數(shù)據(jù)分析自然也不例外,今天我們就來(lái)探討一下數(shù)據(jù)分析的本質(zhì) 。

別再亂套模型了,我用Excel發(fā)現(xiàn)了數(shù)據(jù)分析的本質(zhì):回歸分析


數(shù)據(jù)分析的本質(zhì)其實(shí)絕大多數(shù)的數(shù)據(jù)分析問(wèn)題,都可以歸納為一個(gè)問(wèn)題:相關(guān)性問(wèn)題 。
相關(guān)性分析是數(shù)據(jù)統(tǒng)計(jì)學(xué)中的基礎(chǔ)思想,主要就是為了探究數(shù)據(jù)之間是否具有關(guān)聯(lián)性,簡(jiǎn)單說(shuō)就是X與Y或者X與Y、Z等之間的變化是否有關(guān)聯(lián) 。
比如,常年吸煙者的數(shù)量是否與肺癌患者的數(shù)量成正相關(guān)、健身者與感冒患者之間是否成負(fù)相關(guān)等等,這些例子都是簡(jiǎn)單的相關(guān)性判斷
在數(shù)據(jù)分析中,更常見的則是更為復(fù)雜的相關(guān)性分析,也就是為了找到變量之間的相關(guān)系數(shù),簡(jiǎn)單說(shuō)就是為了找到Y(jié)=A+B*X之中的B 。
比如,用戶點(diǎn)擊率與網(wǎng)站訪問(wèn)量之間是否有關(guān)系、廣告曝光量與投入成本的關(guān)系等等,這個(gè)方程的求取過(guò)程也就是所謂的“回歸分析” 。
回歸分析在統(tǒng)計(jì)學(xué)中包含了很多類別,比如一元回歸、多遠(yuǎn)回歸、方差回歸、線性回歸、非線性回歸等,但我們不必涉及這么深,只需要了解其本質(zhì)即可 。
我們就拿廣告曝光量與投入成本這個(gè)例子來(lái)解剖一下數(shù)據(jù)分析中的回歸:
別再亂套模型了,我用Excel發(fā)現(xiàn)了數(shù)據(jù)分析的本質(zhì):回歸分析


回歸分析首先我們假設(shè)一個(gè)數(shù)據(jù)分析中常見的場(chǎng)景:
【別再亂套模型了,我用Excel發(fā)現(xiàn)了數(shù)據(jù)分析的本質(zhì):回歸分析】小李是公司里負(fù)責(zé)市場(chǎng)廣告的,某一次公司要舉辦大型活動(dòng),要求小李在線上廣告上達(dá)到50w次的曝光量,于是小李寫了一份方案提出要加大投入費(fèi)用 。而老板則覺得廣告的投入費(fèi)用太大,沒有必要拿那么多錢,而小李則覺得多投入才有效果 。
那么,對(duì)于究竟應(yīng)該投入多少?gòu)V告成本呢?
1、分析目的
于是我們就找到了本次數(shù)據(jù)分析的目的,就是要找到廣告曝光量與費(fèi)用成本之間的因果關(guān)系,也就是投入多少錢,廣告曝光就能對(duì)應(yīng)提高多少嗎?
但是普通的統(tǒng)計(jì)方法是沒辦法得到嚴(yán)格的因果關(guān)系的,因此我們只能退而求其次地用回歸分析來(lái)研究其相關(guān)關(guān)系和影響因子,用相關(guān)性代替因果關(guān)系 。
2、確定變量
然后,我們要確定X、Y各是什么 。
在這里Y自然就是廣告曝光,也就是因變量,在數(shù)據(jù)分析中是指業(yè)務(wù)指標(biāo)或者核心需求,比如銷售額這種我們關(guān)心的能夠隨著其他因素的變化而變化的指標(biāo) 。
X自然就是投入成本,也就是自變量,在數(shù)據(jù)分析中是指用來(lái)解釋業(yè)務(wù)指標(biāo)的因子 。
回歸分析的任務(wù)就是,通過(guò)研究X和Y的相關(guān)關(guān)系,嘗試去解釋Y的形成機(jī)制,進(jìn)而達(dá)到通過(guò)X去預(yù)測(cè)Y的目的 。那么,X到底會(huì)長(zhǎng)成什么樣呢?
通常情況下X不是一個(gè)變量,而是多個(gè)變量,比如影響廣告曝光的不止是投入成本,還可能是網(wǎng)站SEO等,在實(shí)際情況中我們需要將X一個(gè)個(gè)都找出來(lái),最終的回歸方程就變成了:
別再亂套模型了,我用Excel發(fā)現(xiàn)了數(shù)據(jù)分析的本質(zhì):回歸分析


這里我們?cè)偬砑右恍┢渌挠绊懸蛩?,比如費(fèi)用投入X2、人力投入X3、投放時(shí)間X4、廣告點(diǎn)擊率X5、對(duì)象人群量X6、定價(jià)X7、投入廣告位數(shù)量X8和定向設(shè)置量X9 。
3、建立回歸模型
為了找到X與Y之間的變量關(guān)系,我們可以通過(guò)建立回歸模式來(lái)實(shí)現(xiàn),這里就用Excel的回歸功能簡(jiǎn)單實(shí)操一下 。

推薦閱讀