如何做數據統計與分析 10種數據分析方法


如何做數據統計與分析 10種數據分析方法



時間序列(time series)是系統中某一變量的觀測值按時間順序(時間間隔相同)排列成一個數值序列,展示研究對象在一定時期內的變動過程,從中尋找和分析事物的變化特征、發展趨勢和規律 。它是系統中某一變量受其它各種因素影響的總結果 。
研究時間序列主要目的可以進行預測,根據已有的時間序列數據預測未來的變化 。時間序列預測關鍵:確定已有的時間序列的變化模式,并假定這種模式會延續到未來 。
如何做數據統計與分析 10種數據分析方法


時間序列的基本特點
假設事物發展趨勢會延伸到未來
預測所依據的數據具有不規則性
不考慮事物發展之間的因果關系
時間序列數據用于描述現象隨時間發展變化的特征 。
如何做數據統計與分析 10種數據分析方法


時間序列考慮因素
時間序列分析就其發展歷史階段和所使用的統計分析方法看分為傳統的時間序列分析和現代時間序列分析,根據觀察時間的不同,時間序列中的時間可以是可以是年份、季度、月份或其他任何時間形式 。
時間序列分析時的主要考慮的因素是:
l長期趨勢(Long-term trend)
時間序列可能相當穩定或隨時間呈現某種趨勢 。
時間序列趨勢一般為線性的(linear),二次方程式的 (quadratic)或指數函數(exponential function) 。
l季節性變動(Seasonal variation)
按時間變動,呈現重復性行為的序列 。
季節性變動通常和日期或氣候有關 。
季節性變動通常和年周期有關 。
l周期性變動(Cyclical variation)
相對于季節性變動,時間序列可能經歷“周期性變動” 。
周期性變動通常是因為經濟變動 。
l隨機影響(Random effects)
除此之外,還有偶然性因素對時間序列產生影響,致使時間序列呈現出某種隨機波動 。時間序列除去趨勢、周期性和季節性后的偶然性波動,稱為隨機性(random),也稱不規則波動(irregular variations) 。
如何做數據統計與分析 10種數據分析方法


時間序列的主要成分
時間序列的成分可分為4種:
l趨勢(T)、
l季節性或季節變動(S)、
l周期性或循環波動(C)、
l隨機性或不規則波動(I) 。
傳統時間序列分析的一項主要內容就是把這些成分從時間序列中分離出來,并將它們之間的關系用一定的數學關系式予以表達,而后分別進行分析 。
如何做數據統計與分析 10種數據分析方法


時間序列建?;静襟E
1)用觀測、調查、統計、抽樣等方法取得被觀測系統時間序列動態數據 。
2)根據動態數據作相關圖,進行相關分析,求自相關函數 。
相關圖能顯示出變化的趨勢和周期,并能發現跳點和拐點 。
跳點是指與其他數據不一致的觀測值 。如果跳點是正確的觀測值,在建模時應考慮進去,如果是反常現象,則應把跳點調整到期望值 。
拐點則是指時間序列從上升趨勢突然變為下降趨勢的點 。如果存在拐點,則在建模時必須用不同的模型去分段擬合該時間序列,例如采用門限回歸模型 。
3)辨識合適的隨機模型,進行曲線擬合,即用通用隨機模型去擬合時間序列的觀測數據 。
對于短的或簡單的時間序列,可用趨勢模型和季節模型加上誤差來進行擬合 。
對于平穩時間序列,可用通用ARMA模型(自回歸滑動平均模型)及其特殊情況的自回歸模型、滑動平均模型或組合-ARMA模型等來進行擬合 。

推薦閱讀