日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

統(tǒng)計中p值怎么計算 p值如何計算

【統(tǒng)計中p值怎么計算 p值如何計算】點擊上方 , All in AI中國
每個數(shù)據(jù)科學家都會遇到這樣一個問題 , 什么是P值以及我們?nèi)绾卧诮y(tǒng)計分析中使用它?
每個數(shù)據(jù)科學訪談中至少有一個問題是關(guān)于P值及其目的 。因此 , 在本文中 , 我將討論P值的上下文、過程和目的 。數(shù)十年來一直譴責對統(tǒng)計測試的錯誤解釋和濫用、置信區(qū)間和統(tǒng)計能力 , 但仍然猖獗 。由于這些概念需要高度和時間 , 這種高認知需求導致了捷徑定義和解釋的流行 , 這種定義和解釋完全是錯誤的 , 有時甚至是災難性的 。然而這些誤解在大部分科學文獻中都占主導地位 。
統(tǒng)計測試
在統(tǒng)計測試的大多數(shù)應用中 , 模型中的一個假設是假設特定效應具有特定大小 , 并且已經(jīng)成為統(tǒng)計分析的目標 。這種有針對性的假設稱為研究假設或檢驗假設 , 用于評估它的統(tǒng)計方法稱為統(tǒng)計假設檢驗 。最常見的是 , 目標效應大小是一個“null”值 , 表示零效應(例如 , 研究處理對平均結(jié)果沒有影響) , 在這種情況下 , 測試假設被稱為零假設 。盡管如此 , 也可以測試其他效果大小 。我們還可以檢驗假設效果是否屬于特定范圍;例如 , 我們可以檢驗效果不大于特定量的假設 , 在這種情況下 , 假設被認為是單側(cè)假設 。
統(tǒng)計中p值怎么計算 p值如何計算


許多統(tǒng)計教學和實踐已經(jīng)形成了一種強烈(并且不健康)的焦點 , 即研究的主要目的應該是檢驗無效假設 。實際上 , 大多數(shù)統(tǒng)計測試的描述僅于測試無效假設 , 整個主題被稱為“空假設顯著性檢驗” 。這種對零假設的獨家會導致對測試的誤解 。更令人誤解的是 , 許多作者使用“零假設”來指代任何檢驗假設 , 即使這種用法與其他作者不一致 , 而且普通英語定義為“無效” 。
更精確的統(tǒng)計分析目標是提供關(guān)于效果大小的確定性或不確定性的評估 。我們在假設的“可能性”方面表達了這種確定性 。然而 , 在傳統(tǒng)的統(tǒng)計方法中 , “概率”不是指假設 , 而是指假定統(tǒng)計模型下數(shù)據(jù)模式的假設頻率的數(shù)量 。這些方法因此被稱為頻率論方法 , 并且它們預測的假設頻率被稱為“頻率概率” , 而不是假設概率(誤解) 。
P值
假設頻率稱為P值 , 也稱為測試假設的“觀察到的顯著性水平” 。P值和統(tǒng)計顯著性的傳統(tǒng)定義圍繞無效假設 , 我們將用于計算P值的所有其他假設視為完全正確 。由于我們不確定這些假設 , 我們將學習更普遍的P值視圖 , 它是觀測數(shù)據(jù)與我們預測或期望看到的數(shù)據(jù)之間的兼容性的統(tǒng)計匯總 , 如果我們知道整個統(tǒng)計模型是正確的 。
統(tǒng)計中p值怎么計算 p值如何計算


使用檢驗統(tǒng)計量(例如t統(tǒng)計量或卡方統(tǒng)計量)來測量數(shù)據(jù)與模型預測之間的距離 。如果每個模型假設都是正確的 , 包括測試假設 , 那么P值就是所選擇的檢驗統(tǒng)計量至少與其觀察值一樣大的概率 。這個定義體現(xiàn)了傳統(tǒng)定義中丟失的一個關(guān)鍵點:在邏輯術(shù)語中 , P值測試所有關(guān)于數(shù)據(jù)生成方式的假設(整個模型) , 而不僅僅是它應該測試的目標假設(例如null)假設) 。
通過獲得較小的P值 , 我們可以說 , 如果所有假設都是正確的 , 那么數(shù)據(jù)就更不尋常;但是一個非常小的P值并沒有告訴我們關(guān)于假設有效性的任何信息 。讓我們舉一個例子 , 當P值因為假設的假設目標而非常小時 , 由于研究協(xié)議違規(guī) , 它可能很小 , 或者可能是用不正確的數(shù)據(jù)進行分析 。相反 , 大的P值表明數(shù)據(jù)在統(tǒng)計模型下并不罕見 , 但它并沒有告訴我們關(guān)于模型有效性和假設的任何信息 。由于研究協(xié)議違規(guī) , 它可能很大 , 或者可能是使用不正確的數(shù)據(jù)進行分析 , 或者只是為了表示目的而制作有效點 。

推薦閱讀