小蜜被两老头吸奶头在线观看,欧美日韩国产精品1卡,中文字幕无码视频手机免费看

【統(tǒng)計中p值怎么計算 p值如何計算】點擊上方， All in AI中國

每個數(shù)據(jù)科學家都會遇到這樣一個問題，什么是P值以及我們?nèi)绾卧诮y(tǒng)計分析中使用它？
每個數(shù)據(jù)科學訪談中至少有一個問題是關(guān)于P值及其目的。因此，在本文中，我將討論P值的上下文、過程和目的。數(shù)十年來一直譴責對統(tǒng)計測試的錯誤解釋和濫用、置信區(qū)間和統(tǒng)計能力，但仍然猖獗。由于這些概念需要高度和時間，這種高認知需求導致了捷徑定義和解釋的流行，這種定義和解釋完全是錯誤的，有時甚至是災難性的。然而這些誤解在大部分科學文獻中都占主導地位。
統(tǒng)計測試
在統(tǒng)計測試的大多數(shù)應用中，模型中的一個假設是假設特定效應具有特定大小，并且已經(jīng)成為統(tǒng)計分析的目標。這種有針對性的假設稱為研究假設或檢驗假設，用于評估它的統(tǒng)計方法稱為統(tǒng)計假設檢驗。最常見的是，目標效應大小是一個“null”值，表示零效應(例如，研究處理對平均結(jié)果沒有影響) ，在這種情況下，測試假設被稱為零假設。盡管如此，也可以測試其他效果大小。我們還可以檢驗假設效果是否屬于特定范圍;例如，我們可以檢驗效果不大于特定量的假設，在這種情況下，假設被認為是單側(cè)假設。

許多統(tǒng)計教學和實踐已經(jīng)形成了一種強烈（并且不健康）的焦點，即研究的主要目的應該是檢驗無效假設。實際上，大多數(shù)統(tǒng)計測試的描述僅于測試無效假設，整個主題被稱為“空假設顯著性檢驗” 。這種對零假設的獨家會導致對測試的誤解。更令人誤解的是，許多作者使用“零假設”來指代任何檢驗假設，即使這種用法與其他作者不一致，而且普通英語定義為“無效” 。
更精確的統(tǒng)計分析目標是提供關(guān)于效果大小的確定性或不確定性的評估。我們在假設的“可能性”方面表達了這種確定性。然而，在傳統(tǒng)的統(tǒng)計方法中， “概率”不是指假設，而是指假定統(tǒng)計模型下數(shù)據(jù)模式的假設頻率的數(shù)量。這些方法因此被稱為頻率論方法，并且它們預測的假設頻率被稱為“頻率概率” ，而不是假設概率（誤解）。
P值
假設頻率稱為P值，也稱為測試假設的“觀察到的顯著性水平” 。P值和統(tǒng)計顯著性的傳統(tǒng)定義圍繞無效假設，我們將用于計算P值的所有其他假設視為完全正確。由于我們不確定這些假設，我們將學習更普遍的P值視圖，它是觀測數(shù)據(jù)與我們預測或期望看到的數(shù)據(jù)之間的兼容性的統(tǒng)計匯總，如果我們知道整個統(tǒng)計模型是正確的。

使用檢驗統(tǒng)計量（例如t統(tǒng)計量或卡方統(tǒng)計量）來測量數(shù)據(jù)與模型預測之間的距離。如果每個模型假設都是正確的，包括測試假設，那么P值就是所選擇的檢驗統(tǒng)計量至少與其觀察值一樣大的概率。這個定義體現(xiàn)了傳統(tǒng)定義中丟失的一個關(guān)鍵點：在邏輯術(shù)語中， P值測試所有關(guān)于數(shù)據(jù)生成方式的假設（整個模型），而不僅僅是它應該測試的目標假設（例如null）假設）。
通過獲得較小的P值，我們可以說，如果所有假設都是正確的，那么數(shù)據(jù)就更不尋常;但是一個非常小的P值并沒有告訴我們關(guān)于假設有效性的任何信息。讓我們舉一個例子，當P值因為假設的假設目標而非常小時，由于研究協(xié)議違規(guī) ，它可能很小，或者可能是用不正確的數(shù)據(jù)進行分析。相反，大的P值表明數(shù)據(jù)在統(tǒng)計模型下并不罕見，但它并沒有告訴我們關(guān)于模型有效性和假設的任何信息。由于研究協(xié)議違規(guī) ，它可能很大，或者可能是使用不正確的數(shù)據(jù)進行分析，或者只是為了表示目的而制作有效點。