資料分析中的P值怎麼計算什麼意義

2021-03-05 09:13:43 字數 5374 閱讀 3484

1樓:之何勿思

一、p值計算方法

左側檢驗p值是當時,檢驗統計量小於或等於根據實際觀測樣本資料計算得到的檢驗統計量值的概率,即p值。

右側檢驗p值是當μ=μ0時,檢驗統計量大於或等於根據實際觀測樣本資料計算得到的檢驗統計量值的概率,即p值。

雙側檢驗p值是當μ=μ0時,檢驗統計量大於或等於根據實際觀測樣本資料計算得到的檢驗統計量值的概率,即p值。

二、p值的意義

p 值即概率,反映某一事件發生的可能性大小。統計學根據顯著性檢驗方法所得到的p 值,一般以p < 0.05 為顯著, p <0.

01 為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小於0.05 或0.01。

2樓:卡門kamen之歌

p值即概率,反映某一事件發生的可能性大小。

p值的計算:

一般地,用x 表示檢驗的統計量,當h0為真時,可由樣本資料計算出該統計量的值c,根據檢驗統計量x的具體分佈,可求出p值。具體地說:

左側檢驗的p值為檢驗統計量x 小於樣本統計值c 的概率,即:p = p

右側檢驗的p值為檢驗統計量x 大於樣本統計值c 的概率:p = p

雙側檢驗的p值為檢驗統計量x 落在樣本統計值c 為端點的尾部區域內的概率的2 倍:p = 2p (當c位於分佈曲線的右端時) 或p = 2p (當c 位於分佈曲線的左端時) 。

若x 服從正態分佈和t分佈,其分佈曲線是關於縱軸對稱的,故其p 值可表示為p = p 。

計算出p值後,將給定的顯著性水平α與p 值比較,就可作出檢驗的結論:

如果α > p值,則在顯著性水平α下拒絕原假設。

如果α ≤ p值,則在顯著性水平α下接受原假設。

在實踐中,當α = p值時,也即統計量的值c剛好等於臨界值,為慎重起見,可增加樣本容量,重新進行抽樣檢驗。

3樓:猴吠巳

p 值即概率,反映某一事件發生的可能性大小。統計學根據顯著性檢驗方法所得到的p 值,一般以p < 0.05 為顯著, p <0.

01 為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小於0.05 或0.01。

實際上,p 值不能賦予資料任何重要性,只能說明某事件發生的機率。 p < 0.01 時樣本間的差異比p < 0.

05 時更大,這種說法是錯誤的。統計結果中顯示pr > f,也可寫成pr( >f),p = p或p = p。 下面的內容列出了p值計算方法。

(1) p值是: 1) 一種概率,一種在原假設為真的前提下出現觀察樣本以及更極端情況的概率。 2) 拒絕原假設的最小顯著性水平。

3) 觀察到的(例項的) 顯著性水平。 4) 表示對原假設的支援程度,是用於確定是否應該拒絕原假設的另一種方法。 (2) p 值的計算:

一般地,用x 表示檢驗的統計量,當h0 為真時,可由樣本資料計算出該統計量的值c ,根據檢驗統計量x 的具體分佈,可求出p 值。具體地說: 左側檢驗的p 值為檢驗統計量x 小於樣本統計值c 的概率,即 = p 右側檢驗的p 值為檢驗統計量x 大於樣本統計值c 的概率 = p 雙側檢驗的p 值為檢驗統計量x 落在樣本統計值c 為端點的尾部區域內的概率的2 倍:

p = 2p (當c位於分佈曲線的右端時) 或p = 2p (當c 位於分佈曲線的左端時) 。若x 服從正態分佈和t分佈,其分佈曲線是關於縱軸對稱的,故其p 值可表示為p = p 。 計算出p 值後,將給定的顯著性水平α與p 值比較,就可作出檢驗的結論:

如果α > p 值,則在顯著性水平α下拒絕原假設。 如果α ≤ p 值,則在顯著性水平α下接受原假設。 在實踐中,當α = p 值時,也即統計量的值c 剛好等於臨界值,為慎重起見,可增加樣本容量,重新進行抽樣檢驗。

整理自: 樊冬梅,假設檢驗中的p值. 鄭州經濟管理幹部學院學報,2002,韓志霞, 張玲,p 值檢驗和假設檢驗。

邊疆經濟與文化,2006中國航天工業醫藥,1999 p值是怎麼來的 從某總體中抽 ⑴、這一樣本是由該總體抽出,其差別是由抽樣誤差所致; ⑵、這一樣本不是從該總體抽出,所以有所不同。 如何判斷是那種原因呢?統計學中用顯著性檢驗賴判斷。

其步驟是: ⑴、建立檢驗假設(又稱無效假設,符號為h0):如要比較a藥和b藥的療效是否相等,則假設兩組樣本來自同一總體,即a藥的總體療效和b藥相等,差別僅由抽樣誤差引起的碰巧出現的。

⑵、選擇適當的統計方法計算h0成立的可能性即概率有多大,概率用p值表示。⑶、根據選定的顯著性水平(0.05或0.

01),決定接受還是拒絕h0。如果p>0.05,不能否定「差別由抽樣誤差引起」,則接受h0;如果p<0.

05或p <0.01,可以認為差別不由抽樣誤差引起,可以拒絕h0,則可以接受令一種可能性的假設(又稱備選假設,符號為h1),即兩樣本來自不同的總體,所以兩藥療效有差別。 統計學上規定的p值意義見下表 p值 碰巧的概率 對無效假設 統計意義 p>0.

05 碰巧出現的可能性大於5% 不能否定無效假設 兩組差別無顯著意義 p<0.05 碰巧出現的可能性小於5% 可以否定無效假設 兩組差別有顯著意義 p <0.01 碰巧出現的可能性小於1% 可以否定無效假設 兩者差別有非常顯著意義 理解p值,下述幾點必須注意:

⑴p的意義不表示兩組差別的大小,p反映兩組差別有無統計學意義,並不表示差別大小。因此,與對照組相比,c藥取得p<0.05,d藥取得p<0.

01並不表示d的藥效比c強。 ⑵ p>0.05時,差異無顯著意義,根據統計學原理可知,不能否認無效假設,但並不認為無效假設肯定成立。

在藥效統計分析中,更不表示兩藥等效。哪種將「兩組差別無顯著意義」與「兩組基本等效」相同的做法是缺乏統計學依據的。 ⑶統計學主要用上述三種p值表示,也可以計算出確切的p值,有人用p <0.

001,無此必要。 ⑷顯著性檢驗只是統計結論。判斷差別還要根據專業知識。

樣所得的樣本,其統計量會與總體引數有所不同,這可能是由於兩種原因 [ts]kokofu 於 2010-3-25 22:12 補充以下內容[/ts] 實際上生物統計原理基於此……呵呵。 檢視原帖》

4樓:一個人在那看書

資料分析中的ph值怎麼計算?什麼意義?還是以化學式的方式結構?

5樓:根鬧米

p值代表結果的可信程度,p越大,就越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.

05提示樣本中變數關聯有5%的可能是由於偶然性造成的。

專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.

05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。

)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。

所以雙側p值

在最後結論中判斷什麼樣的顯著性水平具有統計學意義,不可避免地帶有武斷性。換句話說,認為結果無效而被拒絕接受的水平的選擇具有武斷性。實踐中,最後的決定通常依賴於資料集比較和分析過程中結果是先驗性還是僅僅為均數之間的兩兩》比較,依賴於總體資料集裡結論一致的支援性證據的數量,依賴於以往該研究領域的慣例。

通常,許多的科學領域中產生p值的結果≤0.05被認為是統計學意義的邊界線,但是這顯著性水平還包含了相當高的犯錯可能性。結果0.

05≥p>0.01被認為是具有統計學意義,而0.01≥p≥0.

001被認為具有高度統計學意義。但要注意這種分類僅僅是研究基礎上非正規的判斷常規。

統計p值是什麼,怎麼算?

6樓:喵喵喵

p值(p value)就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。如果p值很小,說明原假設情況的發生的概率很小,而如果出現了,根據小概率原理,我們就有理由拒絕原假設,p值越小,我們拒絕原假設的理由越充分。

總之,p值越小,表明結果越顯著。但是檢驗的結果究竟是「顯著的」、「中度顯著的」還是「高度顯著的」需要我們自己根據p值的大小和實際問題來解決。

計算:為理解p值的計算過程,用z表示檢驗的統計量,zc表示根據樣本資料計算得到的檢驗統計量值。

1、左側檢驗

時,檢驗統計量小於或等於根據實際觀測樣本資料計算得到的檢驗統計量值的概率,即p值

2、右側檢驗

p值是當μ=μ0時,檢驗統計量大於或等於根據實際觀測樣本資料計算得到的檢驗統計量值的概率,即p值

3、雙側檢驗

p值是當μ=μ0時,檢驗統計量大於或等於根據實際觀測樣本資料計算得到的檢驗統計量值的概率,即p值

擴充套件資料

美國統計協會公佈了p值使用的幾大準則:

準則1:p值可以表達的是資料與一個給定模型不匹配的程度

這條準則的意思是說,我們通常會設立一個假設的模型,稱為「原假設」,然後在這個模型下觀察資料在多大程度上與原假設背道而馳。p值越小,說明資料與模型之間越不匹配。

準則2:p值並不能衡量某條假設為真的概率,或是資料僅由隨機因素產生的概率。

這條準則表明,儘管研究者們在很多情況下都希望計算出某假設為真的概率,但p值的作用並不是這個。p值只解釋資料與假設之間的關係,它並不解釋假設本身。

準則3:科學結論、商業決策或政策制定不應該僅依賴於p值是否超過一個給定的閾值。

這一條給出了對決策制定的建議:成功的決策取決於很多方面,包括實驗的設計,測量的質量,外部的資訊和證據,假設的合理性等等。僅僅看p值是否小於0.05是非常具有誤導性的。

準則4:合理的推斷過程需要完整的報告和透明度。

這條準則強調,在給出統計分析的結果時,不能有選擇地給出p值和相關分析。舉個例子來說,某項研究可能使用了好幾種分析的方法。

而研究者只報告p值最小的那項,這就會使得p值無法進行解釋。相應地,宣告建議研究者應該給出研究過程中檢驗過的假設的數量,所有使用過的方法和相應的p值等。

準則5:p值或統計顯著性並不衡量影響的大小或結果的重要性。

這句話說明,統計的顯著性並不代表科學上的重要性。一個經常會看到的現象是,無論某個效應的影響有多小,當樣本量足夠大或測量精度足夠高時,p值通常都會很小。反之,一些重大的影響如果樣本量不夠多或測量精度不夠高,其p值也可能很大。

準則6:p值就其本身而言,並不是一個非常好的對模型或假設所含證據大小的衡量。

簡而言之,資料分析不能僅僅計算p值,而應該探索其他更貼近資料的模型。

宣告之後還列舉出了一些其他的能對p值進行補充的分析方手段,比如置信區間,貝葉斯方法,似然比,fdr(false discovery rate)等等。這些方法都依賴於一些其他的假定,但在一些特定的問題中會比p值更為直接地回答諸如「哪個假定更為正確」這樣的問題。

宣告最後給出了對統計實踐者的一些建議:好的科學實踐包括方方面面,如好的設計和實施,數值上和圖形上對資料進行彙總,對研究中現象的理解,對結果的解釋,完整的報告等等——科學的世界裡,不存在哪個單一的指標能替代科學的思維方式。

服裝行業資料分析中的OTB是什麼意思

otb open to buy 意為採購限額,所謂的採購限額,是在給定時期內 國外通常是1個月 計劃採購額與採購員承諾購買款項之間的差額 買手到底是個什麼職業?職業買手指的是專門從事如下職業的人 往返於世界各地,關注最新的流行資訊,手中掌握著大批量訂單,不停地與 商聯絡,組織商品進入市場,滿足不同需...

統計學中F值,P值,a值都是怎麼確定的

迴歸分析中 f值是檢驗線性關係,一般越到越好 p值是概率值,顯示引數估計的精準度,一般小於0.1均可,越小越好a值你講的可能是截距吧,也是看他對應的p值或t值.統計學中的f值 p值和r分別表示什麼意思,怎麼求 f值時f檢驗的統計量值,f msr mse,其中msr ssr 自由度,mse sst 自...

spss中兩組資料的顯著性差異怎麼分析

檢驗方式 給出了兩組各 10 名品酒員對一批白葡萄酒和一批紅葡萄酒的品評結果,以及這兩批葡萄酒的相應理化指標及釀酒葡萄的相應成分指標。對兩組品酒員評判結果應用 t 檢驗分析判斷兩組評判結果的差異性。根據成對雙樣本均值分析取每組品酒員對某種酒的樣本評分的平均值進行 t 檢驗分析,得出兩組評判員對某種葡...