「顯著」的問題:p值是判斷研究成敗的過時指標嗎?
文章推薦指數: 80 %
統計檢定是不是顯著,或者p值是不是小到可以接受的水準,是多數自然科學與社會科學的學術工作者們,分析資料判斷能否更新知識的工具。
也是開發機器學習 ...
集團資訊關於我們集團介紹我們的團隊旗下媒體關鍵評論網everylittled.INSIDE運動視界Cool3c電影神搜未來大人物歐搜哇商益旗下節目多元服務Ad2Taketla拿票趣關鍵議題研究中心Cr.EDShareParty達思智能科技士奇傳播與我們合作內容行銷與廣告業務異業合作原創內容暨內容媒體業者合作加入我們新聞中心
2019/04/30,科學PhotoCredit:RalfHirschberger/APImages/達志影像陳紹慶慈濟大人類發展與心理學系副教授,開放科學中心大使(CenterforOpenScienceAmbassador),心理科學加速器助理監督。
在台灣教了幾年書,2014年受到開放科學的知識論感召,親身到荷蘭體會身體力行之路。
希望向華文大眾與學術界傳播分辨好壞科學的心法。
看更多此作者文章...訂閱作者收藏本文每月一杯咖啡的金額,支持優質觀點的誕生,享有更好的閱讀體驗。
立即支持統計檢定是不是顯著,或者p值是不是小到可以接受的水準,是多數自然科學與社會科學的學術工作者們,分析資料判斷能否更新知識的工具。
也是開發機器學習模型的數據分析人員,用來判斷收集到的資料,能不能支持想驗證的假設之常見指標。
自從重要奠基者RolandFisher、JerzyNeyman與EgonPearson分別發表p值以及推論犯錯率的重要概念與數學推導[12],二次世界大戰後許多科學研究者,習慣用少於0.05的p值,推論獲得或發現預期的結果。
統計推論的使用策略發展到21世紀的前10年,每個運用統計的科學領域已經累積不少批判與反省統計推論與p值的意見。
2005年統計學者JohnIoannidis發表批判生物醫學領域充斥偽陽性結果的經典論文[3],到2010年起心理學界密集爆發學術不端事件,以及高影響力期刊接受無法再現的爭議研究事件[4],讓科學家誤用p值的問題浮現。
除了各領域學者集結推出各種改良方案與行動[5][6],2016年美國統計學會(ASA)理事會發表聲明[7],提出6點建議給需要運用統計推論做出結論的科學家們,如何正確使用與解讀p值。
ASA的建議公開的時候,台灣也有不少學者關注後續的影響。
美國德州大學奧斯汀分校的林澤民教授於個人部落格分享當時的在台演講〈p值的陷阱〉[8],獲得華文知識圈廣大迴響。
到了2019年3月,2016年代表ASA撰寫聲明的RonaldWasserstein,將2016年參與ASA主辦的主題研討會學者發表的評論與建議,一共43篇論文集結於ASA專刊[9]。
參與其中兩篇專文的三位學者ValentinAmrhein、SanderGreenland與BlakeMcShane於專刊發表同日在《自然》期刊發表主張,響應ASA的專刊主題[10]。
三位作者提到完成這份主張的初稿時,曾將預印本公佈於網路並收集連署,一星期內就獲得來自800多位統計學及自然與社會科學領域的學者響應。
因此《自然》期刊公開上網後,也吸引全球各地關心統計推論誤用問題人士的注目。
最初看到Amrhein等人的主張,我就留意過去幾年投入提昇心理學研究品質的學者,一面倒地批判他們的建議做法:放棄p值的判斷閾限,提倡運用信賴區間評估實際結果與預期結果的相容性。
主要的批判意見是這些學者提出的建議,都是指點科學家們要做什麼,或者不要做什麼,而非討論為什麼該這麼做或不該這麼做。
我看了幾天各方意見交流,也有自己的看法時,就收到林澤民教授的私訊,詢問有沒有興趣寫篇科普文章,向有興趣的讀者說明這幾年各界批評統計推論濫用的聲浪,帶來什麼訊息。
一個非正式調查當下我決定做個非正式調查,了解一下林教授〈p值的陷阱〉發佈3年後,華文圈的統計使用者正確了解p值人們有多少,還有探討誤解存在的原因。
非正式的調查結果促成我寫作這篇文章的主要動機。
2019年4月1日,我在個人臉書發佈下圖的動態訊息,建議第一次看到這則訊息的朋友,請自己先想想看,以你現在所知選擇你認為正確的答案:
作者Facebook帖文截圖p值是什麼?回首林教授〈p值的陷阱〉,林教授的解釋如下:p值是什麼?我想在座有很多專家比我都懂,但是也有一些同學在場,所以還是稍微解釋一下。
p值是由RonaldFisher在1920年代發展出來的,已將近100年。
p值檢定最開始,是檢定在一個model之下,實驗出來的data跟model到底吻合不吻合。
這個被檢定的model,我們把它叫做虛無假設(nullhypothesis),一般情況下,這個被檢定的model,是假設實驗並無系統性效應的,即效應是零,或是隨機狀態。
在這個虛無假設之下,得到一個統計值,然後要算獲得這麼大(或這麼小)的統計值的機率有多少,這個機率就是p值。
ASA的2016年聲明中,有關p值的解釋也是短短的一句話:Informally,ap-valueistheprobabilityunderaspecifiedstatisticalmodelthatastatisticalsummaryofthedata(e.g.,thesamplemeandifferencebetweentwocomparedgroups)wouldbeequaltoormoreextremethanitsobservedvalue.看過以上解釋,有仔細思考的讀者應該會把想選擇的答案縮小到3與4兩個選項。
但是不太熟悉機率的讀者應該會困惑,p值是個什麼樣的機率?林教授說的「在這個虛無假設之下,得到一個統計值,然後要算獲得這麼大(或這麼小)的統計值的機率有多少」,以及ASA的解釋「theprobabilityunderaspecifiedstatisticalmodelthatastatisticalsummaryofthedata…」。
兩種解釋都說明p值是一種條件機率。
借用DeborahMayo寫的書《Statisticalinferenceasseveretesting:howtogetbeyondthestatisticswars》[11]所記的公式,告訴我們p值是這樣的條件機率:
Pr(X≥x0∣H0)=p(x0)公式裡的H0,代表虛無假設的統計模型(statisticalmodel),X代表實際資料的隨機變數,x0代表虛無假設統計模型的隨機變數,一般來說X與x0分別指實際資料的平均值與統計模型估計的期望值[12]。
X與x0之間的差異越小,表示實際資料越符合虛無假設統計模型,得到的p值會越大,反之實際資料越不符合虛無假設統計模型,p值會越小。
實際資料符合虛無假設統計模型的機率越小,表示實際資料有可能符合其他統計模型。
虛無假設統計模型通常代表沒有效果的預期結果,所以科學家通常希望得到的p值越小越好。
為何許多人會誤解p值這次非正式調查列出的選項,最正確的是4,選項5要加上前提「具備高考驗力的條件時」才是正確。
但是我發現許多只選一項的網友選擇3,部分網友表示3、4都有可能,這些網友身份從老師到學生都有,公佈答案時沒有人只選擇4。
選項3所指是另一種條件機率:Pr(H0∣X≥x0)=p(H0)
123»全文閱讀不想分頁?試試看我們的新服務最新發展:不具有「可再現性」的研究,還能算是科學嗎?2年前拋棄「統計顯著性」就代表科學界不再追求「確定性」嗎?3年前Tags:再現危機p值數學統計學研究顯著可容性區間信賴區間心理學reproducibilityp-value科學重複實驗科學研究學術期刊More...
Sponsored2022/10/06,理財PhotoCredit:TNLBrandStudio廣編企劃由關鍵評論網媒體集團《業務團隊》製作,由各品牌單位贊助。
業務與行銷相關合作,歡迎與我們聯繫。
看更多此作者文章...訂閱作者收藏本文每月一杯咖啡的金額,支持優質觀點的誕生,享有更好的閱讀體驗。
立即支持新冠疫情起落、烏俄戰事攀升,兩大影響因素不只造成今年國際政治情勢動盪,也衝擊各大產業供應鏈,導致全球性的通貨膨脹。
各國政府紛紛祭出貨幣緊縮政策,美國聯準會自五月開始罕見的連4次大幅度升息,台灣央行也睽違10年首次升息,9月更持續升息半碼來因應急速上升的通膨數字。
面對國際金融市場的升息循環,不只台股熊市不斷、小資族房/車貸款負擔也增重不少。
隨著後疫情時代,加速許多產業數位轉型,以因應新型態的經濟環境,2023年也將重新開放國界,期望帶動經濟的復甦,面對重新整頓的市場,積極的理財配置規劃更顯得重要。
在如此難料的經濟走勢中,我們到底該如何觀察國際經濟局勢、正確的運用數位工具來評估市場風險、守護你我的荷包呢?
永豐銀行即將攜手關鍵評論網,於2022年10月20日舉辦DAWHO之夜直播活動──「大戶方舟策略迎接未知挑戰」。
此次活動依然邀請甜美聰慧的吳怡霈擔任主持人,並邀請理財達人寶可孟與存股達人大俠武林兩位專家,一起聊聊對於現今市場動態及投資環境的觀察,以及在如此動盪的經濟環境之下,該如何善用數位工具掌握投資風險。
數據思維x紀律投資:大戶經驗不藏私
投資是條漫長的道路,一路走來往往需要經驗、知識的相互支持,才能獲得甜美的果實;而直播活動中來賓與主持人的經驗,也能成為滋潤聽眾投資路上的養分。
此次理財達人寶可孟將從自身經驗出發,與觀眾分享在如今數據為王的資訊時代,投資人該如何將自身經驗與數據思維結合,善用數位工具觀察市場動向;而存股達人大俠武林也不藏私的傳授投資鐵律──「紀律投資」,分享如何在數位工具的輔助下,簡易而慎重地落實多元的資產配置。
NextStep!DAWHO數位帳戶伴您渡過瞬息萬變的市場
身處數位經濟崛起的時代,不只知識、經驗需要與時俱進,便捷高效的數位工具也是投資時不可或缺的利器,而永豐銀行的新世代VIP數位帳戶「DAWHO」所具備的全方位金融科技服務,正是您最貼心的數位理財幫手。
「DAWHO」不只整合消費、投資、儲蓄及彈性資金四大核心服務,還擁有1.3%高利活儲,提供多元豐富的數位金融服務及多種投資金融商品建議,幫助您掌握即時經濟脈動,精明而輕鬆地管理財富。
☞立即了解永豐DAWHO
立即開啟行事曆,標記2022年10月20日20:00-21:00準時加入線上直播,與我們一同洞察先機、掌握世界經濟脈動!
Tags:永豐銀行理財經驗分享直播寶可孟DAWHO活動理財數位工具資產配置投資風險大俠武林DAWHO之夜吳怡霈線上直播大戶方舟策略More...鴻海科技日發表MODELB跨界休旅、MODELV電動皮卡;未來10年堅持CDMS模式,要當全球車商的夥伴1則觀點雪羊:基於這五個事實查核基礎,曾格爾「13小時無氧速攀Manaslu」的可能性奇低無比1則觀點心臟保健指南:除了控制好血糖和血壓,也該戒掉抽菸喝酒的習慣1則觀點「私募股權基金」不只為產業轉型引進資金,還提供管理專業人才創造價值1則觀點2022年11月15日將達到80億人,我們的地球能養活多少人口?1則觀點我們印象中的「安平古堡」其實不是古蹟?「熱蘭遮堡」到底是什麼意思?1則觀點《預防猝死超圖解》:心絞痛與心肌梗塞合稱「缺血性心臟病」,兩者有什麼不同?1則觀點心肌梗塞時別大力咳嗽,不然連小命都一起咳掉了1則觀點中共的時勢英雄觀:中國選擇了習近平,還是習近平選擇了中國?2則觀點一生經歷三個女人的徐志摩,究竟是偉大情聖還是超級渣男?1則觀點
延伸文章資訊
- 1顯著性差異- 維基百科,自由的百科全書
統計學的假說檢定中,顯著性差異(或統計學意義,英語:statistical significance)是對數據差異性的評價,當某次實驗的結果在虛無假說下不大可能發生時,就認為該結果 ...
- 2「顯著」的問題:p值是判斷研究成敗的過時指標嗎?
統計檢定是不是顯著,或者p值是不是小到可以接受的水準,是多數自然科學與社會科學的學術工作者們,分析資料判斷能否更新知識的工具。也是開發機器學習 ...
- 3顯著| 造句救星
非常明白、明顯。造句:在父母悉心照顧下,他的病情有顯著的進步。 更多相關訊息,請至Google「顯著」搜尋 ...
- 4显著性差异- 维基百科,自由的百科全书
統計學的假說檢定中,顯著性差異(或统计学意义,英語:statistical significance)是對數據差異性的評價,當某次實驗的结果在虛無假說下不大可能发生时,就認為該結果 ...
- 5顯著性檢驗 - MBA智库百科
顯著性檢驗(Significance Testing)顯著性檢驗就是事先對總體(隨機變數)的參數或總體分佈形式做出一個假設,然後利用樣本信息來判斷這個假設(原假設)是否合理, ...