變異數分析(ANOVA) - IBM

文章推薦指數: 80 %
投票人數:10人

單向ANOVA 檢定使用F 值。

下列程序說明如何計算F 值: ... 將種類欄位的平方和除以適當的自由度。

... F 值會與理論F 分佈進行比較,以判定有機會得到F 值的機率。

變異數分析(ANOVA) 變異數分析(或ANOVA)是用於評估欄位間關係的線性建模方法。

對於關鍵動因,以及與若干圖表相關的見解,ANOVA會測試平均目標值是否因一個輸入種類或兩個輸入種類組合不同而有所不同。

若要測試平均值是否不同,ANOVA檢定會將解釋變異數(由輸入欄位所造成)與未解釋變異數(由錯誤來源所造成)進行比較。

如果解釋變異數與未解釋變異數的比例偏高,則平均值有統計差異。

IBM®CognosAnalytics可以計算單向ANOVA測試(有一個輸入)和雙向ANOVA測試(有兩個輸入)。

如果是連續輸入,則會對輸入進行Bin處理,以建立可使用ANOVA檢定以比較其目標平均值的群組。

單向 ANOVA檢定是T檢定的延伸,但ANOVA檢定可以比較任意數的平均值。

T檢定只能比較兩個平均值。

雖然ANOVA檢定會顯示平均值之間的統計差異,但不會指出哪些平均值不同。

IBMCognosAnalytics視覺化見解特性會報告群組,這些群組會導致平均值與有意義的差異不同。

單向ANOVA單向ANOVA檢定使用F值。

下列程序說明如何計算F值: 計算連續欄位的整體平均值。

計算種類欄位的均方(解釋變異數)。

計算種類欄位的平方和。

對於每個種類,從種類的平均值減去整體平均值。

取得每個結果的平方,並將它們加在一起。

將種類欄位的平方和除以適當的自由度。

計算錯誤來源的均方(未解釋的變異數)。

計算錯誤來源的平方和。

在每個種類內,從每個記錄值減去種類的平均值。

取得每個差異的平方,並將它們加在一起。

將錯誤來源的平方和除以適當的自由度。

將種類欄位的均方除以錯誤來源的均方。

換言之,即計算解釋變異數與未解釋變異數的比例。

這是F值。

F值會與理論F分佈進行比較,以判定有機會得到F值的機率。

此機率為顯著性值。

如果顯著性值小於顯著水準,則平均值為顯著差異。

調整過的R2用來預估模型預測強度。

顯著水準設為5%,模型預測強度必須大於10%,才能指出目標與輸入欄位之間的可靠預測關係。

對單向關鍵動因及圖表(顯示種類欄位的各種類間的平均數值測量)的見解報告預測強度。

雙向ANOVA類似單向ANOVA,雙向ANOVA檢定會計算F值。

它用來測試完整雙向模型中的平均值是否有顯著差異。

此程序與單向ANOVA類似,除了是使用兩個種類欄位作為輸入而非使用單一種類欄位。

對於種類欄位中的每個種類組合,計算平均值與平方和統計資料。

調整過的R2也用來預估模型預測強度。

顯著水準設為5%,並且模型預測強度必須大於10%才會將模型列入考量。

此外,雙向模型對於巢狀單向模型的預測強度必須至少具有10% 的相對改進,才能指示目標與兩個輸入欄位之間的可靠預測關係。

相對改善的計算方式是100%與巢狀單向模型的預測強度之間差異的百分比。

對雙向關鍵動因及圖表(顯示兩個種類欄位的各種類間的平均數值測量)的見解報告預測強度。

上層主題:統計測試



請為這篇文章評分?