1 / 38

第十二章 單因子變異數分析

第十二章 單因子變異數分析. F 分配 FDIST(). FDIST(F, 分子的自由度 , 分母的自由度 ) FDIST(x,degrees_freedom1,degrees_freedom2) F 為用來求算此函數的 F 值。由於 F 值是兩個均方相除: 故其自由度有兩個,一為分子的自由度;另一個為分母的自由度。且因分子分母均為正值(均方),故其分配僅在 0 之右側而已。 本函數在求:於某兩個自由度下之 F 分配中,求自右尾累計到 F 值的總面積(機率)。即傳回 F 分配之右尾累計機率值(下圖之陰影部份):.

aiko
Download Presentation

第十二章 單因子變異數分析

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第十二章 單因子變異數分析

  2. F分配FDIST() FDIST(F,分子的自由度,分母的自由度) FDIST(x,degrees_freedom1,degrees_freedom2) • F為用來求算此函數的F值。由於F值是兩個均方相除: • 故其自由度有兩個,一為分子的自由度;另一個為分母的自由度。且因分子分母均為正值(均方),故其分配僅在0之右側而已。 • 本函數在求:於某兩個自由度下之F分配中,求自右尾累計到F值的總面積(機率)。即傳回F分配之右尾累計機率值(下圖之陰影部份):

  3. F分配之圖形及機率值,將隨自由度不同而略有不同。範例Ch12.xlsx『FDIST』工作表,為自由度(2,10)與(3,15)之情況下,不同F值所求得之右尾累計機率:F分配之圖形及機率值,將隨自由度不同而略有不同。範例Ch12.xlsx『FDIST』工作表,為自由度(2,10)與(3,15)之情況下,不同F值所求得之右尾累計機率:

  4. F分配反函數FINV() FINV(左尾機率,分子的自由度,分母的自由度) FINV(probability,degrees_freedom1,degrees_freedom2) • 本函數用以於已知自由度之F分配中,求某累計機率所對應之F值。 • 由於F分配之圖形及機率值,將隨自由度不同而略有不同。範例Ch12.xlsx『FINV』工作表,是以自由度為(2,10)之情況下,所求得之結果:有了此函數,即可省去查『附錄五 F分配的臨界值』F分配表之麻煩。

  5. 馬上練習 • 查兩個自由度(d.f.)分別為1~10之情況下,單尾機率為5%之F值:(詳範例Ch12.xlsx『F分配的臨界值』工作表)

  6. F檢定FTEST() • 變異數分析(Analysis-of-Variance簡稱ANOVA),為統計學家費雪(Fisher,R.A.)首創,最常被用來檢定兩常母體之變異數是否相等(即,變異數同質性的檢定)與檢定多組(大於兩組)母群平均數是否相等?(若為兩組則採用t檢定或z檢定) • 要使用變異數分析的基本假設為: • 各樣本之母群體為常態分配(normality) • 各樣本之母群體為獨立(independence) • 各組樣本之母群體變異數相同(homogeneity-of-variance)

  7. 兩常態母體之變異數檢定 FTEST(範圍1,範圍2) FTEST(array1,array2) • 可傳回兩組資料(樣本數允許不同),變異數是否存有顯著差異的F檢定之右尾機率值(P值)。判斷檢定結果時很簡單,只須看此P值之二分之一是否小於所指定顯著水準之α值。(按理,係雙尾檢定,但通常會將數字大者當分子,故只須看右尾之臨界值即可) • 本函數,可用來測試兩組樣本的變異數是否相同?即變異數同質性的檢定,其虛無假設與對立假設分別為: H0:σ12=σ22(兩變異數相等) H1:σ12≠σ22(兩變異數不等)

  8. 假定,要檢定甲乙兩班之母體變異數是否相同(α=0.05)?隨機抽得範例Ch12.xlsx『F-TEST1』工作表之資料,以=FTEST(B2:B10,C2:C11)/2求得其右尾機率(P值)並將其除以2,其值為0.043<α=0.05,故應棄卻兩變異數相等之虛無假設:假定,要檢定甲乙兩班之母體變異數是否相同(α=0.05)?隨機抽得範例Ch12.xlsx『F-TEST1』工作表之資料,以=FTEST(B2:B10,C2:C11)/2求得其右尾機率(P值)並將其除以2,其值為0.043<α=0.05,故應棄卻兩變異數相等之虛無假設:

  9. 同樣之例子,若使用『資料分析』增益集。其處理步驟為:(詳範例Ch12.xlsx『F-TEST2』工作表)同樣之例子,若使用『資料分析』增益集。其處理步驟為:(詳範例Ch12.xlsx『F-TEST2』工作表) • 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕(#圖Ch12- DataAnalysis), 於『分析工具』處選選「F-檢定:兩個常態母體變異數的檢定」 • 續 鈕

  10. 於『變數1的範圍』與『變數2的範圍』處,設定兩組資料之範圍(B1:B10與C1:C11)於『變數1的範圍』與『變數2的範圍』處,設定兩組資料之範圍(B1:B10與C1:C11) • 點選「標記(L)」(因兩組資料均含『甲班』、『乙班』之字串標記) • α維持0.05 • 設定輸出範圍,本例安排於目前工作表之E2位置

  11. 依此結果:自由度為(8,9),F值3.4192>臨界值3.2296(F10處之P值0.0426<α=0.05,同於B15之值;E15處以FINV所算得之F值為3.419,同於F9之值),故可知甲乙班之變異數有顯著差異。(應棄卻兩變異數相等之虛無假設)依此結果:自由度為(8,9),F值3.4192>臨界值3.2296(F10處之P值0.0426<α=0.05,同於B15之值;E15處以FINV所算得之F值為3.419,同於F9之值),故可知甲乙班之變異數有顯著差異。(應棄卻兩變異數相等之虛無假設) • 按鈕結束,即可獲致檢定結果

  12. FTEST()函數實際上是以 計算求得F值,再代入FDIS()以(n1-1,n2-1)為自由度,求得其右尾機率。如以前面例子n1=9、n2=10、、 • 此值恰等於詳範例Ch12.xlsx『F-TEST3』工作表中,B16以FINV()函數所計算之結果。將其代入FDIS()以(8,9)為自由度,求得其右尾機率為0.0426,恰等於B15以FTEST()函數所計算之結果(該值係將雙尾機率除以2):

  13. 先檢定變異數再進行均數檢定 • 當以t檢定,進行兩獨立樣本(小樣本)均數檢定時,將視其變異數相同或不同,而使用不同之計算方法。實務上,很多知名的統計套裝軟體(如:SPSS、SAS),就先以F檢定,判斷其變異數是否相同?然後再進行適當之t檢定。 • 如,要對範例Ch12.xlsx『F&T』工作表之資料,進行兩班抽樣成績之均數檢定:

  14. 以前,我們是假設變異數相等(或不等)後,才來進行t檢定。但這種假設合理否?誰都不知道!所以,就先以F檢定,判斷其變異數是否相同:以前,我們是假設變異數相等(或不等)後,才來進行t檢定。但這種假設合理否?誰都不知道!所以,就先以F檢定,判斷其變異數是否相同: • 由其F10處之P值為0.27>α=0.05,故無法棄卻兩變異數相等之虛無假設。

  15. 由於,F檢定之結果顯示甲乙兩班之變異數相等。故可使用『t檢定:兩個母體平均數差異檢定,假設變異數相等』之方法進行檢定。假定,要判斷在α=0.05之顯著水準下,乙班之平均成績是否高過甲班?由於是變異數相同,t檢定之類型為2。且虛無假設與對立假設分別為:H0:μ1≧μ2H1:μ1<μ2由於,F檢定之結果顯示甲乙兩班之變異數相等。故可使用『t檢定:兩個母體平均數差異檢定,假設變異數相等』之方法進行檢定。假定,要判斷在α=0.05之顯著水準下,乙班之平均成績是否高過甲班?由於是變異數相同,t檢定之類型為2。且虛無假設與對立假設分別為:H0:μ1≧μ2H1:μ1<μ2 • 故此類檢定為單尾檢定。所以,以=TTEST(C2:C11,B2:B10,1,2)或以『資料分析』之「t檢定:兩個母體平均數差異檢定,假設變異數相等」增益集:

  16. 均可進行檢定: • 無論由B16或F27之單尾P值來看,均顯示其值0.1856>α=0.05,故仍無法棄卻兩班之均數相等的虛無假設,所以並無法證明乙班之平均成績會高過甲班。

  17. 馬上練習 • 以範例Ch12.xlsx『F&T馬上練習』工作表,利用F檢定,判斷北區與南區給予剛畢業之大學生的薪資變異數是否相等(α=0.05)?續以適當之t檢定,判斷北區給剛畢業之大學生的平均薪資是否高過南區(α=0.05)?

  18. 由其G10處之P值為0.17>α=0.05,故無法棄卻兩變異數相等之虛無假設,故得使用兩個母體變異數相等之均數檢定:由其G10處之P值為0.17>α=0.05,故無法棄卻兩變異數相等之虛無假設,故得使用兩個母體變異數相等之均數檢定: 由G26之單尾P值0.003<α=0.05,故得棄卻兩區均數相等之虛無假設,所以北區給剛畢業之大學生的平均薪資高過南區。

  19. 單因子變異數分析(ANOVA) • 變異數分析的另一種用途,是用來檢定多組(>2)母群平均數是否相等?亦即,Z與t檢定是用於兩組資料比較平均數差異時;而比較二組以上的平均數是否相等時,就須使用到變異數分析。其虛無假設與對立假設為:H0:μ1=μ2=…=μk(每組之均數相等)H1:至少有兩個平均數不相等 • 假定,範例Ch12.xlsx『ANOVA』工作表資料,為調查各地區對政府施政的整體滿意程度(滿分為100分),試以α=0.01之顯著水準,檢定各地區之滿意程度是否存有顯著差異?

  20. 本例,以使用『資料分析』進行處理最為便捷。其步驟為:本例,以使用『資料分析』進行處理最為便捷。其步驟為: • 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕, 於『分析工具』處選「單因子變異數分析」 • 續按鈕

  21. 於『輸入範圍』處,設定三組資料之範圍,選取可包括所有資料之最小範圍即可(本例為B2:D12,別管其內可能仍含有空白儲存格)於『輸入範圍』處,設定三組資料之範圍,選取可包括所有資料之最小範圍即可(本例為B2:D12,別管其內可能仍含有空白儲存格) • 將『分組方式』安排為「逐欄(C)」 • 點選「類別軸標記在第一列上(L)」(因各組資料均含標題之字串標記) • α設定為0.01 • 設定輸出範圍,本例安排於目前工作表之G2位置

  22. 按鈕結束,即可獲致單因子變異數分析之ANOVA表按鈕結束,即可獲致單因子變異數分析之ANOVA表 依此結果:自由度為(2,24),F值10.79886>臨界值5.61(L13處之P值0.00045<α=0.01),故可知三個地區之整體滿意度存有顯著差異。南區的滿意度86.5要比其餘兩區(66.30與79.89)來得高。

  23. 馬上練習 • 某公司於報紙上進行廣告,範例Ch12.xlsx『廣告ANOVA』工作表,為不同方式廣告當天所獲得之回應人數:試以α=0.05之顯著水準,檢定不同方式廣告之回應人數是否存有顯著差異?

  24. 答案:F=6.56,d.f.=3,19,P-值=0.00,不同方式廣告之回應人數間存有顯著差異。全版與半版廣告之回應人數(1173.5與1083.2)高於1/4版與小廣告(724.4與733.0)。

  25. 馬上練習 答案:F=0.46,d.f.=2,32,P-值=0.64,大學生每月刷卡金額並不會因其零用金來源不同而存有顯著差異。 • 依範例Ch12.xlsx『信用卡刷卡金額』工作表 試以α=0.05之顯著水準,檢定大學生每月刷卡金額是否隨零用金來源不同而存有顯著差異?

  26. 馬上練習 • 將範例Ch12.xlsx『手機平均月費』工作表之內容 將其整理成僅剩有手機者(刪除無手機者),並以居住狀況分組:

  27. 答案:F=6.887,d.f.=2,116,P-值=0.001<α=0.05,故大學生每月手機月費將隨其居住狀況不同而存有顯著差異,住家裡最高(572.36)、其次為住校外(447.59),最後為住學校宿舍(319.43)。這可能與住學校者較為節儉有關。 • 試以α=0.05之顯著水準,檢定大學生每月手機月費是否隨其居住狀況不同而存有顯著差異?

  28. 量表的檢定—多組 • 對於如: 等之評價量表,我們也經常得進行分組檢定。看對某一屬性之注重程度,是否會因組別不同而有顯著差異?

  29. 若僅分兩組,係以『資料分析』之「Z檢定:兩個母體平均數差異檢定」來進行檢定。若組數為兩組以上,則以『資料分析』之「單因子變異數分析」來進行檢定。若僅分兩組,係以『資料分析』之「Z檢定:兩個母體平均數差異檢定」來進行檢定。若組數為兩組以上,則以『資料分析』之「單因子變異數分析」來進行檢定。 • 以範例Ch12.xlsx『擁有手機時間長短X附屬功能多屬性』工作表,其內僅安排一個『附屬功能多』評價項目(非常重要-5、……、非常不重要-1)及擁有手機之時間長短資料(1.未滿六個月、2.六個月至一年、3.一年~一年半、4.一年半以上):

  30. 由於分組結果超過兩組,故得以『附屬功能多』之「單因子變異數分析」來進行檢定。先將其資料整理成:由於分組結果超過兩組,故得以『附屬功能多』之「單因子變異數分析」來進行檢定。先將其資料整理成:

  31. 然後,以『資料分析』之「單因子變異數分析」來進行檢定然後,以『資料分析』之「單因子變異數分析」來進行檢定

  32. 其檢定結果為:

  33. 由於本例之虛無假設及對立假設為: H0:μ1=μ2=…=μk(每組之均數相等) H1:至少有兩個平均數不相等 α=0.05 依此結果:F=2.9767,d.f.=3,115,P-值=0.0345<α=0.05,故大學生對『附屬功能多』評價項目的注重程度,將隨其擁有手機時間長短而存有顯著差異。擁有手機時間一年~一年半者的注重程度(2.79),低於其他各組(3.45以上)。

  34. 馬上練習 • 依範例Ch12.xlsx『擁有手機時間長短X雙頻手機屬性』工作表內容將其資料整理成:

  35. 然後,以『資料分析』之「單因子變異數分析」來進行檢定大學生對『雙頻手機』評價項目的注重程度,是否隨其擁有手機時間長短而存有顯著差異?然後,以『資料分析』之「單因子變異數分析」來進行檢定大學生對『雙頻手機』評價項目的注重程度,是否隨其擁有手機時間長短而存有顯著差異? 依此結果:F=2.747,d.f.=3,115,P-值=0.046<α=0.05,故大學生對『雙頻手機』評價項目的注重程度,將隨其擁有手機時間長短而存有顯著差異。擁有手機時間一年半以上者的注重程度(4.2),高於其他各組。

  36. 於報告上量表檢定的寫法-多組 • 通常,我們問卷上的評價量表,絕不會是少數的幾個評價項目而已。以『資料分析』之「單因子變異數分析」來進行檢定,也是得一個一個進行檢定,其過程相當辛苦。這也是沒辦法的事,主要是Excel並不是專門的統計軟體,能做到這樣也算是不錯的了。 • 最後,將其彙總成下表:(詳範例Ch12.xlsx『手機屬性-ANOVA』工作表)

  37. 檢定結果顯著者,於其P值後加註"*"(表其<α=0.05),並於報告中對其詳將解釋;檢定結果不顯著者,則僅解釋其重要程度之排序即可。如:檢定結果顯著者,於其P值後加註"*"(表其<α=0.05),並於報告中對其詳將解釋;檢定結果不顯著者,則僅解釋其重要程度之排序即可。如: • 根據調查解果,受訪者較注重之手機屬性,依序為:『收訊狀況佳』、『電磁波的傷害』、『待機時間長』、『大小適中』與『重量輕巧』。 • 經逐一以F檢定,以擁有手機時間長短分組,對其注重程度進行檢定,發現有『附屬功能多』與『雙頻手機』等屬性之注重程度會隨擁有手機時間長短不同,而有顯著差異(P<α=0.05)。這些項目,均是『一年~一年半』組的著重程度較低,可能是剛開始有手機者,會較注重這些項目,隨時間增長,慢慢地發現其實這些項目也沒多大重要性;至於,『一年半以上』者,可能或真正發現沒這些功能的不便性,或許也開始考慮要換手機,故其注重程度又明顯的高於其他各組。

  38. 第十二章 結束謝謝!

More Related