1 / 15

類別資料分析

類別資料分析. 運用時機 一組比例值的檢定 陽明大學學生近視率 (%) 是否與全台灣的成人有所不同? 兩組比例值的檢定 陽明大學男女生的近視率是否有所不同? 一組的兩次比例值是否有所不同? 老人前後兩次觀察的憂鬱比率是否有所不同? 機率分佈 二項分佈 : binomial distribution. 二項分佈. 一組比例值 個數的平均值與變異數: np; npq 比率的平均值與變異數: p; (p  q)/n 檢定值 兩組比例值:標準差與檢定值. 二項分佈的舉例 1.

wilfred
Download Presentation

類別資料分析

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 類別資料分析 • 運用時機 • 一組比例值的檢定 • 陽明大學學生近視率(%)是否與全台灣的成人有所不同? • 兩組比例值的檢定 • 陽明大學男女生的近視率是否有所不同? • 一組的兩次比例值是否有所不同? • 老人前後兩次觀察的憂鬱比率是否有所不同? • 機率分佈 • 二項分佈: binomial distribution

  2. 二項分佈 • 一組比例值 • 個數的平均值與變異數:np; npq • 比率的平均值與變異數:p; (pq)/n • 檢定值 • 兩組比例值:標準差與檢定值

  3. 二項分佈的舉例 1 • 男女各約一半的人口中,某時期機車肇事死亡共120人中,男性有80人女性有40人,請問機車肇事死亡是否與性別有關? • 都市與山地國中生各100人中,近視比例分別為55與15人,請問都市與山地國中生近視比例差別的95%信賴區間為何?

  4. 二項分佈的舉例 2 • 某區域醫院了配合總額預算新制、保有一定水準的醫療品質與醫院收入,決定每天門診量不超過375人,但開放電話或電腦預約掛號到400號,因為根據以往經驗約有10%的病人掛了號卻不來看診。請問該醫院至少有一位病人掛了號卻看不到病的機率是多少?(假設病人掛號後有的看診機率為二項分布) (A).P(Z>1.96)=2.5% (B).P(Z>2.14)=1.6% (C).P(Z>2.34)=1.0% (D).P(Z>2.58)=0.5% (E).P(Z>2.8)=0.3%

  5. 卡方分佈與兩個類別變項的統計 • 使用時機:兩個類別變項間是否有相關association • 性別與自體免疫疾病的有無、注射流感疫苗與感冒發生的有無、籍貫與投票行為等 • 與比例值的意義相同 • 卡方值

  6. 卡方檢定的舉例 • 卡方分佈表與自由度 • d.f.=(No. of rows -1)*(No. of Columns-1) • 依照自由度查表 • 例題 推翻虛無假說,接受對立假說,吃鴨子與否與患傷寒有關

  7. Yate’s校正與Fisher’s exact test • 卡方值的簡單公式: • Yats’ correction: N/2, 2× 2 table檢定時使用 • Fisher’s exact test • 使用時機 : 某些cell期望值小於5 • 舉例 所以,P=0.238+0.041=0.279>0.05,接受虛無假說

  8. McNemar’s Test • 名稱與使用時機:非獨立樣本比率數的卡方檢定 • 觀念與配對t 檢定完全相同 • 檢定值 • 舉例: 第一次與第二次受訪老人的婚姻狀態是否有不同? 結論:追蹤憂鬱老人的婚姻狀態,發現有明顯不同 結論:追蹤憂鬱老人的婚姻狀態,發現有明顯不同 結論:追蹤憂鬱老人的婚姻狀態,發現有明顯不同

  9. 適合度檢定Goodness-of-fit test • 使用時機 • 如果一個母群體,依某種分類的分布為已知,要了解一個隨機樣本是否由該母群體所抽出的檢定,就應使用適合度檢定。 • 舉例 • 高血壓會者之血型分布與常人是否相同 • 結論:接受虛無假說,高血壓患者的血型分佈與常人並無不同

  10. 波以松分佈:Poisson Test • 二項分布 • 波以松分布 • 自然對數 • 公式證明

  11. 波以松檢定:舉例 • 波以松分布 • 設台灣地區盲腸手術失敗率為0.007,某醫院進行盲腸手術400次沒有一次失敗,該院外科醫療水準是否較全國為優? • 解:設α=0.05,p=0.007, n=400 H0: 該院手術失敗率與全國相同p1= p0 H1: 該院手術失敗率較全國為低p1< p0 • 結論:接受虛無假說,該院並不比一般醫院之外科醫療水準為優

  12. 卡方分佈的濫用與討論 • 任意將等距或等比變項轉化成類別變項 • 男女的體重是否有所差別? • 分組武斷 • 體重:輕中重如何分?(BMI…?) • 自變項與依變項的因果關係 • Z 或 t 檢定:方法本身已隱含有因果關係的假定 • 卡方檢定:沒有因果關係的假設 • 但仍習慣將將「因」變項放在直行,「果」變項放在橫列

  13. 結論 • 比率檢定:Z分佈 • 與平均值檢定的觀念完全相同 • 類別變項的統計:卡方檢定 • 2×2:要做Yate’s correction • Fisher’s exact test: • 某些cell 的期望值小於5時:樣本數太小或機率值 p 太小 • McNemar’s test: 二項類別變項重複測兩次 • Poisson test: • 樣本數n很大且機率值 p很小(通常<0.01),如癌症發生比率

  14. 期中考例題1

  15. 期中考例題2

More Related