1 / 39

REGRESI LOGISTIK BINER

REGRESI LOGISTIK BINER. ENI SUMARMININGSIH. M odel regresi logistik adalah salah satu model yang digunakan untuk mencari hubungan antara peubah respon kategori dengan satu atau lebih peubah penjelas yang kontinyu ataupun kategori .

moira
Download Presentation

REGRESI LOGISTIK BINER

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. REGRESI LOGISTIK BINER ENI SUMARMININGSIH

  2. Model regresilogistikadalahsalahsatu model yang digunakanuntukmencarihubunganantarapeubahresponkategoridengansatuataulebihpeubahpenjelas yang kontinyuataupunkategori. • Peubahrespon yang terdiriatasduakategoriyaitu “ya (sukses)” dan “tidak (gagal)”, dandinotasikandengan 1 = “sukses” dan 0 = “gagal”, makaakanmengikutisebaran Bernoulli.

  3. Jika pi menyatakan peluang suatu individu ke-i memiliki nilai Y = 1, maka model regresi logistik dengank buahvariabelbebasdapatdituliskansebagai

  4. Interpretasi: Peluangkejadiantertentudaripeubahresponskategori(misalnya membeli) jika nilaipeubahpejelasdiketahui • Koefisienselanjutnyadidugamenggunakanmetodemaximum likelihood. • Secarasederhanadapatdisebutkanbahwametodeiniberusahamencarinilaikoefisien yang memaksimumkanfungsi likelihood.

  5. Dengannilai Y yang bersifatbiner, kitadapatmenggunakan Bernoulli sebagaisebaranvariabel Y sehinggafungsilikelihood akanberbentuk

  6. Nilaimaksimumdarifungsikemungkinandapatdicaridenganmelogaritmakankeduaruas. Maksimumdarifungsi𝐿(𝛽𝑗) disebutsebagai log likelihood.

  7. Karenaβj yang akandidugabersifatnonlinier, makapenyelesaianpersamaandapatmenggunakanmetodeiterasi Gauss Newton atauMetode Marquardt.

  8. PengujianTerhadapPendugaan Parameter • Pengujianpendugaan parameter () secaraparsial. Untukmemeriksaperanankoefisienregresidarimasing-masingvariabelprediktorsecaraindividudalammodel. Hipotesis yang digunakanadalah :

  9. Statistikuji yang digunakanadalahstatistikuji Wald yang dapatditulis:

  10. Untuksampelbesarstatistikuji Wald mengikutisebaran normal (Z)

  11. b. Pengujianpendugaanparameter () secarasimultan Untukmemeriksapengaruhkoefisienregresidarivariabelprediktorsecarabersama-sama. Hipotesisnyaadalah:

  12. Uji yang digunakanadalahujinisbahkemungkinan(Likelihood Ratio Test) yaitu: dengan: L0= nilai log likelihood model regresilogistiktanpavariabelprediktor Lp = nilai log likelihood model regresilogistikdenganvariabelprediktor Likelihood ratio test berdistribusi

  13. Interpretasiuntukvariabelindependenpolikotomus Misalkanpeubahbebasmemilikikategorilebihdari 2. Contoh: Penelitiandilakukanuntukmenelitiadakahpengaruhras (White, Black, Hispanic, Other) terhadapterjadinya CHD (Coronary Hearth Disease)

  14. Data daripenelitianadalahsebagaiberikut:

  15. KarenaVariabelbebasmemilikikategorilebihdari 2 makakitagunakan design variabelsepertipadatabelberikut:

  16. Hasilestimasiadalahsebagaiberikut: Sehinggadidapatkan

  17. InterpretasiuntukvariabelIndependenKontinu • Asumsikan logit= g(x) adalah linier. • Persamaanlogitadalah • 1merupakanperubahan log odds (logit) untuksetiappeningkatansebesar 1 satuan x • 1 =g(x+1) – g(x) = untuk setiapnilai x.

  18. Secaraumumjika x berubahsebesar c satuanmakalogitakanberubahsebesar c1, • Didapatkandari = c1 • Sehingga OR(c)=OR(x+c,x) = exp(c1)

  19. Contoh : padapenelitianpengaruhusiaterhadapterjadinya CHD didapatkanmodel Odd Ratio dugauntukkenaikanusia 10 tahunadalah Artinyasetiapkenaikanusiasebesar 10 tahunmakaresikoterjadinya CHD meningkatsebesar 3.03 kali

  20. Multivariable Model Suatu penelitiandilakukanuntukmengetahuipengaruhusia(AGE), jeniskelamindan level cathecolamin (CAT) terhadapterjadinyaCHD. Model yang digunakanadalah Dimana X1 = usia X2 = jeniskelamin (0 = perempuan, 1=laki – laki) X3 = level cathecolamin ( 0= rendah, 1=tinggi)

  21. Odd ratio untukvariabel 0-1 adalahdenganasumsivariabel yang lain tetap. Sedangkanuntukvariabelkontinu, Odd ratio didapatkandari Secaraumumrumusuntuk Odd Ratio adalah

  22. Model Multivariabeldenganinteraksi

  23. Goodness of fit Misalkan model kitaterdiridari p peubahbebas J adalahbanyaknyanilaipengamatanx yang berbeda. Jikabeberapasubjekmemilikinilaix yang samamaka J < n Notasikanbanyaknyasubjekdengannilaix=xjdenganmj, j = 1, 2, …, J. Maka Yjadalahbanyaknya y=1 diantaramjsubjekdenganx=xj. Sehinggayaitubanyaknyasubjekdengan y=1

  24. Pearson Residual didefinisikansebagai Dan statistik2 Pearson adalah

  25. Deviance Residual didefinisikansebagai Tanda + atau – , samadengantandadari Statistik Deviance adalah Statistik 2dan Deviance menyebar2denganderajatbebas J – (p+1)

  26. Diagnostic Residual Plot Jika model regresilogistikbenar, maka E(Yi) = I Sehingga E(Yi - = E(ei) = 0. Jadijika model benarmaka plot antaradan residual akanmenunjukkanpolagarishorisontaldenganintersepnol

  27. Title TERIMA KASIH

More Related