770 likes | 1.76k Views
REGRESI LOGISTIK BINER. ENI SUMARMININGSIH. M odel regresi logistik adalah salah satu model yang digunakan untuk mencari hubungan antara peubah respon kategori dengan satu atau lebih peubah penjelas yang kontinyu ataupun kategori .
E N D
REGRESI LOGISTIK BINER ENI SUMARMININGSIH
Model regresilogistikadalahsalahsatu model yang digunakanuntukmencarihubunganantarapeubahresponkategoridengansatuataulebihpeubahpenjelas yang kontinyuataupunkategori. • Peubahrespon yang terdiriatasduakategoriyaitu “ya (sukses)” dan “tidak (gagal)”, dandinotasikandengan 1 = “sukses” dan 0 = “gagal”, makaakanmengikutisebaran Bernoulli.
Jika pi menyatakan peluang suatu individu ke-i memiliki nilai Y = 1, maka model regresi logistik dengank buahvariabelbebasdapatdituliskansebagai
Interpretasi: Peluangkejadiantertentudaripeubahresponskategori(misalnya membeli) jika nilaipeubahpejelasdiketahui • Koefisienselanjutnyadidugamenggunakanmetodemaximum likelihood. • Secarasederhanadapatdisebutkanbahwametodeiniberusahamencarinilaikoefisien yang memaksimumkanfungsi likelihood.
Dengannilai Y yang bersifatbiner, kitadapatmenggunakan Bernoulli sebagaisebaranvariabel Y sehinggafungsilikelihood akanberbentuk
Nilaimaksimumdarifungsikemungkinandapatdicaridenganmelogaritmakankeduaruas. Maksimumdarifungsi𝐿(𝛽𝑗) disebutsebagai log likelihood.
Karenaβj yang akandidugabersifatnonlinier, makapenyelesaianpersamaandapatmenggunakanmetodeiterasi Gauss Newton atauMetode Marquardt.
PengujianTerhadapPendugaan Parameter • Pengujianpendugaan parameter () secaraparsial. Untukmemeriksaperanankoefisienregresidarimasing-masingvariabelprediktorsecaraindividudalammodel. Hipotesis yang digunakanadalah :
Statistikuji yang digunakanadalahstatistikuji Wald yang dapatditulis:
Untuksampelbesarstatistikuji Wald mengikutisebaran normal (Z)
b. Pengujianpendugaanparameter () secarasimultan Untukmemeriksapengaruhkoefisienregresidarivariabelprediktorsecarabersama-sama. Hipotesisnyaadalah:
Uji yang digunakanadalahujinisbahkemungkinan(Likelihood Ratio Test) yaitu: dengan: L0= nilai log likelihood model regresilogistiktanpavariabelprediktor Lp = nilai log likelihood model regresilogistikdenganvariabelprediktor Likelihood ratio test berdistribusi
Interpretasiuntukvariabelindependenpolikotomus Misalkanpeubahbebasmemilikikategorilebihdari 2. Contoh: Penelitiandilakukanuntukmenelitiadakahpengaruhras (White, Black, Hispanic, Other) terhadapterjadinya CHD (Coronary Hearth Disease)
KarenaVariabelbebasmemilikikategorilebihdari 2 makakitagunakan design variabelsepertipadatabelberikut:
Hasilestimasiadalahsebagaiberikut: Sehinggadidapatkan
InterpretasiuntukvariabelIndependenKontinu • Asumsikan logit= g(x) adalah linier. • Persamaanlogitadalah • 1merupakanperubahan log odds (logit) untuksetiappeningkatansebesar 1 satuan x • 1 =g(x+1) – g(x) = untuk setiapnilai x.
Secaraumumjika x berubahsebesar c satuanmakalogitakanberubahsebesar c1, • Didapatkandari = c1 • Sehingga OR(c)=OR(x+c,x) = exp(c1)
Contoh : padapenelitianpengaruhusiaterhadapterjadinya CHD didapatkanmodel Odd Ratio dugauntukkenaikanusia 10 tahunadalah Artinyasetiapkenaikanusiasebesar 10 tahunmakaresikoterjadinya CHD meningkatsebesar 3.03 kali
Multivariable Model Suatu penelitiandilakukanuntukmengetahuipengaruhusia(AGE), jeniskelamindan level cathecolamin (CAT) terhadapterjadinyaCHD. Model yang digunakanadalah Dimana X1 = usia X2 = jeniskelamin (0 = perempuan, 1=laki – laki) X3 = level cathecolamin ( 0= rendah, 1=tinggi)
Odd ratio untukvariabel 0-1 adalahdenganasumsivariabel yang lain tetap. Sedangkanuntukvariabelkontinu, Odd ratio didapatkandari Secaraumumrumusuntuk Odd Ratio adalah
Goodness of fit Misalkan model kitaterdiridari p peubahbebas J adalahbanyaknyanilaipengamatanx yang berbeda. Jikabeberapasubjekmemilikinilaix yang samamaka J < n Notasikanbanyaknyasubjekdengannilaix=xjdenganmj, j = 1, 2, …, J. Maka Yjadalahbanyaknya y=1 diantaramjsubjekdenganx=xj. Sehinggayaitubanyaknyasubjekdengan y=1
Pearson Residual didefinisikansebagai Dan statistik2 Pearson adalah
Deviance Residual didefinisikansebagai Tanda + atau – , samadengantandadari Statistik Deviance adalah Statistik 2dan Deviance menyebar2denganderajatbebas J – (p+1)
Diagnostic Residual Plot Jika model regresilogistikbenar, maka E(Yi) = I Sehingga E(Yi - = E(ei) = 0. Jadijika model benarmaka plot antaradan residual akanmenunjukkanpolagarishorisontaldenganintersepnol
Title TERIMA KASIH