1 / 20

ANALIZA SKUPINA

ANALIZA SKUPINA. A naliza skupina. Za razliku od diskriminacione analize ovde broj grupa i njihove karakteristike nisu unapred poznate. Cilj je otkriti prirodne grupe medju jedinicama posm atranja u odnosu na posmatrane karakteristike (npr. dohodak i zaduženost).

Download Presentation

ANALIZA SKUPINA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ANALIZA SKUPINA

  2. Analiza skupina • Za razliku od diskriminacione analize ovde broj grupa i njihove karakteristike nisu unapred poznate. • Cilj je otkriti prirodne grupe medju jedinicama posmatranja u odnosu na posmatrane karakteristike (npr. dohodak i zaduženost)

  3. Prema čemu se grupišu opservacije u skupine? • Prema nekoj meri sličnosti. Najsličnije opservacije treba da budu u istoj skupini • Koje mere sličnosti se koriste u analizi skupina? • Euklidsko odstojanje – mera različitosti • Koeficijenti korelacije – mera bliskosti • Koeficijenti povezanosti – mera bliskosti (za binarne atribute)

  4. Euklidsko odstojanje – mera različitosti Koji proizvodi su najsličniji? AB Koji proizvodi su najrazličitiji?AC

  5. Koeficijent povezanosti – mera bliskosti • Izračunati koeficijent sličnosti između televizora marke Samsung i Neo (1-poseduje karakteristiku, 0-ne poseduje datu karakteristiku) a-broj karakteristika koje poseduju oba brenda b-broj karakteristika koje poseduje samo prvi brend c-broj karakteristika koje poseduje samo drugi d-broj karakteristika koje ne poseduje ni jedan brend Sličnost SAMSUNG-NEO= =(a+d)/(a+b+c+d)=2/4=0.5

  6. Koeficijent korelacije – mera sličnosti • Posmatramo dinamiku gledanosti po nedeljama tri televizijske stanice (PINK, FOX, RTS)

  7. Ko ima najsličniju dinamiku gledanosti? PINKi FOX

  8. Analiza skupina • Koje procedure grupisanja postoje? • Hijerarhijska– nema unapred definisan broj skupina. Polazi se od toga da je svaka jedinica zasebna skupina pa se na osnovu mera sličnosti povezuju u sve manji broj skupina dok ne postanu jedna (može i obratno) • Nehijerarhijska – unapred definisan broj skupina. Preporučuje se primena obe procedure prvo hijerarhijske pa nehijerarhijske.

  9. Analiza skupina • Kod hijerarhijske analize u svakoj iteraciji spajaju se najsličnije grupe • Kako merimo udaljenost (sličnost) izmedju GRUPA? • Jednostruko povezivanje • Potpuno povezivanje • Prosečno povezivanje • Metod centroida • Vordov metod

  10. Jednostruko povezivanje • Metod najbližih suseda (euklidsko-mera sličnosti) Koja je udaljenost ove dve skupine po metodu najbližij suseda? Ono je jednako euklidskom odstojanju proizvodaE i C

  11. Potpuno povezivanje • Naziva se još i metod najudaljenijih suseda

  12. Metod prosečnog povezivanja • Uzima se prosek distanci jedinica iz obe skupine. Primer: neka jednu skupinu čine jedinice AiB, a drugu skupinu neka čini samo C • Udaljenost prema ovom metodu (7,07+6,4)/2=6,735

  13. (AC + BC)/2 = 6,735

  14. Analiza skupina – hijerarhijski metod

  15. Analiza skupina • Uzimajući u obzir sledeće mere bliskosti odrediti koji proizvodi pripadaju kojim skupinama po metodu najbližih suseda koristeći DENDROGRAM • AB i D jedna skupina • EC druga skupina

  16. Analiza skupina • Uzimajući u obzir sledeće mere različitosti odrediti koji proizvodi pripadaju kojim skupinama po metodu najbližih suseda koristeći DENDROGRAM • B, C i D jedna skupina • E i A druga skupina

  17. Zadatak • Izračunati koeficijent sličnosti između televizora marke Samsung i Neo (1-postoji karakteristika, 0-ne postoji karakteristika) A-broj karakteristika koje poseduju oba brenda B-broj karakteristika koje poseduje samo Samsung C-broj karakteristika koje poseduje samo Neo D-broj karakteristika koje ne poseduje ni jedan brend s=(a+d)/(a+b+c+d) =4/8=0.5

More Related