480 likes | 754 Views
L’Analisi Fattoriale (PCA) con SPSS. Cristina Zogmaister. Aprire lib/psico/corsi/zogmaister Trascinare SECONDA LEZIONE nel vostro spazio Lanciare SPSS PASW 18 Aprire dal vostro spazio il file customer_satisfaction.sav. L’Analisi Fattoriale è un processo iterativo. Passi preliminari
E N D
L’Analisi Fattoriale (PCA) con SPSS Cristina Zogmaister
Aprire lib/psico/corsi/zogmaister • Trascinare SECONDA LEZIONE nel vostro spazio • Lanciare SPSS PASW 18 • Aprire dal vostro spazio il file customer_satisfaction.sav
L’Analisi Fattoriale è un processo iterativo Passi preliminari • Selezionare e misurare un insieme di variabili • verificare l’adeguatezza delle variabili – es. normalità delle distribuzioni, presenza di outlier, linearità delle relazioni, rapporto tra nr. di variabili e nr. di fattori attesi, rapporto tra nr. di variabili e nr. di soggetti.
L’Analisi Fattoriale è un processo iterativo Analisi fattoriale (processo iterativo) • Eseguire una prima analisi fattoriale • Determinare il numero di fattori • Eseguire la rotazione • prima obliqua, • poi eventualmente ortogonale • Interpretare i risultati e dare un nome ai fattori • Il criterio che guida l’AF è l’interpretabilità • Una buona AF ‘ha senso’, una cattiva AF ‘non ha senso’
L’Analisi Fattoriale è un processo iterativo Passi successivi: • verificare la struttura fattoriale (replicabilità), • stabilire la validità di costrutto dei fattori (correlazioni con altre variabili; effetto delle manipolazioni sui punteggi fattoriali)
File dati: customer_satisfaction.sav • Intervista a 200 clienti di un ristorante • Obiettivo: capire quali sono gli aspetti che determinano il livello di soddisfazione nei confronti del ristorante • Ipotesi di partenza: 4 aspetti • Qualità del cibo • Qualità del servizio (cortesia del personale) • Ambiente • Prezzo
Il questionario • 12 domande relative ai quattro aspetti ipotizzati alla base della soddisfazione dei clienti (x1 – x12) • Qualità del cibo • Qualità del servizio (cortesia del personale) • Ambiente • Prezzo • 3 domande sulla soddisfazione (d1 – d3) • 3 domande sociodemografiche
E’ possibile riassumere le risposte relative alla soddisfazione nelle 4 dimensioni ipotizzate? • Sono rispettati i prerequisiti per un’analisi fattoriale? • Ampiezza del campione • idealmente 300 casi o più, ma dipende da numero di fattori, forza delle relazioni tra le variabili • Adeguato numero di variabili • Almeno 3 per ogni fattore (meglio di più) • Ci sono outlier univariati (e multivariati)? • Le variabili sono distribuite normalmente? • Se le variabili non sono normali, la soluzione è meno chiara (e non si possono applicare test statistici che implicano la normalità) • Le relazioni tra le coppie di variabili sono lineari? • La matrice è fattorializzabile? • correlazioni bivariate sufficientemente elevate (>|.30|) • test di Bartlett (troppo sensibile)
L’analisi fattoriale • Analizza • Riduzione dimensione • Fattoriale
Scegliamo le variabili su cui vogliamo operare la PCA (x1 – x12)
Indicazioni di base • Chiediamo la matrice delle correlazioni • Metodo di estrazione: PCA • Numero di fattori (per il momento non lo conosciamo) • Scree plot
Default: PCA Default: criterio mineigen
Esaminiamo l’output • Matrice di correlazioni iniziali: diversi r>|.30|
Comunalità • È la somma dei quadrati delle correlazioni della variabile con i fattori. Indica quanta della varianza della variabile è spiegata dai fattori
Varianza totale spiegata 3.159 / 12 = .26325 = 25% La varianza totale spiegata dai fattori (prima della rotazione) Mineigen
Scree plot Sia lo scree plot, sia il criterio mineigen suggeriscono la presenza di 4 componenti
Matrice delle componenti Matrice di correlazione tra le componenti e le variabili. Tutti e quattro i fattori sono correlati in maniera sostanziale (r>|.32|) con molte variabili e le variabili sono correlate con più fattori. La soluzione non è chiara (perché non è stata fatta la rotazione)
Eseguiamo la rotazione • Ortogonale o obliqua? • Prima obliqua, se non ci sono correlazioni sostanziali passiamo a una rotazione ortogonale.
Matrice di correlazione tra le componenti (in fondo all’output)
Rotazione ortogonale (varimax) • Varianza totale spiegata: una nuova parte della tabella indica la varianza spiegata dai fattori dopo la rotazione La varianza totale non cambia rispetto a prima della rotazione, ma è suddivisa in maniera diversa tra i fattori
Matrice delle componenti ruotata Più chiara!!! Ogni variabile ha saturazioni importanti su una sola componente.
Interpretiamo le componenti 1 = ? 2 = ? 3 = ? 4 = ?
Report dell’analisi • E’ stata condotta l’analisi delle componenti principali. Un primo esame dello screeplot suggeriva la presenza di 4 componenti. Anche il criterio Mineigen suggeriva una soluzione a 4 componenti. Questa numerosità corrispondeva a quella che era stata precedentemente ipotizzata in fase di costruzione del questionario. • Le analisi successive hanno confermato la presenza di 4 componenti, non correlate. Con una rotazione obliqua (criterio oblimin) emergeva una correlazione massima tra le componenti di r = |.167|, perciò è stata condotta una rotazione ortogonale (criterio varimax). • La soluzione a quattro componenti spiega il 75% della varianza osservata nelle variabili. • Le quattro componenti sono interpretate come: qualità del cibo, qualità del servizio, ambiente, prezzo. • La matrice delle componenti ruotate è presentata in Tab. 1.
Domanda n. 2: Le domande sulla soddisfazione (d1, d2, d3) possono essere riassunte in un unico punteggio? (la scala è monofattoriale?) • Svolgete la PCA e provate a dare una risposta.
Risposta • La PCA ha confermato la presenza di un unico fattore sottostante alle domande relative alla soddisfazione. I tre item sono altamente correlati tra di loro (correlazione minima r = .81) e un’unica componente spiega il 90 % della varianza.
Domanda n. 3Legame tra le 4 componenti e la soddisfazione • Calcolo dei punteggi nei fattori • Punteggio fattoriale • Punteggio sommato
Calcolo dei punteggi fattoriali • Conduciamo l’analisi fattoriale • Estrazione: PCA • Nr. componenti: 4 • Rotazione: Varimax • Calcolo dei punteggi fattoriali
Calcolare il punteggio fattoriale per la soddisfazione • Correlazione tra i quattro fattori di valutazione e il fattore di soddisfazione
Calcoliamo i punteggi sommati s.cibo = x1 + x4 + x9 s.personale = x6 + x11 + x12. s.ambiente = x2 + x7 + x8. s.prezzo = x3 + x 5 + x10. s.Sodd = d1 + d2 + d3.
Correlazioni • Tra punteggi fattoriali e punteggi sommati: sono molto alte • Tra punteggi sommati e soddisfazione: rivelano gli stessi legami già visti in precedenza.
Ora da soli: file personalità.sav • A 459 persone è stato somministrato un questionario di self-report di personalità • Dovevano valutare quanto si sentivano descritti da ciascuno di 44 diversi aggettivi • Ipotesi: 5 componenti (big five) • Energia • Amicalità • Coscienziosità • Stabilità emotiva • Apertura mentale Quante sono le componenti? Sono ortogonali o oblique? Corrispondono alle 5 componenti ipotizzate?
Quante sono le componenti? • Mineigen: massimo 10 • Scree plot: 5 • Attesa teorica: 5 • Partiamo da 5 componenti, vediamo se la soluzione è interpretabile
Da soli: BimbiCompetenze.sav • 177 bambini della scuola per l’infanzia. • Batteria di 10 test • Questi punteggi possono essere ridotti a un numero inferiore di dimensioni? • Quante? • Quali? • Sono correlate tra di loro? • Quale percentuale di varianza osservata viene spiegata complessivamente, quale percentuale di varianza viene spiegata da ciascuna dimensione? • Ci sono variabili pure? Quali? • Suggerimenti per migliorare la batteria di test?