1 / 95

Modèles statistiques en sciences humaines et sociales

Modèles statistiques en sciences humaines et sociales. 1-Introduction sur les modèles statistiques. 2-Régressions linéaires simples ou bi variés. 3-Régressions linéaires multiples. 4 -Régressions non linéaires. Plan de l’exposé. 1-INTRODUCTION.

jed
Download Presentation

Modèles statistiques en sciences humaines et sociales

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Modèles statistiques en sciences humaines et sociales

  2. 1-Introduction sur les modèles statistiques. 2-Régressions linéaires simples ou bi variés. 3-Régressions linéaires multiples. 4-Régressions non linéaires. Plan de l’exposé

  3. 1-INTRODUCTION

  4. Statistique descriptive: Tableaux, graphiques, indicateurs mathématiques,… (AMETICE-TCPRUE11) • Statistique confirmatoire: évalue la probabilité pour qu’un résultat empirique obtenu soit du au hasard (Student, Khi2, tests de corrélation, ANOVA,…) (AMETICE-TCPRUE21) • Statistique exploratoire: Analyse Composante Principales, Analyse Factorielle des Correspondances,… • Modélisation Statistique: objet de la présentation… Les grands domaines des statistiques

  5. On étudie un phénomène dont on suppose qu’il dépend de n variables. • On cherche à exprimer une variable Y (variable expliquée) en fonction des n-1 autres variables Xi (variables explicatives). • On part des données empiriques prélevées surun échantillon pour établir cette relation. • On établit les lois qui permettent d’étendre le résultat à toute la population. C’est quoi un modèle Statistique?

  6. Modèles en sciences exactes

  7. Modèles en sciences humaines et sociales

  8. Modèles en sciences humaines et sociales

  9. Quand on veut « modéliser » un phénomène en SHS il faut commencer par « retenir » les variables qui agissent sur le phénomène. • On dira qu’il y a des variables « fortes » qui doivent obligatoirement être prises en compte dans le modèle et des variables « faibles » souvent non identifiées qui agiront à travers le terme aléatoire. REMARQUE: Variables « fortes » variables « faibles »

  10. Par exemple une expérimentation conduit à des prélèvements 2D (xi, yi) auprès de n individus. • A chaque individu est associé en point (xi, yi) dans le plan. On obtient un nuage de points. • Si ce nuage s’organise autour d’une courbe… Le nuage de points empirique 2D

  11. … vouloir modéliser le phénomène consiste d’abord à déterminer l’équation de la courbe qui représente « au mieux » le nuage de points empiriques. • Cette courbe est une « courbe  moyenne » qui reflète en moyenne le lien entre les deux variables pour les points de l’échantillon. • Il arrive que le nuage de point soit très dispersé. Dans ce cas il n’y a pas de courbe moyenne représentative et donc pas de lien entre les variables étudiées. Nuage de point-Courbe de régression

  12. Un exemple

  13. Régressions multiples

  14. Régression Linéaire

  15. 1-Introduction sur les modèles statistiques. 2-Régressions linéaires simples ou bi variés. 3-Régressions linéaires multiples. 4-Régressions non linéaires. Plan de l’exposé

  16. 2- REGRESSION LINEAIRE SIMPLE: 2-1 Problème posé dans un échantillon: 2-1-1 Estimation des paramètres de la droite de régression. 2-1-2 Qualité de la représentation. 2-2 Inférence de la régression d’échantillon sur l’ensemble de la population. Plan de la partie 2.

  17. Prélèvement et nuage de point

  18. Principe: Méthode MCO

  19. Expression des estimateurs

  20. On cherche la relation qui existe, dans une région donnée, entre le prix des terrains (PRIX=Y) et la superficie des terrains (SUPERF=X) Exemple: fil rouge…

  21. Exemple: Fil rouge

  22. Les points du nuages ne sont généralement pas sur la droite. On définit le résidu empirique. Résidus empiriques ei

  23. Les résidus

  24. Somme des carrés des résidus

  25. 2- REGRESSION LINEAIRE SIMPLE: 2-1 Problème posé dans un échantillon: 2-1-1 Estimation des paramètres de la droite de régression. 2-1-2 Qualité de la représentation. 2-2 Inférence de la régression d’échantillon sur l’ensemble de la population. Plan de la partie 2.

  26. Quel que soit le nuage de point les MCO donnent toujours une solution. - Il faut un ou des indicateurs de qualité de la représentation… Qualité de la représentation

  27. Pour s’assurer de la qualité de la représentation il faut répondre à deux questions: • Le lien entre les variables est il « avéré »? En d’autres termes: la relation existe-t-elle vraiment? • Quel est le pourcentage d’explication de l’action de la variable explicative sur l’évolution de la variable expliquée? Qualité de la représentation

  28. Remarque préalable: Une droite horizontale exprime l’absence totale de lien entre les deux variables prises en compte. Y Y=0X+b X Quelque soit X, Y ne change pas Le lien entre les variable est il avéré.

  29. Le lien entre les variable est il avéré?

  30. Le lien entre les variable est il avéré?

  31. Explicativité du modèle- Coefficient de détermination

  32. Explicativité du modèle- Coefficient de détermination

  33. Remarque à partir de l’analyse de la variance.

  34. La superficie explique 73,53% de la variance du prix des terrains dans la région étudiée…Plus du quart du prix s’explique autrement. (Calcul EXCEL) Exemple: Fil rouge

  35. Représentation plane d’un nuage de points et équation d’une droite dans un plan. • Notion de moyenne, variance, covariance et corrélation pour les données expérimentales prélevées sur un échantillon. • Utilisation d’EXCEL… • C’est le contenu de l’UE11 du M1 recherche Que faut il maitriser pour en arriver la?

  36. 2- REGRESSION LINEAIRE SIMPLE: 2-1 Problème posé dans un échantillon aléatoire. 2-2 Inférence de la régression d’échantillon sur l’ensemble de la population. 2-1 Position du problème- échantillonnage aléatoire. 2-2 Estimation des paramètres de régression pour la population. 2-3 Intervalle de confiance. Plan de la partie 2.

  37. Nous avons travaillé sur un échantillon pris au hasard. • Si l’on avait choisit un autre échantillon les paramètres obtenus (a, b, SCR) auraient été différents. • On doit admettre que le «l’échantillonnage» a influencé le résultat. • On doit introduire la notion de « statistique d’échantillonnage » due au hasard de l’échantillonnage. Position du problème (1)

  38. Statistique d’échantillonnage.

  39. 2- REGRESSION LINEAIRE SIMPLE: 2-1 Problème posé dans un échantillon aléatoire 2-2 Inférence de la régression d’échantillon sur l’ensemble de la population. 2-1 Position du problème- échantillonnage aléatoire. 2-2 Estimation des paramètres de régression pour la population. 2-3 Intervalle de confiance. Plan de la partie 2.

  40. ON A a, b ,SCR dans l’échantillon…on met quoi si l’on veut étendre à toute la population…. • Quel est le prix à payer

  41. Régression dans la population

  42. Valeurs de Y pour un x donné pour des échantillons différents • Si l’estimation est sans biais la valeur tourne autour de la valeur cible • Si l’estimation est biaisée la valeur tourne autour d’une autre valeur x x x x x x x x x x x x x Estimation sans biais…biaisée

  43. Hypothèses sur la distribution des erreurs aléatoires

  44. Conséquences des hypothèses H1, H2, H3 H1: Les distributions sont centrées H2: Les distribution ont même variance H3: Les distributions sont indépendantes

  45. Des compléments de calcul

  46. 2- REGRESSION LINEAIRE SIMPLE: 2-1 Problème posé dans un échantillon aléatoire 2-2 Inférence de la régression d’échantillon sur l’ensemble de la population. 2-1 Position du problème- échantillonnage aléatoire. 2-2 Estimation des paramètres de régression pour la population. 2-3 Intervalle de confiance. Plan de la partie 2.

More Related