Document de l'Université sur la méthodologie de la recherche et la statistique. Le Pdf explore la présentation et le résumé des données, la symétrie et l'asymétrie des distributions, ainsi que les types d'études, pour les mathématiques au niveau universitaire.
See more18 Pages


Unlock the full PDF for free
Sign up to get full access to the document and start transforming it with AI.
La symétrie ou l'asymétrie des observations d'une variable donnée a une grande importance dans l'évaluation ultérieure des tests statistiques qui seront appropié.
Si les observations d'une variable se produisent seulement dans une direction donnée, par exemple, quelques valeurs basses ou bien des valeurs élevées, la distribution sera une distribution asymétrique.
Si les valeurs plus insolites sont à gauche (comme dans l'image ci-dessous), la distribution est dite asymétrique négative ( la moyenne et la médiane sont à la droite la mode).
Si les valeurs plus insolites sont à droite (comme dans l'image ci-dessous), la distribution est dite asymétrique positive ( la moyenne et la médiane sont à la gauche la mode)
(* N'arrive pas toujours! Voir par exemple: http://www.amstat.org/publications/jse/v13n2/vonhippel.html http://www.amstat.org/publications/jse/v19n2/doane.pdf )
a) 5, 10, 14, 15, 16, 20, 25 la distribution est symétrique, la moyenne et la médiane sont les mêmes (15) b) 5, 10, 10, 15, 15, 15, 20, 20, 40 la distribution est asymétrique positive, la moyenne est supérieur à la médiane
c) -30, 10, 10, 15, 15, 15, 20, 20, 25 la distribution est asymétrique négative, la moyenne est inférieure à la médiane
Il ya certaines mesures mathématiques habituels qui sont susceptibles d'être utiles et visent à traduire le degré de symétrie d'une distribution (les paragraphes précédents) ou comment ses valeurs sont distribués, par exemple si vous avez un pic, ou si d'autre part il est plus "aplatie". Leurs mathématiques de similitude avec les quantités que nous avons examinés dans la dernière classe (moyenne, variance) justifie leur introduction à ce stade.
La variance implique la somme des écarts au carré Σ (x-x)2 (n-1) s'= et pour cette raison est parfois appelée la deuxième moment central m2.
Peut être défini moments centrés d'ordre supérieur, à savoir, E(x-x)3 n E (x-x) 4 E (x-x) 2 n .Il est possible de travailler avec ces nouveaux montants afin m3= e m4= d'éliminer rapidement les autres propriétés sur la façon dont les données sont distribuées.
Calculez le skewness de les données suivantes en utilisant le SPSS a) 5, 10, 10, 15, 15, 15, 20, 20, 40 (skew=1.7) b) -30, 10, 10, 15, 15, 15, 20, 20, 25 (skew =- 2.5).
Dans SPSS choix, Analyze -> Descriptive Statistics -> Frequencies option Statistics choix Skewness
La distribution normale (que faire d'une vaste consultation ultérieure) à une coefficient d'aplatissement de 3, et par conséquent, si une distribution a distribué plus de valeurs que la distribution normale le coefficient d'aplatissement est inférieur à 3, sinon il sera plus de 3. Habituellement, le montant est calculé soustraits de 3 dans le logiciel d'analyse statistique. Dans ce cas, si la valeur de l'aplatissement est égale à zéro la distribution est mesokurtic. Si elle est supérieure à zéro, leptokurtique et inférieure à 0, platicurtique.
( ** Par souci de simplicité, les formules prévues notamment pour les troisième et quatrième moments sont valides uniquement pour les très grands échantillons, qui sont de bonnes estimations des valeurs réelles dans la population. Les formules utilisées par les packages statistiques tels que SPSS sont plus complexe-voir exercices de cours pratiques).
Dans l'image suivante les couleurs ci-dessous le noir représentent les distributions platicurtiques et ci- dessus leptokurtiques.
0.8 D, 3 S, 2 L, 1.2 0.7 N, 0 C, -0.59376 W, -1 U, -1.2 0.6 0.5 0.4 0.3 0.2 0.1 0 - 5 - 4 - 3 -2 - 1 0 1 2 3 4 5
Référence: http://upload.wikimedia.org/wikipedia/commons/e/e6/Standard_symmetric_pdfs.png
Remarque: les valeurs du coefficient d'asymétrie ou aplatissement doivent être évaluées en ce qui concerne la signification statistique afin de tirer des conclusions valides. Les tests statistiques sont soumises à être abordées plus tard.
Calculer le coefficient d'aplatissement des données suivantes en utilisant le SPSS a) 5, 10, 10, 15, 15, 15, 20, 20, 20, 20, 25, 25, 25, 30, 30, 35 (-0.46, i.e., valeurs plus dispersés que dans une distribution normale, distribution d'échantillonnage plus "aplatie") b) 5, 10, 10, 10, 15, 15, 15, 20, 20, 20, 25, 25, 25, 30, 30, 30, 35 (distribution plus plate que le précédent, le coefficient d'aplatissement est plus négatif, -0.99)
La classification d'une étude des types ci-dessus n'est pas toujours immédiat et facile à faire. Toutefois, cette classification est importante car, en plus de guider l'enquêteur dans la phase de conception d'une étude de recherche et de comprendre ce qu'il faut faire et les précautions respectives, seront également aider à determiner le type d'analyse statistique à faire.
Les études descriptifs / groupes de patients ou de séries de cas pas impliquent généralement des groupes de contrôle, à savoir les individus qui ont pas la maladie ou condition à laquelle effectuer une comparaison. Non pas généralement une hypothèse de recherche à tester et ne sont pas prévues études. Sont destinés à décrire les caractéristiques intéressantes observées dans certains groupes de patients, dans de courtes périodes de temps.
Ces études sont rapides à réaliser et peuvent être utiles pour obtenir les directions pour servir de point de départ à une étude plus approfondie. Cependant, ils sont sensibles à de nombreux biais dans la sélection de l'échantillon ou les caractéristiques observées.
. Morbidity and Mortality Weekly Report, Centers for Disease Control and Prevention, "Pneumocystis pneumonia - Los Angeles", 5 Junho 1981 (a "descoberta" do HIV). Référence: http://www.cdc.gov/mmwr/preview/mmwrhtml/june_5.htm, Gottlieb et al
Une étude de contrôle de cas ou cas-témoins, vise répondre à la question "Qu'est-il arrivé?".
Dans ce type d'étude les cas sont comparées à des contrôles de manière rétrospective. Les cas sont des personnes sélectionnées en fonction d'une maladie ou d'un résultat particulier, les contrôles sont des personnes sans la maladie ou le résultat. Le passé de cas et les témoins (contrôles) est analysée au détail dans une tentative d'identifier la présence de caractéristiques dans les cas qui ont influencé l'apparition de la maladie ou de résultat qui ne sont pas présents de manière importante dans l' historique du contrôles. Dans le cas des maladies infectieuses sera cherché à déterminer si les cas ont été exposés à un agent infectieux que les contrôles n'étaient pas.
Les enquêteurs utilisant d'habitude d'appariement dans ce type d'études, pour associer des contrôles avec les cas afin qu'ils aient la même âge, le sexe, l'origine ethnique, etc., En particulier quand ont considére qui peuvent confondre les résultats.
Facteurs de risque/ exposition Cas-contrôle + Cas + - - Contrôles > temps Début de l'étude Direction de la question: "Ce qui s'est passé ?"
Références: Sur la base de la figure 2-1, BCB4. Le bleu indique des sujets exposés. Le signe + indique les sujets positifs / maladie / etc.
Prenons un exemple hypothétique dans laquelle il explore les facteurs de risque de développer un cancer de la tête et du cou. Nous sommes allés par quatre phases:
1) Seléction des cas 200 patients arrivent à l'hôpital et sont diagnostiqués avec cancer de la tête et du cou avec critères cliniques bien dèfini (alors que l'étude peut être reproduit par d'autres investigateurs)
2) Seléction des contrôles 200 patients en jumelant avec des pairs du même sexe et de l'âge,à partir de la même région de patients.
3) La mesure du facteur de risque Supposons que les facteurs de risque à analysé sont: - nombre moyen de cigarettes fumées par jour pendant les 10 dernières années - la concentration de mercure dans le corpe - la consommation de boissons gazeuses et des concentrations élevées de sucre - présence d'un virus spécifique peut être faites interviews et des enquêtes, analyse des registres hospitaliers, l'analyse des registres cliniques, etc. pour évaluer ces facteurs de risque. Le manque de standardisation de cette information, déffaillances de la mémoire d'intervenants, etc. peut limiter le succès des études cas-témoins
4) L'analyse de l'association Si un facteur de risque important est par exemple le vírus, et cela est associée au développement du cancer de la tête et du cou, puis nous aurons une plus grande fraction de personnes dans les cas avec exposition au vírus que dans les contrôles. Si, d'autre part, le facteur de risque n'est pas du tout lié au développement de ce cancer, la fraction de personnes exposées au vírus sera similaire dans les deux groupes.
Pas de mesures mathématiques seront adressées à quantifier mathématiquement le risque en cas des l'études cas-témoins.
"Obesity and the risk of myocardial infarction in 27,000 participants from 52 countries: a case-control study" Yusuf S, Hawken S, Ounpuu S, et al. (November 2005), Lancet 366 (9497): 1640-9. doi:10.1016/S0140-6736(05)67663-5. PMID 16271645. En comparant l'indice de masse corporelle à raison "waist-to-hip" en termes d'association avecl'infarctus du myocarde?