Contenu
Les analyses bivariées et multivariées sont des méthodes statistiques permettant d’étudier les relations entre les échantillons de données. L'analyse bivariée examine deux ensembles de données appariés et étudie s'il existe une relation entre eux. L'analyse multivariée utilise deux variables ou plus et des analyses qui, le cas échéant, sont corrélées à un résultat spécifique. Dans ce dernier cas, l’objectif est de déterminer quelles variables influencent ou causent le résultat.
Analyse bivariée
L'analyse bivariée examine la relation entre deux ensembles de données, avec une paire d'observations tirées d'un échantillon ou d'un individu. Cependant, chaque échantillon est indépendant. Vous analysez les données à l'aide d'outils tels que les tests t et les tests du chi-carré, afin de vérifier si les deux groupes de données sont en corrélation. Si les variables sont quantitatives, vous les représentez généralement sur un diagramme de dispersion. L'analyse bivariée examine également la force de toute corrélation.
Exemples d'analyse bivariée
Une équipe de recherche qui enregistre l'âge du mari et de la femme dans un seul mariage est un exemple d'analyse bivariée. Ces données sont appariées parce que les deux âges sont issus du même mariage, mais sont indépendants car l’âge d’une personne ne provoque pas l’âge des autres. Vous tracez les données pour montrer une corrélation: les maris plus âgés ont des femmes plus âgées. Un deuxième exemple est l'enregistrement des mesures de la force de préhension et de la force des bras. Les données sont appariées parce que les deux mesures proviennent d'une seule personne, mais qu'elles sont indépendantes du fait que différents muscles sont utilisés. Vous tracez les données de nombreuses personnes pour montrer une corrélation: les personnes ayant une force de préhension plus élevée ont une force de bras supérieure.
Analyse multivariée
L'analyse multivariée examine plusieurs variables pour déterminer si une ou plusieurs d'entre elles sont prédictives d'un résultat donné. Les variables prédictives sont des variables indépendantes et le résultat est la variable dépendante. Les variables peuvent être continues, ce qui signifie qu'elles peuvent avoir une plage de valeurs, ou elles peuvent être dichotomiques, ce qui signifie qu'elles représentent la réponse à une question du type oui ou non. L'analyse de régression multiple est la méthode la plus couramment utilisée dans l'analyse multivariée pour rechercher des corrélations entre des ensembles de données. D'autres incluent la régression logistique et l'analyse de variance multivariée.
Exemple d'analyse multivariée
Des chercheurs ont utilisé une analyse multivariée dans une étude de 2009 du Journal of Pediatrics pour déterminer si les événements négatifs de la vie, l'environnement familial, la violence familiale, la violence dans les médias et la dépression sont des facteurs prédictifs de l'agression et de l'intimidation chez les jeunes. Dans ce cas, les événements négatifs de la vie, l'environnement familial, la violence familiale, la violence dans les médias et la dépression étaient les variables indépendantes prédictives, et l'agression et l'intimidation étaient les variables dépendantes du résultat. Plus de 600 sujets, âgés en moyenne de 12 ans, ont été interrogés pour déterminer les variables prédictives de chaque enfant. Une enquête a également déterminé les variables de résultat pour chaque enfant. Des équations de régression multiple et une modélisation d'équations structurelles ont été utilisées pour étudier l'ensemble de données. Les événements négatifs de la vie et la dépression se sont avérés les prédicteurs les plus puissants de l'agressivité des jeunes.