Comment interpréter un nuage de points

Posted on
Auteur: Randy Alexander
Date De Création: 2 Avril 2021
Date De Mise À Jour: 18 Novembre 2024
Anonim
Comment interpréter un nuage de points - Science
Comment interpréter un nuage de points - Science

Un nuage de points est un outil de diagnostic important dans l’arsenal d’un statisticien, obtenu en représentant graphiquement deux variables. Il permet au statisticien d’observer les variables et de formuler une hypothèse de travail sur leur relation. Pour cette raison, il est généralement établi avant la réalisation d’une analyse de régression. Le statisticien teste ensuite l'hypothèse à l'aide d'une analyse de régression et détermine le signe et la magnitude précise de la relation. En outre, un nuage de points aide à identifier les valeurs aberrantes - des valeurs anormalement éloignées de la plupart des données de l'échantillon. L'élimination des valeurs aberrantes contribue à améliorer le modèle de régression.


    Vérifiez la relation négative entre les deux variables dans le diagramme de dispersion. Si les valeurs basses de la première variable correspondent aux valeurs hautes de la seconde variable, il existe une corrélation négative. Dans ce cas, une ligne tracée à travers les points de données a une pente négative.

    Examinez le diagramme de dispersion pour la relation positive entre les variables. Si les valeurs basses de la première variable dans le diagramme de dispersion correspondent aux valeurs basses de la seconde et que les valeurs hautes de la première correspondent de manière similaire aux valeurs hautes de la seconde, les variables ont une corrélation positive. Dans ce cas, une ligne tracée à travers les points de données a une pente positive.

    Inspectez le nuage de points pour vérifier l'absence de relation entre les variables. Si les points de données dans le diagramme de dispersion sont distribués de manière aléatoire sans relation apparente entre les deux, ils n'ont aucune corrélation, ou une petite corrélation statistiquement non significative. Dans ce cas, une ligne passant par les points de données est horizontale avec une pente égale à zéro.


    Tracez une ligne entre les points de données et examinez sa forme pour évaluer la nature de la relation entre les deux variables. Une ligne droite est interprétée comme une relation linéaire, une forme incurvée suggère une relation quadratique, et une ligne relativement plate avant de soudainement monter ou descendre est interprétée comme une relation exponentielle.

    Examinez le diagramme de dispersion à la recherche de valeurs aberrantes, des valeurs anormalement éloignées du groupe de points de données. Les valeurs aberrantes faussent la relation entre les variables. Éliminez-les, mais seulement si leur absence n’affecte pas l’analyse de la relation entre les deux variables.