Contenu
- TL; DR (Trop long; n'a pas lu)
- La différence entre le niveau de confiance et l'intervalle de confiance
- Calcul des intervalles de confiance ou des niveaux pour les grands échantillons
- Calcul des intervalles de confiance pour les petits échantillons
La statistique consiste à tirer des conclusions face à l'incertitude. Chaque fois que vous prenez un échantillon, vous ne pouvez pas être tout à fait sûr que votre échantillon reflète vraiment la population à partir de laquelle il a été tiré. Les statisticiens traitent cette incertitude en prenant en compte les facteurs susceptibles d'avoir une incidence sur l'estimation, en quantifiant leur incertitude et en effectuant des tests statistiques pour tirer des conclusions de ces données incertaines.
Les statisticiens utilisent des intervalles de confiance pour spécifier une plage de valeurs susceptibles de contenir la «vraie» moyenne de la population sur la base d'un échantillon, et expriment leur niveau de certitude à cet égard par le biais de niveaux de confiance. Bien que le calcul des niveaux de confiance ne soit pas souvent utile, le calcul des intervalles de confiance pour un niveau de confiance donné est une compétence très utile.
TL; DR (Trop long; n'a pas lu)
Calculez un intervalle de confiance pour un niveau de confiance donné en multipliant l’erreur type par le Z marquer pour votre niveau de confiance choisi. Soustrayez ce résultat de votre moyenne d'échantillon pour obtenir la limite inférieure et ajoutez-le à la moyenne d'échantillon pour trouver la limite supérieure. (Voir Ressources)
Répétez le même processus mais avec le t marquer à la place du Z score pour les échantillons plus petits (n < 30).
Trouvez un niveau de confiance pour un ensemble de données en prenant la moitié de la taille de l'intervalle de confiance, en le multipliant par la racine carrée de la taille de l'échantillon, puis en le divisant par l'écart type de l'échantillon. Cherchez le résultat Z ou t marquer dans un tableau pour trouver le niveau.
La différence entre le niveau de confiance et l'intervalle de confiance
Lorsque vous voyez une statistique citée, une plage est donnée après celle-ci, avec l’abréviation «CI» (pour «intervalle de confiance») ou simplement un symbole plus-moins suivi d’un chiffre. Par exemple, «le poids moyen d'un homme adulte est de 180 livres (IC: 178,14 à 181,86)» ou «le poids moyen d'un homme adulte est de 180 ± 1,86 livres». Ces deux informations vous indiquent la même information: sur la base de l'échantillon. utilisé, le poids moyen d’un homme tombe probablement dans une certaine fourchette. La plage elle-même s'appelle l'intervalle de confiance.
Si vous voulez être aussi sûr que possible que la plage contient la valeur vraie, vous pouvez l'élargir. Cela augmenterait votre «niveau de confiance» dans l'estimation, mais l'intervalle couvrirait davantage de pondérations potentielles. La plupart des statistiques (y compris celle citée ci-dessus) correspondent à des intervalles de confiance de 95%, ce qui signifie qu'il existe une probabilité de 95% que la vraie valeur moyenne se situe dans la plage. Vous pouvez également utiliser un niveau de confiance de 99% ou de 90%, selon vos besoins.
Calcul des intervalles de confiance ou des niveaux pour les grands échantillons
Lorsque vous utilisez un niveau de confiance dans les statistiques, vous en avez généralement besoin pour calculer un intervalle de confiance. C’est un peu plus facile à faire si vous avez un grand échantillon, par exemple plus de 30 personnes, car vous pouvez utiliser Z marquer pour votre estimation plutôt que plus compliqué t scores.
Prenez vos données brutes et calculez la moyenne de l'échantillon (ajoutez simplement les résultats individuels et divisez-les par le nombre de résultats). Calculez l'écart-type en soustrayant la moyenne de chaque résultat pour trouver la différence, puis quadrillez cette différence. Additionnez toutes ces différences, puis divisez le résultat par la taille de l'échantillon moins 1. Prenez la racine carrée de ce résultat pour trouver l'écart type de l'échantillon (voir Ressources).
Déterminez l'intervalle de confiance en recherchant d'abord l'erreur standard:
SE = s / √n
Où s est votre exemple d'écart-type et n est la taille de votre échantillon. Par exemple, si vous preniez un échantillon de 1 000 hommes pour calculer le poids moyen d'un homme et obteniez un écart type de 30, vous obtiendriez:
SE = 30 / √1000 = 30 / 31.62 = 0.95
Pour en trouver l’intervalle de confiance, recherchez le niveau de confiance pour lequel vous souhaitez calculer l’intervalle dans une Z-score table et multiplie cette valeur par le Z But. Pour un niveau de confiance de 95%, le Z-score est 1.96. En utilisant l'exemple, cela signifie:
Moyenne ± Z × SE= 180 livres ± 1,96 × 0,95 = 180 ± 1,86 livres
Ici, ± 1,86 livres est l'intervalle de confiance de 95%.
Si vous disposez plutôt de cette information, ainsi que de la taille de l'échantillon et de l'écart type, vous pouvez calculer le niveau de confiance à l'aide de la formule suivante:
Z = 0.5 × taille de l'intervalle de confiance × √n / s
La taille de l'intervalle de confiance ne représente que le double de la valeur ±. Dans l'exemple ci-dessus, nous savons que 0,5 fois, il s'agit de 1,86. Cela donne:
Z = 1.86 × √1000 / 30 = 1.96
Cela nous donne une valeur pour Z, que vous pouvez regarder dans un Z-score table pour trouver le niveau de confiance correspondant.
Calcul des intervalles de confiance pour les petits échantillons
Pour les petits échantillons, il existe un processus similaire pour calculer l'intervalle de confiance. Tout d’abord, soustrayez 1 à la taille de votre échantillon pour trouver vos «degrés de liberté». Dans les symboles:
df = n −1
Pour un échantillon n = 10, cela donne df = 9.
Trouvez votre valeur alpha en soustrayant la version décimale du niveau de confiance (c'est-à-dire votre niveau de confiance en pourcentage divisé par 100) de 1 et en divisant le résultat par 2 ou en symboles:
α = (1 - niveau de confiance décimal) / 2
Donc, pour un niveau de confiance de 95% (0,95):
α = (1 – 0.95) / 2 = 0.05 / 2 = 0.025
Recherchez votre valeur alpha et vos degrés de liberté dans un (une queue) t tableau de distribution et notez le résultat. Sinon, omettez la division par 2 ci-dessus et utilisez un modèle à deux queues. t valeur. Dans cet exemple, le résultat est 2.262.
Comme à l'étape précédente, calculez l'intervalle de confiance en multipliant ce nombre par l'erreur type, qui est déterminée à l'aide de l'écart type et de la taille de l'échantillon de la même manière. La seule différence est qu’à la place du Z score, vous utilisez le t But.