Contenu
- Échantillonnage aléatoire
- Précision
- Intervalles de confiance
- Erreur standard
- Difficulté à utiliser des tailles d'échantillons plus grandes
La taille de l'échantillon représente le nombre d'observations effectuées pour effectuer une analyse statistique. La taille des échantillons peut être composée de personnes, d'animaux, de lots de nourriture, de machines, de piles ou de toute autre population faisant l'objet d'une évaluation.
Échantillonnage aléatoire
L'échantillonnage aléatoire est une méthode par laquelle des échantillons aléatoires sont collectés auprès d'une population afin d'estimer les informations sur la population sans biais. Par exemple, si vous voulez savoir quel type de personnes habitent dans une ville donnée, vous devez interroger / mesurer différentes personnes au hasard. Cependant, si vous utilisiez tout le monde à la bibliothèque, vous n'auriez pas une estimation juste / impartiale de la population générale occupant la ville, mais uniquement des gens qui fréquentent la bibliothèque.
Précision
À mesure que la taille des échantillons augmente, les estimations deviennent plus précises. Par exemple, si nous sélectionnons au hasard 10 hommes adultes de sexe masculin, leur hauteur moyenne sera peut-être de 6 pieds 3 pouces, peut-être parce qu'un joueur de basket-ball gonfle notre estimation. Cependant, si nous mesurions deux millions d'hommes adultes, nous aurions un meilleur prédicteur de la taille moyenne des hommes, car les extrêmes s'équilibreraient et la moyenne réelle éclipserait tout écart par rapport à la moyenne.
Intervalles de confiance
Lorsqu'un statisticien fait une prédiction sur un résultat, il crée souvent un intervalle autour de son estimation. Par exemple, si nous mesurions le poids de 100 femmes, nous pourrions dire que nous sommes convaincus à 90% que le véritable poids moyen des femmes se situe dans l'intervalle de 103 à 129 livres. (Cela dépend évidemment d'autres facteurs tels que la variabilité des mesures.) À mesure que la taille de l'échantillon augmente, notre estimation devient plus confiante et nos intervalles deviennent plus courts. Par exemple, avec un million de femmes, nous pourrions dire que nous sommes confiants à 98% que le véritable poids moyen des femmes se situe entre 115 et 117 livres. En d'autres termes, à mesure que la taille de l'échantillon augmente, notre confiance dans nos mesures augmente et la taille de nos intervalles de confiance diminue.
Erreur standard
La variation est une mesure de la dispersion des données autour de la moyenne. L’écart-type est la racine carrée de la variation et permet d’approximer quel pourcentage de la population se situe entre une plage de valeurs relative et la moyenne. Au fur et à mesure que la taille de l'échantillon augmente, l'erreur type, qui dépend de l'écart type et de la taille de l'échantillon, diminue. Par conséquent, les estimations augmentent en précision et la recherche basée sur ces estimations est considérée comme plus fiable (avec un risque d'erreur moindre).
Difficulté à utiliser des tailles d'échantillons plus grandes
Des échantillons de plus grande taille produisent évidemment des estimations meilleures et plus précises des populations, mais il existe plusieurs problèmes pour les chercheurs utilisant des échantillons de plus grande taille. Tout d’abord, il peut être difficile de trouver un échantillon aléatoire de personnes disposées à essayer un nouveau médicament. Lorsque vous le faites, il devient plus coûteux de fournir le médicament à plus de gens et de surveiller plus de gens au fil du temps. En outre, il faut déployer davantage d’efforts pour obtenir et conserver une taille d’échantillon plus grande. Même si des échantillons de plus grande taille produisent des statistiques plus précises, les coûts et les efforts supplémentaires ne sont pas toujours nécessaires, car des échantillons de plus petite taille peuvent également produire des résultats significatifs.