Principal » trading algorithmique » Échantillonnage aléatoire stratifié

Échantillonnage aléatoire stratifié

trading algorithmique : Échantillonnage aléatoire stratifié
Qu'est-ce que l'échantillonnage aléatoire stratifié?

L'échantillonnage aléatoire stratifié est une méthode d'échantillonnage qui implique la division d'une population en sous-groupes plus petits appelés strates. Dans l'échantillonnage aléatoire stratifié ou la stratification, les strates sont formées sur la base d'attributs ou de caractéristiques communs aux membres, tels que le revenu ou le niveau d'instruction.

L'échantillonnage aléatoire stratifié est également appelé échantillonnage aléatoire proportionnel ou échantillonnage aléatoire.

[Important: l'échantillonnage stratifié est utilisé pour mettre en évidence les différences entre les groupes d'une population, par opposition à l'échantillonnage aléatoire simple, qui traite tous les membres d'une population comme égaux, avec une probabilité égale d'être échantillonnés.]

1:40

Échantillonnage aléatoire stratifié

Comment fonctionne l'échantillonnage aléatoire stratifié

En effectuant une analyse ou une recherche sur un groupe d’entités présentant des caractéristiques similaires, un chercheur peut constater que la taille de la population est trop importante pour permettre de mener à bien une recherche. Pour gagner du temps et de l'argent, un analyste peut adopter une approche plus réaliste en sélectionnant un petit groupe dans la population. Le petit groupe est appelé la taille de l'échantillon, qui est un sous-ensemble de la population utilisé pour représenter la population entière. Un échantillon peut être sélectionné dans une population de différentes manières, notamment la méthode d'échantillonnage aléatoire stratifié.

Un échantillonnage aléatoire stratifié consiste à diviser la population entière en groupes homogènes appelés strates (pluriel pour strate). Des échantillons aléatoires sont ensuite sélectionnés dans chaque strate. Prenons l'exemple d'un chercheur universitaire qui aimerait connaître le nombre d'étudiants au MBA en 2007 ayant reçu une offre d'emploi dans les trois mois suivant l'obtention de leur diplôme.

Il découvrira bientôt qu'il y avait près de 200 000 diplômés du MBA pour l'année. Il pourrait décider de ne prendre qu'un échantillon aléatoire simple de 50 000 diplômés et de mener une enquête. Mieux encore, il pourrait diviser la population en strates et prélever un échantillon aléatoire des strates. Pour ce faire, il créerait des groupes de population basés sur le sexe, la tranche d'âge, la race, le pays de nationalité et le parcours professionnel. Un échantillon aléatoire de chaque strate est pris en nombre proportionnel à la taille de la strate par rapport à la population. Ces sous-ensembles des strates sont ensuite regroupés pour former un échantillon aléatoire.

Points clés à retenir

  • L'échantillonnage aléatoire stratifié permet aux chercheurs d'obtenir un échantillon de population qui représente le mieux l'ensemble de la population étudiée.
  • L'échantillonnage aléatoire stratifié consiste à diviser la population entière en groupes homogènes appelés strates.
  • L'échantillonnage aléatoire stratifié diffère de l'échantillonnage aléatoire simple, qui implique la sélection aléatoire de données provenant d'une population entière, de sorte que chaque échantillon possible a la même probabilité de se produire.

Exemple d'échantillonnage aléatoire stratifié

Supposons qu'une équipe de recherche veuille déterminer la MPC des étudiants à travers les États-Unis. L'équipe de recherche a des difficultés à collecter des données auprès des 21 millions d'étudiants; il décide de prendre un échantillon aléatoire de la population en utilisant 4 000 étudiants.

Supposons maintenant que l'équipe examine les différents attributs des participants à l'échantillon et se demande s'il existe des différences entre les MPC et les majeures des étudiants. Supposons que 560 étudiants soient inscrits en anglais, 1 135 en sciences, 800 en informatique, 1 090 en ingénierie et 415 en mathématiques. L'équipe souhaite utiliser un échantillon aléatoire stratifié proportionnel où la strate de l'échantillon est proportionnelle à l'échantillon aléatoire de la population.

Supposons que l’équipe étudie les données démographiques des étudiants universitaires aux États-Unis et trouve le pourcentage de ce que les étudiants étudient en majeure (12% en anglais, 28% en sciences, 24% en informatique, 21% en ingénierie et 15% en majeure). en mathématiques. Ainsi, cinq strates sont créées à partir du processus d'échantillonnage aléatoire stratifié.

L'équipe doit ensuite confirmer que la strate de la population est proportionnelle à la strate de l'échantillon; Cependant, ils trouvent que les proportions ne sont pas égales. L’équipe doit ensuite ré-échantillonner 4 000 étudiants de la population et sélectionner au hasard 480 étudiants en anglais, 1 120 en sciences, 960 en informatique, 840 en génie et 600 étudiants en mathématiques.

Avec ceux-ci, il a un échantillon aléatoire stratifié proportionnel d'étudiants, ce qui offre une meilleure représentation des étudiants de premier cycle aux États-Unis. Les chercheurs peuvent ensuite mettre en évidence une strate spécifique, observer les différentes études des étudiants américains et observer les différentes moyennes. .

Échantillons aléatoires simples ou aléatoires stratifiés

Les échantillons aléatoires simples et les échantillons aléatoires stratifiés sont tous deux des outils de mesure statistique. Un échantillon aléatoire simple est utilisé pour représenter l'ensemble de la population de données. Un échantillon aléatoire stratifié divise la population en groupes plus petits, ou strates, en fonction de caractéristiques communes.

L'échantillon aléatoire simple est souvent utilisé lorsqu'il existe très peu d'informations disponibles sur la population de données, lorsque la population de données présente trop de différences pour être divisée en divers sous-ensembles ou lorsqu'il n'existe qu'une seule caractéristique distincte parmi la population de données.

Par exemple, une entreprise de fabrication de bonbons peut vouloir étudier les habitudes d'achat de ses clients afin de déterminer l'avenir de sa gamme de produits. S'il y a 10 000 clients, il peut utiliser 100 de ces clients comme échantillon aléatoire. Il peut ensuite appliquer ce qu'il trouve parmi ces 100 clients au reste de sa base. Contrairement à la stratification, 100 membres seront choisis au hasard, sans tenir compte de leurs caractéristiques individuelles.

Stratification proportionnelle et disproportionnée

Un échantillonnage aléatoire stratifié garantit que chaque sous-groupe d'une population donnée est correctement représenté dans l'ensemble de la population de l'échantillon d'une étude. La stratification peut être proportionnée ou disproportionnée. Dans une méthode stratifiée proportionnelle, la taille de l'échantillon de chaque strate est proportionnelle à la taille de la population de la strate.

Par exemple, si le chercheur souhaitait un échantillon de 50 000 diplômés utilisant la tranche d'âge, l'échantillon aléatoire stratifié proportionnel serait obtenu à l'aide de la formule suivante: (taille de l'échantillon / taille de la population) x taille de la strate. Le tableau ci-dessous suppose une population de 180 000 diplômés du MBA par an.

Tranche d'âge


24-28


29-33


34-37


Total


Nombre de personnes dans la strate


90 000


60 000


30 000


180 000


Taille de l'échantillon en strates


25 000


16 667


8 333


50 000


La taille de l'échantillon de strates pour les diplômés du MBA âgés de 24 à 28 ans est calculée comme suit: (50 000/180 000) x 90 000 = 25 000. La même méthode est utilisée pour les autres groupes d'âge. Maintenant que la taille de l'échantillon de strates est connue, le chercheur peut effectuer un échantillonnage aléatoire simple dans chaque strate afin de sélectionner les participants à son enquête. En d’autres termes, 25 000 diplômés du groupe d’âge des 24 à 28 ans seront choisis au hasard parmi l’ensemble de la population, 16 667 diplômés du groupe des 29 à 33 ans seront sélectionnés au hasard dans la population, et ainsi de suite.

Dans un échantillon stratifié disproportionné, la taille de chaque strate n'est pas proportionnelle à sa taille dans la population. Le chercheur peut décider d’échantillonner la moitié des diplômés du groupe des 34 à 37 ans et le tiers des diplômés du groupe des 29 à 33 ans.

Il est important de noter qu'une personne ne peut pas appartenir à plusieurs strates. Chaque entité ne doit appartenir qu'à une seule strate. Le chevauchement des sous-groupes signifie que certaines personnes auront plus de chances d'être sélectionnées pour l'enquête, ce qui annule complètement le concept d'échantillonnage stratifié en tant que type d'échantillonnage probabiliste.

[Important: les gestionnaires de portefeuille peuvent utiliser un échantillonnage aléatoire stratifié pour créer des portefeuilles en répliquant un indice tel qu'un indice obligataire.]

Avantages de l'échantillonnage aléatoire stratifié

L’échantillonnage aléatoire stratifié a pour principal avantage de saisir les principales caractéristiques de la population de l’échantillon. Semblable à une moyenne pondérée, cette méthode d'échantillonnage produit des caractéristiques dans l'échantillon proportionnelles à la population globale. L'échantillonnage aléatoire stratifié fonctionne bien pour les populations avec une variété d'attributs mais est autrement inefficace si des sous-groupes ne peuvent pas être formés.

La stratification donne une erreur d'estimation plus petite et une plus grande précision que la méthode d'échantillonnage aléatoire simple. Plus les différences entre les strates sont grandes, plus le gain de précision est grand.

Inconvénients de l'échantillonnage aléatoire stratifié

Malheureusement, cette méthode de recherche ne peut être utilisée dans toutes les études. L'inconvénient de la méthode est que plusieurs conditions doivent être remplies pour une utilisation correcte. Les chercheurs doivent identifier chaque membre de la population à l'étude et classer chacun d'entre eux en une et une seule sous-population. En conséquence, l’échantillonnage aléatoire stratifié est désavantageux lorsque les chercheurs ne peuvent pas classer avec confiance chaque membre de la population dans un sous-groupe. En outre, il peut être difficile de trouver une liste exhaustive et définitive de toute une population.

Le chevauchement peut être un problème si certains sujets appartiennent à plusieurs sous-groupes. Lorsqu'un échantillonnage aléatoire simple est effectué, ceux qui appartiennent à plusieurs sous-groupes ont plus de chances d'être choisis. Le résultat pourrait être une fausse représentation ou un reflet inexact de la population.

Les exemples ci-dessus facilitent les choses: les étudiants de premier cycle, de deuxième cycle, de sexe masculin et de sexe féminin sont clairement définis. Dans d'autres situations, cependant, cela pourrait être beaucoup plus difficile. Imaginez incorporer des caractéristiques telles que la race, l'ethnie ou la religion. Le processus de tri devient plus difficile, rendant l'échantillonnage aléatoire stratifié une méthode inefficace et moins qu'idéale.

Comparaison des comptes d'investissement Nom du fournisseur Description Divulgation par l'annonceur × Les offres figurant dans ce tableau proviennent de partenariats avec lesquels Investopedia reçoit une rémunération.

Termes connexes

Échantillon Un échantillon est une version plus petite et gérable d'un groupe plus important. Les échantillons sont utilisés dans les tests statistiques lorsque la taille de la population est trop importante. more Fonctionnement des échantillons aléatoires simples Un échantillon aléatoire simple est un sous-ensemble d'une population statistique dans lequel chaque membre du sous-ensemble a une probabilité égale d'être choisi. Un échantillon aléatoire simple est censé être une représentation non biaisée d'un groupe. Un échantillon plus représentatif est souvent utilisé pour extrapoler un sentiment plus large. Un échantillon représentatif est un sous-ensemble d'une population qui reflète les caractéristiques de la population entière. plus Les tenants et aboutissants de l'échantillonnage systématique L'échantillonnage systématique est une méthode d'échantillonnage probabiliste dans laquelle un échantillon aléatoire d'une population plus importante est sélectionné. more Sampling Définition L'échantillonnage est un processus utilisé dans l'analyse statistique dans lequel un groupe d'observations est extrait d'une population plus importante. plus Définition du test t Un test t est un type de statistique inférentielle utilisé pour déterminer s'il existe une différence significative entre les moyennes de deux groupes, qui peut être liée à certaines caractéristiques. plus de liens partenaires
Recommandé
Laissez Vos Commentaires