Principal » trading algorithmique » Échantillonnage systématique

Échantillonnage systématique

trading algorithmique : Échantillonnage systématique
Qu'est-ce que l'échantillonnage systématique?

L'échantillonnage systématique est un type de méthode d'échantillonnage probabiliste dans lequel les membres de l'échantillon d'une population plus large sont sélectionnés en fonction d'un point de départ aléatoire, mais avec un intervalle périodique fixe. Cet intervalle, appelé intervalle d'échantillonnage, est calculé en divisant la taille de la population par la taille souhaitée de l'échantillon.

Bien que l'échantillon de population ait été sélectionné à l'avance, l'échantillonnage systématique est toujours considéré comme aléatoire si l'intervalle périodique est déterminé à l'avance et si le point de départ est aléatoire.

Il existe plusieurs méthodes d'échantillonnage d'une population pour l'inférence statistique; l'échantillonnage systématique est une forme d'échantillonnage aléatoire.

1:29

Échantillonnage systématique

Comment fonctionne l'échantillonnage systématique

Comme l'échantillonnage aléatoire simple d'une population peut être inefficace et prendre beaucoup de temps, les statisticiens se tournent vers d'autres méthodes, telles que l'échantillonnage systématique. Le choix d'une taille d'échantillon par une approche systématique peut être fait rapidement. Une fois qu'un point de départ fixe a été identifié, un intervalle constant est sélectionné pour faciliter la sélection des participants.

L'échantillonnage systématique est préférable à l'échantillonnage aléatoire simple lorsque le risque de manipulation des données est faible. Si un tel risque est élevé lorsqu'un chercheur peut manipuler la longueur de l'intervalle pour obtenir les résultats souhaités, une technique d'échantillonnage aléatoire simple serait plus appropriée.

L'échantillonnage systématique est populaire auprès des chercheurs et des analystes en raison de sa simplicité. Les chercheurs partent généralement du principe que les résultats sont représentatifs de la plupart des populations normales, à moins qu’une caractéristique aléatoire n’existe de manière disproportionnée dans chaque " n ème" échantillon de données (ce qui est peu probable). En d'autres termes, une population doit présenter un degré naturel de hasard le long de la métrique choisie. Si la population présente un type de schéma standardisé, le risque de choisir accidentellement des cas très fréquents est plus évident.

Dans le cadre de l'échantillonnage systématique, à l'instar d'autres méthodes d'échantillonnage, une population cible doit être sélectionnée avant la sélection des participants. Une population peut être identifiée sur la base d’un nombre quelconque de caractéristiques souhaitées qui conviennent au but de l’étude en cours. Certains critères de sélection peuvent inclure l’âge, le sexe, la race, le lieu, le niveau d’éducation et / ou la profession.

  • L'échantillonnage systématique est un type de méthode d'échantillonnage probabiliste dans lequel les membres de l'échantillon d'une population plus importante sont sélectionnés en fonction d'un point de départ aléatoire, mais avec un intervalle périodique fixe (l'intervalle d'échantillonnage).
  • En raison de sa simplicité, l'échantillonnage systématique est populaire auprès des chercheurs.
  • Parmi les autres avantages de cette méthodologie, citons l’élimination du phénomène de la sélection par grappes et la faible probabilité de contamination des données.
  • Les inconvénients incluent une sur ou sous-représentation de modèles particuliers et un risque accru de manipulation des données.

Exemples d'échantillonnage systématique

Comme exemple hypothétique d'échantillonnage systématique, supposons que sur une population de 10 000 personnes, un statisticien sélectionne chaque centième personne à échantillonner. Les intervalles d'échantillonnage peuvent également être systématiques, tels que le choix d'un nouvel échantillon à prélever toutes les 12 heures.

Autre exemple, si vous souhaitez sélectionner un groupe aléatoire de 1 000 personnes sur une population de 50 000 personnes en utilisant un échantillonnage systématique, tous les participants potentiels doivent être placés dans une liste et un point de départ sera sélectionné. Une fois la liste formée, chaque 50ème personne de la liste (commençant le compte au point de départ sélectionné) serait choisie comme participant, puisque 50 000/1 000 = 50.

Par exemple, si le point de départ sélectionné était 20, la 70ème personne de la liste serait choisie, suivie de la 120ème, etc. Une fois la fin de la liste atteinte et si d'autres participants sont requis, le décompte est bouclé au début de la liste pour terminer le décompte.

Échantillonnage systématique ou échantillonnage en grappes

L'échantillonnage systématique et l'échantillonnage en grappes diffèrent dans la façon dont ils extraient des points d'échantillonnage de la population incluse dans l'échantillon. L'échantillonnage en grappes décompose la population en grappes, tandis que l'échantillonnage systématique utilise des intervalles fixes de la plus grande population pour créer l'échantillon.

L'échantillonnage systématique sélectionne un point de départ aléatoire dans la population, puis un échantillon est prélevé à intervalles fixes et réguliers de la population en fonction de sa taille. L'échantillonnage en grappes divise la population en grappes, puis prélève un échantillon aléatoire simple dans chaque grappe.

L'échantillonnage en grappes est considéré comme moins précis que les autres méthodes d'échantillonnage. Cependant, cela peut réduire les coûts d'obtention d'un échantillon. L'échantillonnage en grappes est une procédure d'échantillonnage en deux étapes. Il peut être utilisé lorsque compléter une liste de toute la population est difficile. Par exemple, il pourrait être difficile de constituer l’ensemble de la population des clients d’une épicerie à interroger.

Cependant, une personne peut créer un sous-ensemble aléatoire de magasins, ce qui constitue la première étape du processus. La deuxième étape consiste à interroger un échantillon aléatoire des clients de ces magasins. Il s'agit d'un processus manuel simple qui permet d'économiser du temps et de l'argent.

Limites de l'échantillonnage systématique

Un des risques que les statisticiens doivent prendre en compte lors de la réalisation d'un échantillonnage systématique concerne l'organisation de la liste utilisée avec l'intervalle d'échantillonnage. Si la population placée sur la liste est organisée selon un modèle cyclique qui correspond à l'intervalle d'échantillonnage, l'échantillon sélectionné peut être biaisé.

Par exemple, le service des ressources humaines d'une entreprise souhaite sélectionner un échantillon d'employés et demander leur avis sur les règles de l'entreprise. Les employés sont regroupés en équipes de 20 personnes, chaque équipe étant dirigée par un responsable. Si la liste utilisée pour sélectionner la taille de l'échantillon est organisée avec des équipes regroupées, le statisticien risque de ne choisir que des gestionnaires (ou aucun gestionnaire) en fonction de l'intervalle d'échantillonnage.

Comparaison des comptes d'investissement Nom du fournisseur Description Divulgation par l'annonceur × Les offres figurant dans ce tableau proviennent de partenariats avec lesquels Investopedia reçoit une rémunération.

Termes connexes

Définition de l'échantillonnage L'échantillonnage est un processus utilisé dans l'analyse statistique dans lequel un groupe d'observations est extrait d'une population plus large. more Fonctionnement des échantillons aléatoires simples Un échantillon aléatoire simple est un sous-ensemble d'une population statistique dans lequel chaque membre du sous-ensemble a une probabilité égale d'être choisi. Un échantillon aléatoire simple est censé être une représentation non biaisée d'un groupe. plus Lire dans l'échantillonnage aléatoire stratifié L'échantillonnage aléatoire stratifié est une méthode d'échantillonnage qui consiste à diviser une population en groupes plus petits, appelés strates. Un échantillon plus représentatif est souvent utilisé pour extrapoler un sentiment plus large. Un échantillon représentatif est un sous-ensemble d'une population qui reflète les caractéristiques de la population entière. more Sample Un échantillon est une version plus petite et plus gérable d'un groupe plus important. Les échantillons sont utilisés dans les tests statistiques lorsque la taille de la population est trop importante. plus Qu'est-ce que le théorème de la limite centrale (CLT)? Le théorème central limite stipule que la distribution des moyennes d'échantillon se rapproche d'une distribution normale à mesure que la taille de l'échantillon augmente. plus de liens partenaires
Recommandé
Laissez Vos Commentaires