Définition moyenne winsorisée
Quelle est la moyenne winsorisée?La moyenne winsorisée est une méthode de calcul de la moyenne qui remplace initialement les valeurs les plus petites et les plus grandes par les observations les plus proches. Ceci est fait pour limiter l'effet de valeurs extrêmes anormales, ou de valeurs aberrantes, sur le calcul. Après avoir remplacé les valeurs, la formule de la moyenne arithmétique est ensuite utilisée pour calculer la moyenne de WinSorized.
La formule pour la moyenne winsorisée est
Moyenne winsorisée = xn… xn + 1 + xn + 2… xnNwhere: n = nombre de points de données les plus grands et les plus petits devant être remplacés par l'observation \ begin {aligné} & \ text {Moyenne winsorisée} \ = \ \ frac {x_ {n} \ points x_ {n + 1} \ + \ x_ {n + 2} \ points x_ {n}} {N} \\ & \ textbf {où:} \\ & \ begin {alignés} n \ = \ & \ text {Le nombre de données les plus grandes et les plus petites} \\ & \ text {points à remplacer par l'observation} \\ & \ text {les plus proches} \ end {aligné} \\ & N \ = \ \ text {Nombre total de points de données} \ end {alignés} Moyenne winsorisée = Nxn… xn + 1 + xn + 2… xn où: n = nombre de points de données les plus grands et les plus petits à remplacer par l'observation Un séjour sans faille
Les moyennes winsorisées sont exprimées de deux manières. Une "moyenne n " victorieuse se réfère au remplacement des "k" les plus petites et des plus grandes observations, où "k" est un entier. "X%" signifie une valeur de substitution qui consiste à remplacer un pourcentage donné de valeurs aux deux extrémités des données.
Comment calculer la moyenne winsorisée
La moyenne de winsorized est calculée en remplaçant les points de données les plus petits et les plus grands, puis en additionnant tous les points de données et en divisant la somme par le nombre total de points de données.
Que signifie le winsorized vous dire?
La moyenne de winsorized est moins sensible aux valeurs aberrantes car elle peut les remplacer par des valeurs moins extrêmes. C'est-à-dire qu'il est moins susceptible aux contours par rapport à la moyenne. Cependant, si une distribution a des queues épaisses, l’effet de supprimer les valeurs les plus élevées et les plus basses de la distribution aura peu d’influence en raison du nombre élevé de variabilité dans les chiffres de distribution.
Points clés à retenir
- Méthode de calcul de la moyenne qui consiste à remplacer les valeurs les plus petites et les plus grandes par les observations les plus proches d’elles.
- Moins sensible aux valeurs aberrantes car il peut les remplacer par des valeurs moins extrêmes.
- Cela diffère de la moyenne ajustée, qui implique la suppression des points de données, même si le résultat des deux a tendance à être proche.
Exemple d'utilisation de la moyenne winsorisée
On peut calculer la moyenne de winsorized pour l’ensemble de données suivant: 1, 5, 7, 8, 9, 10, 14. Dans cet exemple, on suppose que la moyenne de winsorized est dans le premier ordre, on remplace les valeurs les plus petites et les plus grandes par leurs valeurs. observations les plus proches.
Le jeu de données apparaît maintenant comme suit: 5, 5, 7, 8, 9, 10, 10. Le fait de calculer une moyenne arithmétique du nouvel ensemble produit une moyenne de 7, 7, ou (5 + 5 + 7 + 8 + 9 + 10 +). 10) divisé par 7.
Ou bien considérons une moyenne de 20% winsorized qui prend les 10% premiers et les 10% inférieurs et les remplace par leur valeur suivante la plus proche. Nous allons classer les données suivantes: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Les deux Les points de données les plus petits et les plus grands, soit 10%, seront remplacés par leur valeur la plus proche. Ainsi, le nouvel ensemble de données est le suivant: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. la moyenne est 33, 9, soit le total des données (678) divisé par le nombre total de points de données (20).
La différence entre moyenne winsorisée et moyenne ajustée
La moyenne winsorisée inclut la modification des points de données, tandis que la moyenne ajustée consiste à supprimer des points de données. Il est courant que la moyenne winsorisée et la moyenne ajustée soient proches.
Limites d'utilisation de la moyenne winsorisée
L’un des inconvénients majeurs des méthodes winsorized est qu’elles introduisent des biais dans l’ensemble de données. Certes, le jeu de données est idéalement moins biaisé après la modification que si les valeurs aberrantes étaient laissées.
En savoir plus sur la moyenne winsorisée
Pour en savoir plus sur les différences entre les calculs de moyennes clés.
Comparaison des comptes d'investissement Nom du fournisseur Description Divulgation par l'annonceur × Les offres figurant dans ce tableau proviennent de partenariats avec lesquels Investopedia reçoit une rémunération.