Corrélation parasite
Quelle est la corrélation parasiteEn statistique, une corrélation parasite, ou parasitisme, fait référence à un lien entre deux variables qui semblent causales mais ne le sont pas. Les relations parasites ont souvent l'apparence d'une variable qui en affecte une autre. Cette corrélation parasite est souvent causée par un troisième facteur qui n’est pas apparent au moment de l’examen, parfois appelé facteur de confusion.
Points clés à retenir
- La corrélation parasite, ou caractère parasite, se produit lorsque deux facteurs apparaissent liés de manière fortuite mais ne le sont pas.
- L'apparition d'un lien de causalité est souvent due à un mouvement similaire sur une carte, qui s'avère être une coïncidence ou être causé par un troisième facteur "de confusion".
- La corrélation parasite peut souvent être causée par des échantillons de petite taille ou des points de terminaison arbitraires.
Comment fonctionne la corrélation parasite
Lorsque deux variables aléatoires se suivent étroitement sur un graphique, il est facile de suspecter une corrélation, ou une relation entre les deux facteurs, lorsqu'un changement affecte l'autre. En mettant de côté la "causalité", autre sujet, cette observation peut amener le lecteur du graphique à croire que le mouvement de la variable A est lié au mouvement de la variable B ou inversement. mais parfois, après un examen statistique plus approfondi, les mouvements alignés sont une coïncidence ou sont causés par un troisième facteur qui affecte les deux premiers. C'est une corrélation fallacieuse. Les recherches effectuées avec des échantillons de petite taille ou avec des critères de jugement arbitraires sont particulièrement susceptibles d'être fausses.
Exemple de corrélations parasites
Il n'est pas trop difficile de découvrir des corrélations intéressantes. Beaucoup s'avéreront être faux, cependant. Pour les espèces mâles de Wall Street, deux corrélations fallacieuses populaires impliquent les femmes et les sports. La théorie de la longueur des jupes est à l’origine des années 1920, selon laquelle la longueur des jupes et la direction du marché boursier sont corrélées. Si la longueur des jupes est longue, cela signifie que le marché boursier est en baisse; si elles sont courtes, le marché monte. Vers la fin janvier, on parle de ce que l’on appelle le «Super Bowl», ce qui suggère qu’une victoire de l’équipe de l’AFC signifie probablement que le marché boursier baissera au cours de l’année à venir, alors que la victoire de l’équipe de la NFC laisse présager une hausse du marché. Depuis 1966, l'indicateur a un taux de précision de 80%. Il s’agit d’une conversation amusante, mais ce n’est probablement pas ce qu’un conseiller financier sérieux recommanderait comme stratégie de placement pour ses clients.
Voici quelques exemples supplémentaires de corrélations parasites usuelles:
- Les noyades augmentent lorsque les ventes de crème glacée augmentent. Il peut sembler que l'augmentation des ventes de crème glacée provoque davantage de noyades, mais en réalité, l'augmentation de la chaleur peut amener plus de personnes à nager et à acheter davantage de crème glacée.
- Le taux de meurtres aux États-Unis de 2006 à 2011 a chuté au même rythme que l'utilisation de Microsoft Internet Explorer.
- Les cadres qui disent s'il vous plaît et merci plus souvent apprécient une meilleure performance de leurs actions.
- Les personnes qui portent l'équipement de l'équipe Oakland Raiders sont plus susceptibles de commettre des crimes.
Comment repérer les corrélations parasites
Les statisticiens et les autres scientifiques qui analysent les données doivent être constamment à l'affût de fausses relations. Ils utilisent de nombreuses méthodes, notamment:
- Assurer un échantillon représentatif approprié.
- Obtenir une taille d’échantillon adéquate.
- Se méfier des points de terminaison arbitraires.
- Contrôler pour autant de variables extérieures que possible.
- Utiliser une hypothèse nulle et rechercher une valeur p forte.