Principal » trading algorithmique » Test d'hypothèses en finance: concept et exemples

Test d'hypothèses en finance: concept et exemples

trading algorithmique : Test d'hypothèses en finance: concept et exemples

Votre conseiller en placement vous propose un régime de placement à revenu mensuel qui promet un rendement variable chaque mois. Vous n'y investirez que si vous êtes assuré d'un revenu mensuel moyen de 180 $. Votre conseiller vous a également indiqué que, au cours des 300 derniers mois, le système avait généré des rendements de placement d’une valeur moyenne de 190 $ et d’un écart-type de 75 $. Devriez-vous investir dans ce stratagème? Les tests d'hypothèses viennent en aide à cette prise de décision.

Cet article suppose que les lecteurs connaissent bien les concepts d’une table de distribution normale, d’une formule, d’une valeur p et de bases statistiques associées.

Qu'est-ce qu'un test d'hypothèse?

Le test d'hypothèse ou de signification est un modèle mathématique permettant de tester une revendication, une idée ou une hypothèse concernant un paramètre d'intérêt dans un ensemble de population donné, à l'aide de données mesurées dans un ensemble d'échantillons. Les calculs sont effectués sur des échantillons sélectionnés afin de collecter des informations plus décisives sur les caractéristiques de la population entière, ce qui permet de tester systématiquement les revendications ou les idées concernant l'ensemble des données.

Voici un exemple simple: Une directrice d’école rapporte que les élèves de son école obtiennent en moyenne 7 sur 10 aux examens. Pour tester cette «hypothèse», nous enregistrons les notes de 30 étudiants (échantillon) de l’ensemble des élèves de l’école (par exemple 300) et calculons la moyenne de cet échantillon. Nous pouvons ensuite comparer la moyenne de l'échantillon (calculée) à la moyenne de la population (déclarée) et tenter de confirmer l'hypothèse.

Pour prendre un autre exemple, le rendement annuel d'un fonds commun de placement est de 8%. Supposons que le fonds commun de placement existe depuis 20 ans. Nous prenons un échantillon aléatoire de rendements annuels du fonds commun de placement pour, par exemple, cinq ans (échantillon) et en calculons la moyenne. Nous comparons ensuite la moyenne de l'échantillon (calculée) à la moyenne de la population (revendiquée) pour vérifier l'hypothèse.

Les critères de prise de décision doivent être basés sur certains paramètres des jeux de données.

Différentes méthodologies existent pour tester les hypothèses, mais les quatre mêmes étapes de base sont impliquées:

Étape 1: Définir l'hypothèse

Habituellement, la valeur déclarée (ou les statistiques de réclamation) est énoncée comme hypothèse et supposée vraie. Pour les exemples ci-dessus, l'hypothèse sera:

  • Exemple A: Les élèves de l’école obtiennent en moyenne 7 sur 10 aux examens.
  • Exemple B: Le rendement annuel du fonds commun de placement est de 8% par an.

Cette description énoncée constitue «l' hypothèse nulle (H 0 ) » et est supposée être vraie - la façon dont un accusé dans un procès avec jury est présumé innocent jusqu'à ce que sa culpabilité ait été établie par la preuve présentée à l'audience. De même, les tests d'hypothèses commencent par énoncer et supposant une «hypothèse nulle», puis le processus détermine si l'hypothèse est susceptible d'être vraie ou fausse.

Le point important à noter est que nous testons l'hypothèse nulle car il existe un élément de doute quant à sa validité. Quelle que soit l'information qui est contre l'hypothèse nulle indiquée, elle est capturée dans l' hypothèse alternative (H 1 ). Pour les exemples ci-dessus, l'hypothèse alternative sera:

  • Les élèves obtiennent une moyenne qui n’est pas égale à 7.
  • Le rendement annuel du fonds commun de placement n’est pas égal à 8% par an.

En d'autres termes, l'hypothèse alternative est une contradiction directe de l'hypothèse nulle.

Comme dans un procès, le jury présume l'innocence de l'accusé (hypothèse de nullité). Le procureur doit prouver le contraire (hypothèse alternative). De même, le chercheur doit prouver que l'hypothèse nulle est vraie ou fausse. Si le procureur ne parvient pas à prouver l'hypothèse alternative, le jury doit laisser le défendeur s'en aller (en se basant sur l'hypothèse nulle). De même, si le chercheur ne réussit pas à prouver une hypothèse alternative (ou ne fait simplement rien), l'hypothèse nulle est supposée vraie.

Étape 2: Définir les critères

Les critères de décision doivent être basés sur certains paramètres des jeux de données et c’est là que la connexion à la distribution normale entre en jeu.

Selon le postulat statistique standard concernant la distribution d'échantillonnage, «Pour toute taille d'échantillon n, la distribution d'échantillonnage de X̅ est normale si la population X à partir de laquelle l'échantillon est tiré est normalement distribuée». Ainsi, les probabilités de tous les autres échantillons possibles signifient que on pourrait choisir sont normalement distribués.

Par exemple, déterminez si le rendement quotidien moyen de toute action cotée sur le marché boursier XYZ autour du jour de l'An est supérieur à 2%.

H 0 : Hypothèse nulle: moyenne = 2%

H 1 : Hypothèse alternative: moyenne> 2% (c'est ce que nous voulons prouver)

Prenez l'échantillon (par exemple 50 stocks sur un total de 500) et calculez la moyenne de l'échantillon.

Pour une distribution normale, 95% des valeurs sont comprises dans les deux écarts types de la moyenne de la population. Par conséquent, cette hypothèse de distribution normale et de limite centrale pour l'ensemble de données échantillon nous permet d'établir un seuil de signification de 5%. Cela a du sens car, dans cette hypothèse, il y a moins de 5% de probabilité (100-95) d'obtenir des valeurs aberrantes qui dépassent deux écarts-types par rapport à la moyenne de la population. Selon la nature des jeux de données, d'autres niveaux de signification peuvent être atteints à 1%, 5% ou 10%. Pour les calculs financiers (y compris la finance comportementale), la limite généralement acceptée est de 5%. Si nous trouvons des calculs qui vont au-delà des deux écarts-types habituels, nous avons un cas sérieux de valeurs aberrantes pour rejeter l'hypothèse nulle.

Graphiquement, il est représenté comme suit:

Dans l'exemple ci-dessus, si la moyenne de l'échantillon est beaucoup plus grande que 2% (disons 3, 5%), alors nous rejetons l'hypothèse nulle. L'hypothèse alternative (moyenne> 2%) est acceptée, ce qui confirme que le rendement quotidien moyen des actions est bien supérieur à 2%.

Cependant, si la moyenne de l'échantillon ne devrait pas être significativement supérieure à 2% (et reste à environ 2, 2%, par exemple), nous ne POUVONS PAS rejeter l'hypothèse nulle. Le défi consiste à savoir comment décider de tels cas. Pour tirer une conclusion à partir d'échantillons et de résultats sélectionnés, il convient de déterminer un niveau de signification permettant de conclure sur l'hypothèse nulle. L’hypothèse alternative permet d’établir le niveau de signification ou le concept de «valeur critique» pour décider de tels cas extrêmes.

Selon la définition standard du manuel, «une valeur critique est une valeur seuil qui définit les limites au-delà desquelles moins de 5% de la moyenne de l'échantillon peuvent être obtenus si l'hypothèse nulle est vraie. Les moyennes d'échantillon obtenues au-delà d'une valeur critique aboutissent à une décision de rejeter l'hypothèse nulle. "Dans l'exemple ci-dessus, si nous avons défini la valeur critique à 2, 1% et que la moyenne calculée atteint 2, 2%, nous rejetons l'hypothèse nulle. Une valeur critique établit une démarcation claire entre l'acceptation et le rejet.

Étape 3: Calculer la statistique

Cette étape implique le calcul du ou des chiffres requis, appelés statistiques de test (comme la moyenne, le score z, la valeur p, etc.) pour l'échantillon sélectionné. (Nous y reviendrons dans une section ultérieure.)

Étape 4: Conclusion

Avec la ou les valeurs calculées, décidez de l'hypothèse nulle. Si la probabilité d'obtenir une moyenne d'échantillon est inférieure à 5%, la conclusion est de rejeter l'hypothèse nulle. Sinon, acceptez et conservez l'hypothèse nulle.

Types d'erreurs

Il peut y avoir quatre résultats possibles dans la prise de décision basée sur un échantillon, en ce qui concerne l'applicabilité correcte à la population entière:

Décision de conserver


Décision de rejeter


S'applique à toute la population


Correct


Incorrect

(Erreur de TYPE 1 - a)


Ne s'applique pas à la population entière


Incorrect

(Erreur de TYPE 2 - b)


Correct


Les cas «corrects» sont ceux où les décisions prises sur les échantillons sont réellement applicables à l’ensemble de la population. Les cas d'erreurs surviennent lorsque l'on décide de conserver (ou de rejeter) l'hypothèse nulle basée sur des calculs d'échantillon, mais que cette décision ne s'applique pas vraiment à l'ensemble de la population. Ces cas constituent des erreurs de type 1 (alpha) et de type 2 (bêta), comme indiqué dans le tableau ci-dessus.

La sélection de la valeur critique correcte permet d’éliminer les erreurs alpha de type 1 ou de les limiter à une plage acceptable.

Alpha dénote l'erreur sur le niveau de signification et est déterminé par le chercheur. Pour maintenir le seuil de signification ou de confiance standard de 5% pour les calculs de probabilité, celui-ci est maintenu à 5%.

Selon les repères décisionnels et les définitions applicables:

  • «Ce critère (alpha) est généralement défini à 0, 05 (a = 0, 05) et nous comparons le niveau alpha à la valeur p. Lorsque la probabilité d'une erreur de type I est inférieure à 5% (p <0, 05), nous décidons de rejeter l'hypothèse nulle. sinon, on retient l'hypothèse nulle.
  • Le terme technique utilisé pour cette probabilité est la valeur p . Il est défini comme «la probabilité d'obtenir un résultat d'échantillon, étant donné que la valeur indiquée dans l'hypothèse nulle est vraie. La valeur p pour obtenir un résultat d'échantillon est comparée au niveau de signification. "
  • Une erreur de type II, ou erreur bêta, est définie comme «la probabilité de conserver de manière incorrecte l'hypothèse nulle, alors qu'en réalité elle ne s'applique pas à l'ensemble de la population».

Quelques exemples supplémentaires illustreront ceci et d’autres calculs.

Exemple 1

Il existe un programme d’investissement mensuel qui promet des rendements mensuels variables. Un investisseur n’y investira que s’il est assuré d’un revenu mensuel moyen de 180 $. Il a un échantillon de 300 mois de déclarations, ce qui représente une moyenne de 190 $ et un écart type de 75 $. Devrait-il ou elle investir dans ce régime ">

Réglons le problème. L’investisseur investira dans le système s’il est assuré du rendement moyen souhaité de 180 $.

H 0 : Hypothèse nulle: moyenne = 180

H 1 : Hypothèse alternative: moyenne> 180

Méthode 1: approche de la valeur critique

Identifiez une valeur critique X L pour la moyenne de l'échantillon, qui est suffisamment grande pour rejeter l'hypothèse nulle - c'est-à-dire rejeter l'hypothèse nulle si la moyenne de l'échantillon> = valeur critique X L

P (identifie une erreur alpha de type I) = P (rejette H 0 étant donné que H 0 est vrai),

Ceci serait atteint lorsque la moyenne de l'échantillon dépasse les limites critiques.

= P (étant donné que H 0 est vrai) = alpha

Graphiquement, il se présente comme suit:

En prenant alpha = 0, 05 (soit un seuil de signification de 5%), Z 0, 05 = 1, 645 (à partir du tableau Z ou du tableau de distribution normale)

=> X L = 180 + 1, 645 * (75 / sqrt (300)) = 187.12

Étant donné que la moyenne de l'échantillon (190) est supérieure à la valeur critique (187.12), l'hypothèse nulle est rejetée et la conclusion est que le rendement mensuel moyen est supérieur à 180 USD. L'investisseur peut donc envisager d'investir dans ce système.

Méthode 2: Utilisation de statistiques de test standardisées

On peut aussi utiliser la valeur normalisée z.

Statistique du test, Z = (moyenne de l'échantillon - moyenne de la population) / (std-dev / sqrt (nombre d'échantillons).

Ensuite, la région de rejet devient la suivante:

Z = (190 - 180) / (75 / sqrt (300)) = 2, 309

Notre région de rejet à un niveau de signification de 5% est Z> Z 0, 05 = 1, 645.

Puisque Z = 2, 309 est supérieur à 1, 645, l'hypothèse nulle peut être rejetée avec une conclusion similaire à celle mentionnée ci-dessus.

Méthode 3: Calcul de la valeur P

Notre objectif est d’identifier P (moyenne de l’échantillon> = 190, moyenne = 180).

= P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2.309) = 0.0084 = 0.84%

Le tableau ci-après permettant d'inférer les calculs de la valeur p conclut qu'il existe des preuves confirmées de rendements mensuels moyens supérieurs à 180:

valeur p


Inférence


Moins que 1%


Preuve confirmée supportant l'hypothèse alternative


entre 1% et 5%


Des preuves solides soutenant l'hypothèse alternative


entre 5% et 10%


Faible évidence supportant l'hypothèse alternative


plus de 10%


Aucune preuve soutenant l'hypothèse alternative


Exemple 2

Un nouveau courtier en valeurs mobilières (XYZ) affirme que ses frais de courtage sont inférieurs à ceux de votre courtier en valeurs mobilières actuel (ABC). Les données disponibles auprès d'une firme de recherche indépendante indiquent que la moyenne et la moyenne de tous les clients courtiers ABC sont de 18 $ et 6 $, respectivement.

Un échantillon de 100 clients de ABC est prélevé et les frais de courtage sont calculés avec les nouveaux taux du courtier XYZ. Si la moyenne de l'échantillon est de 18, 75 $ et que std-dev est identique (6 $), peut-on déduire de la différence entre la facture de courtage moyenne entre les courtiers ABC et XYZ ">

H 0 : Hypothèse nulle: moyenne = 18

H 1 : Hypothèse alternative: moyenne 18 (C'est ce que nous voulons prouver.)

Région de rejet: Z <= - Z 2, 5 et Z> = Z 2, 5 (en supposant un niveau de signification de 5%, diviser 2, 5 de chaque côté).

Z = (moyenne de l'échantillon - moyenne) / (std-dev / sqrt (nombre d'échantillons))

= (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25

Cette valeur Z calculée se situe entre les deux limites définies par:

- Z 2, 5 = -1, 96 et Z 2, 5 = 1, 96.

Ceci conclut que les preuves sont insuffisantes pour déduire qu'il existe une différence entre les taux de votre courtier existant et ceux du nouveau courtier.

Sinon, la valeur p = P (Z1.25)

= 2 * 0, 1056 = 0, 2112 = 21, 12%, ce qui est supérieur à 0, 05 ou 5%, conduisant à la même conclusion.

Graphiquement, il est représenté par ce qui suit:

Points de critique pour la méthode de test hypothétique:

  • Une méthode statistique basée sur des hypothèses
  • Sujet aux erreurs comme détaillé en termes d'erreurs alpha et bêta
  • L'interprétation de la valeur p peut être ambiguë, entraînant des résultats confus

Le résultat final

Les tests d'hypothèses permettent à un modèle mathématique de valider une revendication ou une idée avec un certain niveau de confiance. Cependant, comme la plupart des outils et modèles statistiques, il est limité par quelques limitations. L'utilisation de ce modèle pour prendre des décisions financières doit être considérée avec un sens critique, en gardant à l'esprit toutes les dépendances. Des méthodes alternatives telles que l’inférence bayésienne méritent également d’être explorées pour une analyse similaire.

Comparaison des comptes d'investissement Nom du fournisseur Description Divulgation par l'annonceur × Les offres figurant dans ce tableau proviennent de partenariats avec lesquels Investopedia reçoit une rémunération.
Recommandé
Laissez Vos Commentaires