Principal » trading algorithmique » Définition de statistique de Durbin Watson

Définition de statistique de Durbin Watson

trading algorithmique : Définition de statistique de Durbin Watson
Quelle est la statistique de Durbin Watson?

La statistique Durbin Watson (DW) est un test d'autocorrélation dans les résidus d'une analyse de régression statistique. La statistique Durbin-Watson aura toujours une valeur comprise entre 0 et 4. Une valeur de 2, 0 signifie qu'il n'y a pas d'autocorrélation détectée dans l'échantillon. Les valeurs de 0 à moins de 2 indiquent une autocorrélation positive et les valeurs de 2 à 4, une autocorrélation négative.

Une action affichant une autocorrélation positive indiquerait que le prix d'hier a une corrélation positive sur le prix d'aujourd'hui. Par conséquent, si l'action chutait hier, il est également probable qu'elle chute aujourd'hui. Une sécurité qui a une autocorrélation négative, en revanche, a une influence négative sur elle-même au fil du temps - de sorte que si elle tombait hier, elle aurait plus de chances de s’augmenter aujourd'hui.

Points clés à retenir

  • La statistique Durbin Watson est un test d'autocorrélation dans un ensemble de données.
  • La statistique DW a toujours une valeur comprise entre zéro et 4, 0.
  • Une valeur de 2, 0 signifie qu'il n'y a pas d'autocorrélation détectée dans l'échantillon. Les valeurs de zéro à 2, 0 indiquent une autocorrélation positive et les valeurs de 2, 0 à 4, 0, une autocorrélation négative.
  • L'autocorrélation peut être utile dans l'analyse technique, qui s'intéresse plus particulièrement aux tendances des prix des titres de sécurité en utilisant des techniques de cartographie au lieu de la santé financière ou de la gestion d'une entreprise.

Les bases de la statistique de Durbin Watson

L'autocorrélation, également appelée corrélation série, peut constituer un problème important pour l'analyse des données historiques si on ne sait pas en prendre connaissance. Par exemple, étant donné que les cours des actions ne tendent pas à changer de manière trop radicale d’un jour à l’autre, les prix d’un jour à l’autre pourraient être potentiellement fortement corrélés, même s’il existe peu d’informations utiles dans cette observation. Afin d’éviter les problèmes d’autocorrélation, la solution la plus simple en finance consiste simplement à convertir une série de prix historiques en une série de variations de prix en pourcentage au jour le jour.

L'autocorrélation peut être utile pour l'analyse technique, qui s'intéresse plus particulièrement aux tendances des prix des valeurs mobilières et aux relations entre ces derniers, en utilisant des techniques de cartographie au lieu de la santé financière ou de la gestion d'une entreprise. Les analystes techniques peuvent utiliser l'autocorrélation pour déterminer l'impact des prix passés pour un titre sur son prix futur.

La statistique Durbin Watson doit son nom aux statisticiens James Durbin et Geoffrey Watson.

L'autocorrélation peut indiquer s'il existe un facteur momentum associé à un stock. Par exemple, si vous savez qu'un stock a historiquement une valeur d'autocorrélation positive élevée et que vous avez constaté que le titre a réalisé de solides gains au cours des derniers jours, vous pouvez raisonnablement vous attendre à ce que les mouvements des prochains jours (la série chronologique principale) correspondent ceux de la série temporelle en retard et à la hausse.

Exemple de la statistique Durbin Watson

La formule de la statistique Durbin Watson est assez complexe, mais implique les résidus d'une régression des moindres carrés ordinaires sur un ensemble de données. L'exemple suivant montre comment calculer cette statistique.

Supposons les points de données (x, y) suivants:

Paire Un = (10, 1, 100) Paire Deux = (20, 1 200) Paire Trois = (35, 985) Paire Quatre = (40 750) Paire Cinq = (50, 1 215) Paire Six = (45, 1 000) \ begin {alignés} & \ text {Pair One} = \ left ({10}, {1.100} \ right) \\ & \ text {Pair Two} = \ left ({20}, {1, 200} \ right) \\ & \ text { Pair Three} = \ left ({35}, {985} \ right) \\ & \ text {Pair Four} = \ left ({40}, {750} \ right) \\ & \ text {Pair Five} = \ left ({50}, {1, 215} \ right) \\ & \ text {Pair Six} = \ left ({45}, {1, 000} \ right) \\ \ end {aligné} Pair 1 = (10, 1 100) paire deux = (20, 1 200) paire trois = (35 985) paire quatre = (40 750) paire cinq = (50, 1 215) paire six = (45, 1 000)

En utilisant les méthodes de la régression des moindres carrés pour trouver la "ligne de meilleur ajustement", l'équation de la droite de meilleur ajustement de cette donnée est la suivante:

Y = −2, 6268x + 1 129, 2Y = {- 2, 6268} x + {1 129, 2} Y = −2, 6268x + 1 129, 2

La première étape du calcul de la statistique de Durbin Watson consiste à calculer les valeurs "y" attendues à l'aide de la droite de la meilleure équation. Pour cet ensemble de données, les valeurs "y" attendues sont les suivantes:

AttenduY (1) = (- 2, 6268 × 10) + 1 129, 2 = 1 102, 9ExpectableY (2) = (- 2, 6268 × 20) + 1 129, 2 = 1 076, 7ExpectéY (3) = (- 2, 6268 × 35) + 1 129, 22 = 1 037, 3ExpectedY (4) = (- 2.6268 × 40) + 1.129.2 = 1.024.1ExpectéY (5) = (- 2.6268 × 50) + 1.129.2 = 997.9ExpectéY (6) = (- 2.6268 × 45) + 1.129.2 = 1.011 \ begin {aligné} & \ text { Attendu} Y \ left ({1} \ right) = \ left (- {2.6268} \ times {10} \ right) + {1, 129.2} = {1, 102.9} \\ & \ text {Attendu} Y \ left ({2 } \ right) = \ left (- {2.6268} \ times {20} \ right) + {1129.2} = {1 076, 7} \\ & \ text {Attendu} Y \ left ({3} \ right) = \ left ( - {2.6268} \ times {35} \ right) + {1, 129.2} = {1, 037.3} \\ & \ text {Attendu} Y \ left ({4} \ right) = \ left (- {2.6268} \ times {40 } \ right) + {1, 129.2} = {1.024.1} \\ & \ text {Attendu} Y \ left ({5} \ right) = \ left (- {2.6268} \ times {50} \ right) + {1, 129.2} = {997.9} \\ & \ text {Attendu} Y \ left ({6} \ right) = \ left (- {2.6268} \ times {45} \ right) + {1129.2} = {1 011} \\ \ end {aligné} AttenduY (1) = (- 2, 6268 × 10) + 1 129, 2 = 1 102, 9ExpectableY (2) = (- 2, 6268 × 20) + 1 129, 2 = 1 076, 7Expecté (3) = (- 2, 6268 × 35) + 1 129, 2 = 1 037, 3ExpectedY (4) = (- 2, 6268 × 40) + 1 129, 2 = 1 024, 1 AttenduY (5) = (- 2, 6268 × 50) + 1 129, 2 = 997, 9AttenduY (6) = (- 2, 6268 × 45) + 1 129, 2 = 1 011

Ensuite, les différences entre les valeurs "y" réelles et les valeurs "y" attendues, les erreurs, sont calculées:

Erreur (1) = (1 100−1, 102, 9) = - 2, 9Erreur (2) = (1 200−1, 076, 7) = 123, 3Erreur (3) = (985−1, 037, 3) = - 52, 3Erreur (4) = (750−1, 024, 1) = −274.1Error (5) = (1.215−997.9) = 217.1Error (6) = (1, 000−1, 011) = - 11 \ begin {aligné} & \ text {Erreur} \ left ({1} \ right) = \ left ({1.100} - {1.102.9} \ right) = {- 2.9} \\ & \ text {Error} \ left ({2} \ right) = \ left ({1, 200} - {1 076, 7} \ right) = {123, 3 } \\ & \ text {Error} \ left ({3} \ right) = \ left ({985} - {1 037, 3} \ right) = {- 52, 3} \\ & \ text {Error} \ left ({4 } \ right) = \ left ({750} - {1.024.1} \ right) = {- 274.1} \\ & \ text {Error} \ left ({5} \ right) = \ left ({1, 215} - {997.9 } \ right) = {217.1} \\ & \ text {Error} \ left ({6} \ right) = \ left ({1 000} - {1 011} \ right) = {- 11} \\ \ end {aligné } Erreur (1) = (1 100−1, 102, 9) = - 2, 9Erreur (2) = (1 200−1, 076, 7) = 123, 3Erreur (3) = (985−1, 037, 3) = - 52, 3Erreur (4) = (750−1, 024.1) = −274.1Error (5) = (1.215−997.9) = 217.1Error (6) = (1, 000−1, 011) = - 11

Ensuite, ces erreurs doivent être corrigées et résumées:

Somme des erreurs au carré = (- - 2, 92 + 123, 32 + - 52, 32 + −274, 12 + 217, 12 + −112) = 140 330, 81 \ begin {aligné} & \ text {Somme des erreurs au carré =} \\ & \ left ({- 2.9} ^ {2} + {123.3} ^ {2} + {- 52, 3} ^ {2} + {- 274, 1} ^ {2} + {217.1} ^ {2} + {- 11} ^ {2} \ droite) = \\ & {140, 330.81} \\ & \ text {} \\ \ end {aligné} Somme des erreurs carrées = (- 2, 92 + 123, 32 + −52, 32 + −274.12 + 217.12 + −112) = 140 330, 81

Ensuite, la valeur de l'erreur moins l'erreur précédente est calculée et mise au carré:

Différence (1) = (123, 3 - (- 2, 9)) = 126, 2 Différence (2) = (- 52, 3−123, 3) = - 175, 6 Différence (3) = (- 274, 1 - (- 52, 3)) = - 221, 9 Différence (4 ) = (217.1 - (- 274.1)) = 491.3Différence (5) = (- 11-217.1) = - 228.1Sum de différences Carré = 389.406.71 \ begin {aligné} & \ text {Différence} \ left ({1} \ right) = \ left ({123.3} - \ left ({- 2, 9} \ right) \ right) = {126.2} \\ & \ text {Différence} \ left ({2} \ right) = \ left ({- 52.3} - {123.3} \ right) = {- 175.6} \\ & \ text {Différence} \ left ({3} \ right) = \ left ({-274.1} - \ left ({- 52.3} \ right) \ right) = {- 221.9} \\ & \ text {Difference} \ left ({4} \ right) = \ left ({217.1} - \ left ({- 274.1} \ right) \ right) = {491.3} \\ & \ text {Différence} \ left ({5} \ right) = \ left ({-11} - {217.1} \ right) = {- 228.1} \\ & \ text {Somme des différences carrée} = { 389, 406, 71} \\ \ end {alignés} Différence (1) = (123, 3 - (- 2, 9)) = 126, 2 Différence (2) = (- 52, 3−123, 3) = - 175, 6 Différence (3) = (- 274, 1 - (- 52, 3)) = - 221, 9 Différence (4) = (217, 1 - (- 274, 1)) = 491, 3 Différence (5) = (- 11−217, 1) = - 228, 1Me carré des différences = 389, 406, 71

Enfin, la statistique Durbin Watson est le quotient des valeurs au carré:

Durbin Watson = 389, 406, 71 / 140, 330, 81 = 2, 77 \ text {Durbin Watson} = {389, 406, 71} / {140, 330, 81} = {2, 77} Durbin Watson = 389, 406, 71 / 140, 330, 81 = 2.77

Une règle empirique est que les valeurs statistiques de test dans la plage de 1, 5 à 2, 5 sont relativement normales. Toute valeur en dehors de cette plage peut être une source de préoccupation. La statistique Durbin – Watson, bien que affichée par de nombreux programmes d'analyse de régression, n'est pas applicable dans certaines situations. Par exemple, lorsque des variables dépendantes retardées sont incluses dans les variables explicatives, il est alors inapproprié d'utiliser ce test.

Comparaison des comptes d'investissement Nom du fournisseur Description Divulgation par l'annonceur × Les offres figurant dans ce tableau proviennent de partenariats avec lesquels Investopedia reçoit une rémunération.

Termes connexes

Ce que nous apprend la corrélation inverse Une corrélation inverse, également appelée corrélation négative, est une relation opposée entre deux variables telles qu'elles se déplacent dans des directions opposées. plus Fonctionnement de l'écart-type résiduel L'écart-type résiduel est un terme statistique utilisé pour décrire la différence entre les écarts-types des valeurs observées et des valeurs prédites, comme indiqué par les points d'une analyse de régression. more Fonctionnement de la méthode haut-bas Dans la comptabilité analytique, la méthode haut-bas permet de séparer les coûts fixes des coûts variables en fonction d'un volume de données limité. plus Ce que la probabilité conjointe nous dit La probabilité conjointe est une mesure statistique qui calcule la probabilité que deux événements se produisent ensemble et au même moment. La probabilité conjointe est la probabilité que l'événement Y se produise au même moment où l'événement X se produit. plus Comment une convention de taux future - La FRA couvre-t-elle les taux d’intérêt Les conventions de taux futurs sont des contrats de gré à gré entre parties qui déterminent le taux d’intérêt à payer à une date ultérieure convenue. more Fonctionnement de la régression linéaire multiple La régression linéaire multiple (MLR) est une technique statistique qui utilise plusieurs variables explicatives pour prédire l’issue d’une variable de réponse. plus de liens partenaires
Recommandé
Laissez Vos Commentaires