Principal » trading algorithmique » Principes de base de la régression pour l'analyse commerciale

Principes de base de la régression pour l'analyse commerciale

trading algorithmique : Principes de base de la régression pour l'analyse commerciale

Si vous vous êtes déjà demandé comment deux données ou plus sont liées (par exemple, comment l'évolution du chômage et de l'inflation influe sur le PIB), ou si votre patron vous a déjà demandé de créer une prévision ou de l'analyser à l'aide de prévisions sur les relations entre les variables, l’apprentissage de l’analyse de régression vaudrait bien.

Dans cet article, vous apprendrez les bases de la régression linéaire simple, parfois appelée «régression des moindres carrés ordinaires» ou MCO - un outil couramment utilisé dans les prévisions et l'analyse financière. Nous allons commencer par apprendre les principes de base de la régression, d'abord sur la covariance et la corrélation, puis sur la création et l'interprétation d'un résultat de régression. Les logiciels de gestion courants tels que Microsoft Excel peuvent effectuer tous les calculs de régression et les sorties pour vous, mais il est toujours important d’apprendre les mécanismes sous-jacents.

Variables

La relation entre deux variables différentes, appelées variables dépendantes et indépendantes, est au cœur d’un modèle de régression. Supposons, par exemple, que vous souhaitiez prévoir les ventes de votre entreprise et que vous en concluiez que les ventes de votre entreprise montaient et descendaient en fonction de l'évolution du PIB.

Les ventes que vous prévoyez constitueraient la variable dépendante, car leur valeur "dépend" de la valeur du PIB et le PIB constituerait la variable indépendante. Vous devez ensuite déterminer la force de la relation entre ces deux variables afin de prévoir les ventes. Si le PIB augmente / diminue de 1%, de combien vos ventes vont-elles augmenter ou diminuer?

Covariance

Cov (x, y) = ∑ (xn-xu) (yn-yu) N \ begin {aligné} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ end {aligné} Cov (x, y) = ∑N (xn-xu) (yn -yu)

La formule permettant de calculer la relation entre deux variables est appelée covariance. Ce calcul vous indique la direction de la relation. Si une variable augmente et que l'autre variable tend également à augmenter, la covariance sera positive. Si une variable augmente et que l'autre tend à diminuer, la covariance est négative.

Le nombre réel obtenu en calculant ceci peut être difficile à interpréter car il n'est pas normalisé. Une covariance de cinq, par exemple, peut être interprétée comme une relation positive, mais la force de la relation ne peut être qualifiée de plus forte que si le nombre était de quatre ou plus faible que si le nombre était de six.

Coefficient de corrélation

Corrélation = ρxy = Covxysxsy \ begin {alignée} & Correlation = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {alignée} Correlation = ρxy = sx sy Covxy Un séjour sans faille

Nous devons normaliser la covariance afin de nous permettre de mieux l’interpréter et de l’utiliser dans les prévisions, le résultat étant le calcul de la corrélation. Le calcul de corrélation prend simplement la covariance et la divise par le produit de l'écart type des deux variables. Cela liera la corrélation entre une valeur de -1 et +1.

Une corrélation de +1 peut être interprétée comme suggérant que les deux variables se déplacent de manière parfaitement positive l'une avec l'autre et un -1 signifie qu'elles sont parfaitement corrélées négativement. Dans notre exemple précédent, si la corrélation était de +1 et que le PIB augmentait de 1%, les ventes augmenteraient de 1%. Si la corrélation est de -1, une augmentation de 1% du PIB entraînerait une diminution des ventes de 1% - exactement le contraire.

Équation de régression

Maintenant que nous savons comment la relation relative entre les deux variables est calculée, nous pouvons développer une équation de régression pour prévoir ou prédire la variable souhaitée. Vous trouverez ci-dessous la formule d'une régression linéaire simple. Le "y" est la valeur que nous essayons de prévoir, le "b" est la pente de la droite de régression, le "x" est la valeur de notre valeur indépendante et le "a" représente l'ordonnée à l'origine. L'équation de régression décrit simplement la relation entre la variable dépendante (y) et la variable indépendante (x).

y = bx + a \ début {aligné} & y = bx + a \\ \ fin {aligné} y = bx + a

L'interception, ou "a", est la valeur de y (variable dépendante) si la valeur de x (variable indépendante) est égale à zéro et est parfois simplement appelée "constante". Donc, s'il n'y avait pas de changement de PIB, votre entreprise ferait quand même des ventes - cette valeur, lorsque le changement de PIB est nul, est l'interception. Examinez le graphique ci-dessous pour voir une représentation graphique d'une équation de régression. Dans ce graphique, il n'y a que cinq points de données représentés par les cinq points du graphique. La régression linéaire tente d'estimer la droite qui correspond le mieux aux données (la droite la plus exacte) et l'équation de cette droite donne l'équation de régression.

Figure 1: Ligne de meilleur ajustement

Source: Investopedia

Régressions dans Excel

Maintenant que vous comprenez le contexte d'une analyse de régression, prenons un exemple simple en utilisant les outils de régression d'Excel. Nous allons nous appuyer sur l'exemple précédent d'essayer de prévoir les ventes de l'année prochaine en fonction de l'évolution du PIB. Le tableau suivant répertorie quelques points de données artificiels, mais ces chiffres peuvent être facilement accessibles dans la vie réelle.

AnnéeVentesPIB
20141001, 00%
20152501, 90%
20162752, 40%
20172002, 60%
20183002, 90%

En observant le tableau, vous pouvez voir qu'il y aura une corrélation positive entre les ventes et le PIB. Les deux ont tendance à monter ensemble. Avec Excel, il vous suffit de cliquer sur le menu déroulant Outils, de sélectionner Analyse de données, puis de choisir Régression . La boîte popup est facile à remplir à partir de là; votre plage en entrée Y correspond à votre colonne "Ventes" et votre plage en entrée X à la colonne de variation du PIB; choisissez la plage de sortie pour laquelle vous souhaitez que les données apparaissent sur votre feuille de calcul et appuyez sur OK. Vous devriez voir quelque chose de similaire à ce qui est donné dans le tableau ci-dessous:

Régression Statistiques Coefficients

Multiple R0.8292243Intercepter34.58409

R Carré


0, 687613PIB88.15552
Ajusté
R Carré


0, 583484

-


-


Erreur standard51.021807-

-


Observations5

-


-


Interprétation

Les principaux résultats à prendre en compte pour la régression linéaire simple sont le coefficient R-carré, le coefficient d'interception (constant) et le coefficient bêta (b) du PIB. Le nombre de R au carré dans cet exemple est de 68, 7% - cela montre avec quelle précision notre modèle prédit ou prévoit les ventes futures, ce qui suggère que les variables explicatives du modèle prédisaient 68, 7% de la variation de la variable dépendante. Ensuite, nous avons une interception de 34, 58, ce qui nous indique que si la variation du PIB devait être nulle, nos ventes seraient d’environ 35 unités. Enfin, le bêta ou coefficient de corrélation du PIB de 88, 15 nous indique que si le PIB augmente de 1%, les ventes augmenteront probablement d'environ 88 unités.

Le résultat final

Alors, comment utiliseriez-vous ce modèle simple dans votre entreprise ">

Bien sûr, il s’agit d’une simple régression et il existe des modèles que vous pouvez créer qui utilisent plusieurs variables indépendantes, appelées régressions linéaires multiples. Mais les régressions linéaires multiples sont plus compliquées et comportent plusieurs problèmes qui nécessiteraient un autre article à discuter.

Comparaison des comptes d'investissement Nom du fournisseur Description Divulgation par l'annonceur × Les offres figurant dans ce tableau proviennent de partenariats avec lesquels Investopedia reçoit une rémunération.
Recommandé
Laissez Vos Commentaires