Principal » trading algorithmique » Somme des carrés

Somme des carrés

trading algorithmique : Somme des carrés
Quelle est la somme des carrés?

La somme des carrés est une technique statistique utilisée dans l'analyse de régression pour déterminer la dispersion des points de données. Dans une analyse de régression, l'objectif est de déterminer dans quelle mesure une série de données peut être adaptée à une fonction susceptible d'expliquer comment la série de données a été générée. La somme des carrés est utilisée comme moyen mathématique pour trouver la fonction qui correspond le mieux (varie le moins) aux données.

La formule pour la somme des carrés est

Pour un ensemble X de n éléments: Somme des carrés = i = 0n (Xi − X‾) 2 où: Xi = Le ième élément de l'ensemble X‾ = La moyenne de tous les éléments de l'ensemble (Xi − X‾) = L'écart de chaque élément par rapport à la moyenne \ begin {aligné} & \ text {Pour un ensemble} X \ text {de} n \ text {items:} \\ & \ text {Somme des carrés} = \ sum_ {i = 0} ^ {n} \ left (X_i- \ overline {X} \ right) ^ 2 \\ & \ textbf {où:} \\ & X_i = \ text {Le} i ^ {th} \ text {item du set} \\ & \ overline {X} = \ text {La moyenne de tous les éléments de l'ensemble} \\ & \ left (X_i- \ overline {X} \ right) = \ text {L'écart de chaque élément du mean} \\ \ end {aligné} Pour un ensemble X de n éléments: Somme des carrés = i = 0∑n (Xi −X) 2where: Xi = Le ième élément de l'ensemble x = La moyenne de tous éléments de l'ensemble (Xi −X) = écart par rapport à la moyenne de chaque élément

La somme des carrés est également appelée variation.

Que vous dit la somme des carrés?

La somme des carrés est une mesure de l'écart par rapport à la moyenne. En statistique, la moyenne est la moyenne d'un ensemble de nombres et constitue la mesure de tendance centrale la plus couramment utilisée. La moyenne arithmétique est simplement calculée en faisant la somme des valeurs de l'ensemble de données et en la divisant par le nombre de valeurs.

Supposons que les prix de clôture de Microsoft (MSFT) au cours des cinq derniers jours étaient de 74, 01, 74, 77, 73, 94, 73, 61 et 73, 40 en dollars américains. La somme des prix totaux est de 369, 73 dollars et le prix moyen ou moyen du manuel serait donc de 369, 73 dollars / 5 = 73, 95 dollars.

Mais connaître la moyenne d'un ensemble de mesures ne suffit pas toujours. Parfois, il est utile de connaître l'ampleur de la variation dans un ensemble de mesures. La distance qui sépare les valeurs individuelles de la moyenne peut donner une idée de la pertinence des observations ou des valeurs par rapport au modèle de régression créé.

Par exemple, si un analyste souhaite savoir si le cours de l'action de MSFT évolue de pair avec celui de Apple (AAPL), il peut répertorier l'ensemble des observations relatives au processus de traitement des deux actions pendant une certaine période, par exemple 1, 2., ou 10 ans et créez un modèle linéaire avec chacune des observations ou des mesures enregistrées. Si la relation entre les deux variables (à savoir, le prix de l'AAPL et le prix de MSFT) n'est pas une ligne droite, il y a des variations dans l'ensemble de données qui doivent être examinées.

En termes statistiques, si la ligne dans le modèle linéaire créé ne passe pas par toutes les mesures de valeur, alors une partie de la variabilité observée dans les prix des actions est inexpliquée. La somme des carrés est utilisée pour calculer s'il existe une relation linéaire entre deux variables, et toute variabilité inexpliquée est appelée la somme résiduelle des carrés.

La somme des carrés est la somme du carré de la variation, la variation étant définie comme l'écart entre chaque valeur individuelle et la moyenne. Pour déterminer la somme des carrés, la distance entre chaque point de données et la droite de meilleur ajustement est carré puis additionnée. La ligne de meilleur ajustement minimisera cette valeur.

Comment calculer la somme des carrés

Vous pouvez maintenant voir pourquoi la mesure s'appelle la somme des écarts carrés, ou la somme des carrés en abrégé. En utilisant notre exemple MSFT ci-dessus, la somme des carrés peut être calculée comme suit:

  • SS = (74.01 - 73.95) 2 + (74.77 - 73.95) 2 + (73.94 - 73.95) 2 + (73.61 - 73.95) 2 + (73.40 - 73.95) 2
  • SS = (0, 06) 2 + (0, 82) 2 + (-0, 01) 2 + (-0, 34) 2 + (-0, 55) 2
  • SS = 1, 0942

L'ajout de la somme des déviations seule sans quadrature donnera un nombre égal ou proche de zéro car les déviations négatives compenseront presque parfaitement les déviations positives. Pour obtenir un nombre plus réaliste, la somme des écarts doit être mise au carré. La somme des carrés sera toujours un nombre positif car le carré de tout nombre, qu'il soit positif ou négatif, est toujours positif.

Exemple d'utilisation de la somme des carrés

D'après les résultats du calcul MSFT, une somme élevée de carrés indique que la plupart des valeurs sont plus éloignées de la moyenne, ce qui entraîne une grande variabilité dans les données. Une faible somme de carrés fait référence à une faible variabilité dans l'ensemble des observations.

Dans l'exemple ci-dessus, 1.0942 montre que la variabilité du prix des actions de MSFT au cours des cinq derniers jours est très faible et que les investisseurs souhaitant investir dans des actions caractérisées par la stabilité des prix et une faible volatilité peuvent opter pour MSFT.

Points clés à retenir

  • La somme des carrés mesure l'écart des points de données par rapport à la valeur moyenne.
  • Un résultat de la somme des carrés plus élevé indique un degré élevé de variabilité au sein de l'ensemble de données, tandis qu'un résultat plus faible indique que les données varient considérablement de la valeur moyenne.

Limites d'utilisation de la somme des carrés

Prendre une décision d'investissement quant au stock à acheter nécessite beaucoup plus d'observations que celles énumérées ici. Un analyste peut avoir à travailler avec des années de données pour savoir avec une certitude accrue à quel point la variabilité d’un actif est élevée ou faible. À mesure que plus de points de données sont ajoutés à l'ensemble, la somme des carrés augmente à mesure que les valeurs sont plus dispersées.

Les mesures de variation les plus largement utilisées sont l’écart type et la variance. Cependant, pour calculer l'une ou l'autre des deux mesures, il faut d'abord calculer la somme des carrés. La variance est la moyenne de la somme des carrés (c'est-à-dire la somme des carrés divisée par le nombre d'observations). L'écart-type est la racine carrée de la variance.

Il existe deux méthodes d’analyse de régression qui utilisent la somme des carrés: la méthode des moindres carrés linéaires et la méthode des moindres carrés non linéaires. La méthode des moindres carrés fait référence au fait que la fonction de régression minimise la somme des carrés de la variance à partir des points de données réels. De cette manière, il est possible de dessiner une fonction qui correspond statistiquement au meilleur ajustement pour les données. Notez qu'une fonction de régression peut être linéaire (une ligne droite) ou non linéaire (une ligne courbe).

Comparaison des comptes d'investissement Nom du fournisseur Description Divulgation par l'annonceur × Les offres figurant dans ce tableau proviennent de partenariats avec lesquels Investopedia reçoit une rémunération.

Termes connexes

Fonctionnement de la méthode des moindres carrés La méthode des moindres carrés est une technique statistique permettant de déterminer la droite de meilleur ajustement pour un modèle, spécifiée par une équation avec certains paramètres aux données observées. more Fonctionnement de la méthode du critère des moindres carrés Le critère des moindres carrés est une méthode permettant de mesurer la précision d'une ligne en décrivant les données qui ont été utilisées pour la générer. C'est-à-dire que la formule détermine la ligne de meilleur ajustement. plus Définition de l'écart type L'écart type est une statistique qui mesure la dispersion d'un jeu de données par rapport à sa moyenne et est calculée à la racine carrée de la variance. Il est calculé comme la racine carrée de la variance en déterminant la variation entre chaque point de données par rapport à la moyenne. more Utilisation de l'équation de variance La variance est une mesure de l'écart entre les nombres d'un ensemble de données. Les investisseurs utilisent l'équation de la variance pour évaluer la répartition de l'actif d'un portefeuille. plus Fonctionnement de l'écart-type résiduel L'écart-type résiduel est un terme statistique utilisé pour décrire la différence entre les écarts-types des valeurs observées et des valeurs prédites, comme indiqué par les points d'une analyse de régression. plus Fonctionnement du coefficient de détermination Le coefficient de détermination est une mesure utilisée en analyse statistique pour évaluer dans quelle mesure un modèle explique et prévoit les résultats futurs. plus de liens partenaires
Recommandé
Laissez Vos Commentaires