Principal » trading algorithmique » Surajustement

Surajustement

trading algorithmique : Surajustement
Qu'est-ce que la suralimentation?

Le surajustement est une erreur de modélisation qui se produit lorsqu'une fonction est trop étroitement ajustée à un ensemble limité de points de données. Le surapprentissage du modèle consiste généralement à créer un modèle trop complexe pour expliquer les particularités des données à l’étude.

En réalité, les données souvent étudiées comportent un certain degré d'erreur ou de bruit aléatoire. Par conséquent, tenter de rendre le modèle trop proche de la conformité à des données légèrement inexactes peut infecter le modèle avec des erreurs substantielles et réduire son pouvoir prédictif.

[Important: les professionnels de la finance doivent toujours être conscients des risques liés à la sur-adaptation d'un modèle basé sur des données limitées.]

Comprendre le surajustement

Par exemple, un problème courant consiste à utiliser des algorithmes informatiques pour rechercher dans des bases de données exhaustives des données historiques du marché afin de trouver des modèles. Avec suffisamment d’études, il est souvent possible de développer des théorèmes élaborés qui semblent prédire avec une grande précision des choses telles que les rendements sur le marché boursier.

Cependant, lorsqu'ils sont appliqués à des données extérieures à l'échantillon, ces théorèmes peuvent probablement n'être que le sur-ajustement d'un modèle à ce qui n'était en réalité que des occurrences fortuites. Dans tous les cas, il est important de tester un modèle avec des données extérieures à l'échantillon utilisé pour le développer.

Points clés à retenir

  • Le surajustement est une erreur de modélisation qui se produit lorsqu'une fonction est trop étroitement ajustée à un ensemble limité de points de données.
  • Les professionnels de la finance doivent toujours être conscients des risques de suréquipement d’un modèle basé sur des données limitées.
Comparaison des comptes d'investissement Nom du fournisseur Description Divulgation par l'annonceur × Les offres figurant dans ce tableau proviennent de partenariats avec lesquels Investopedia reçoit une rémunération.

Termes connexes

Pourquoi l'importance statistique est-elle importante? La signification statistique fait référence à un résultat peu susceptible de se produire de manière aléatoire mais pouvant plutôt être attribué à une cause spécifique. plus Fonctionnement du lissage des données Le lissage des données est effectué à l'aide d'un algorithme permettant de supprimer le bruit d'un ensemble de données. Cela permet de dégager des motifs importants. Le lissage des données peut être utilisé pour aider à prévoir les tendances, telles que celles trouvées dans les prix des titres. more Sample Un échantillon est une version plus petite et plus gérable d'un groupe plus important. Les échantillons sont utilisés dans les tests statistiques lorsque la taille de la population est trop importante. more Hétéroscédasticité En statistique, l'hétéroscédasticité se produit lorsque les écarts-types d'une variable, surveillés sur une période de temps donnée, sont non constants. plus Lire dans l'échantillonnage aléatoire stratifié L'échantillonnage aléatoire stratifié est une méthode d'échantillonnage qui consiste à diviser une population en groupes plus petits, appelés strates. more Fonctionnement des échantillons aléatoires simples Un échantillon aléatoire simple est un sous-ensemble d'une population statistique dans lequel chaque membre du sous-ensemble a une probabilité égale d'être choisi. Un échantillon aléatoire simple est censé être une représentation non biaisée d'un groupe. plus de liens partenaires
Recommandé
Laissez Vos Commentaires