Surajustement
Qu'est-ce que la suralimentation?Le surajustement est une erreur de modélisation qui se produit lorsqu'une fonction est trop étroitement ajustée à un ensemble limité de points de données. Le surapprentissage du modèle consiste généralement à créer un modèle trop complexe pour expliquer les particularités des données à l’étude.
En réalité, les données souvent étudiées comportent un certain degré d'erreur ou de bruit aléatoire. Par conséquent, tenter de rendre le modèle trop proche de la conformité à des données légèrement inexactes peut infecter le modèle avec des erreurs substantielles et réduire son pouvoir prédictif.
[Important: les professionnels de la finance doivent toujours être conscients des risques liés à la sur-adaptation d'un modèle basé sur des données limitées.]
Comprendre le surajustement
Par exemple, un problème courant consiste à utiliser des algorithmes informatiques pour rechercher dans des bases de données exhaustives des données historiques du marché afin de trouver des modèles. Avec suffisamment d’études, il est souvent possible de développer des théorèmes élaborés qui semblent prédire avec une grande précision des choses telles que les rendements sur le marché boursier.
Cependant, lorsqu'ils sont appliqués à des données extérieures à l'échantillon, ces théorèmes peuvent probablement n'être que le sur-ajustement d'un modèle à ce qui n'était en réalité que des occurrences fortuites. Dans tous les cas, il est important de tester un modèle avec des données extérieures à l'échantillon utilisé pour le développer.
Points clés à retenir
- Le surajustement est une erreur de modélisation qui se produit lorsqu'une fonction est trop étroitement ajustée à un ensemble limité de points de données.
- Les professionnels de la finance doivent toujours être conscients des risques de suréquipement d’un modèle basé sur des données limitées.