Principal » les chefs d'entreprise » Homoscédastique

Homoscédastique

les chefs d'entreprise : Homoscédastique
DÉFINITION DE Homoscédastique

Homoscédastique (également appelé "homoscédastique") fait référence à une condition dans laquelle la variance du résidu, ou terme d'erreur, dans un modèle de régression est constante. Autrement dit, le terme d'erreur ne varie pas beaucoup lorsque la valeur de la variable de prédicteur change. L'homoscédasticité est une hypothèse de la modélisation par régression linéaire. Si la variance des erreurs autour de la droite de régression varie beaucoup, le modèle de régression peut être mal défini. Le manque d'homoskédasticité peut suggérer que le modèle de régression peut avoir besoin d'inclure d'autres variables prédictives pour expliquer la performance de la variable dépendante.

Le contraire de l'homoscédasticité est l'hétéroscédasticité, tout comme l'opposé de "homogène" est "hétérogène". L'hétéroscédasticité fait référence à une condition dans laquelle la variance du terme d'erreur dans une équation de régression n'est pas constante.

Rompre Homoscédastique

Un modèle de régression simple, ou équation, est composé de quatre termes. Sur le côté gauche se trouve la variable dépendante. Il représente le phénomène que le modèle cherche à "expliquer". Sur le côté droit se trouvent une constante, une variable prédictive et un terme résiduel ou erreur. Le terme d'erreur indique la quantité de variabilité dans la variable dépendante qui n'est pas expliquée par la variable de prédicteur.

Exemple d'homoscédasticité

Par exemple, supposons que vous vouliez expliquer les résultats des tests des élèves en utilisant le temps que chaque élève a passé à étudier. Dans ce cas, les résultats du test seraient la variable dépendante et le temps passé à étudier serait la variable prédictive. Le terme d'erreur indiquerait la quantité de variance dans les résultats du test qui n'était pas expliquée par la quantité de temps à étudier. Si cette variance est uniforme ou homogène, cela donnerait à penser que le modèle peut fournir une explication adéquate des performances du test, en termes de temps passé à étudier.

Mais la variance peut être hétéroscédastique. Un graphique des données du terme d'erreur peut montrer qu'une grande quantité de temps d'étude correspond très étroitement à des scores de test élevés, mais que les scores de test aux temps d'étude faibles varient considérablement et incluent même des scores très élevés. Ainsi, la variance des scores ne serait pas bien expliquée par une seule variable prédictive - la quantité de temps à étudier. Dans ce cas, un autre facteur est probablement à l'œuvre et le modèle devra peut-être être amélioré. Une enquête plus approfondie pourrait révéler que certains étudiants avaient déjà vu les réponses au test et n'avaient donc pas besoin d'étudier.

Pour améliorer le modèle de régression, le chercheur ajouterait donc une autre variable explicative indiquant si un élève avait vu les réponses avant le test. Le modèle de régression aurait alors deux variables explicatives - le temps passé à étudier et si l'étudiant avait une connaissance préalable des réponses. Avec ces deux variables, une plus grande partie de la variance des scores au test serait expliquée et la variance du terme d'erreur pourrait alors être homogène, suggérant que le modèle était bien défini.

Comparaison des comptes d'investissement Nom du fournisseur Description Divulgation par l'annonceur × Les offres figurant dans ce tableau proviennent de partenariats avec lesquels Investopedia reçoit une rémunération.

Termes connexes

Hétéroscédasticité En statistique, l'hétéroscédasticité se produit lorsque les écarts-types d'une variable, surveillés sur une période donnée, sont non constants. plus Qu'est-ce qu'un terme d'erreur? Un terme d'erreur est défini comme une variable dans un modèle statistique, qui est créé lorsque le modèle ne représente pas complètement la relation réelle entre les variables indépendantes et dépendantes. more Heteroskedastic Heteroskedastic fait référence à une condition dans laquelle la variance du terme résiduel, ou terme d'erreur, dans un modèle de régression varie considérablement. more Fonctionnement de la régression linéaire multiple La régression linéaire multiple (MLR) est une technique statistique qui utilise plusieurs variables explicatives pour prédire l’issue d’une variable de réponse. plus R au carré Le R au carré est une mesure statistique qui représente la proportion de la variance pour une variable dépendante expliquée par une variable indépendante. more Fonctionnement de la méthode des moindres carrés La méthode des moindres carrés est une technique statistique permettant de déterminer la droite de meilleur ajustement pour un modèle, spécifiée par une équation avec certains paramètres aux données observées. plus de liens partenaires
Recommandé
Laissez Vos Commentaires