Principal » trading algorithmique » Statistiques non paramétriques

Statistiques non paramétriques

Que sont les statistiques non paramétriques?

Les statistiques non paramétriques font référence à une méthode statistique dans laquelle les données ne sont pas nécessaires pour correspondre à une distribution normale. Les statistiques non paramétriques utilisent des données souvent ordinales, ce qui signifie qu’elles ne reposent pas sur des nombres, mais sur un classement ou un ordre de tri. Par exemple, une enquête exprimant les préférences des consommateurs allant de l’aimant au non-aimé serait considérée comme une donnée ordinale.

Les statistiques non paramétriques comprennent les statistiques descriptives non paramétriques, les modèles statistiques, l'inférence et les tests statistiques. La structure de modèle des modèles non paramétriques n'est pas spécifiée à priori mais est déterminée à partir de données. Le terme non paramétrique ne signifie pas que de tels modèles manquent complètement de paramètres, mais plutôt que le nombre et la nature des paramètres sont flexibles et non fixés à l'avance. Un histogramme est un exemple d'estimation non paramétrique d'une distribution de probabilité.

Comprendre les statistiques non paramétriques

En statistique, la statistique paramétrique comprend des paramètres tels que la moyenne, la médiane, l'écart type, la variance, etc. Cette forme de statistique utilise les données observées pour estimer les paramètres de la distribution. En statistique paramétrique, on suppose que les données correspondent à une distribution normale avec des paramètres inconnus, μ (moyenne de la population) et σ ² (variance de la population), qui sont ensuite estimés à l'aide de la moyenne et de la variance de l'échantillon.

Les statistiques non paramétriques ne font aucune hypothèse sur la taille de l'échantillon ni sur le caractère quantitatif des données observées.

Les statistiques non paramétriques ne supposent pas que les données proviennent d'une distribution normale. Au lieu de cela, la forme de la distribution est estimée sous cette forme de mesure statistique. Bien qu'il existe de nombreuses situations dans lesquelles une distribution normale peut être supposée, il existe également des scénarios dans lesquels il ne sera pas possible de déterminer si les données seront distribuées normalement.

Exemples de statistiques non paramétriques

Dans le premier exemple, considérons un chercheur qui souhaite une estimation du nombre de bébés nés aux yeux bruns en Amérique du Nord peut décider de prélever un échantillon de 150 000 bébés et d’analyser l’ensemble de données. La mesure obtenue servira d'estimation de l'ensemble de la population de bébés aux yeux bruns nés l'année suivante.

Pour un deuxième exemple, considérons un chercheur différent qui veut savoir si le fait de se coucher tôt ou tard est lié à la fréquence à laquelle on tombe malade. En supposant que l'échantillon soit choisi au hasard dans la population, on peut supposer que la distribution de la taille de l'échantillon de la fréquence des maladies est normale. Cependant, une expérience qui mesure la résistance du corps humain à une souche de bactérie ne peut pas être supposée avoir une distribution normale.

En effet, un échantillon de données sélectionné de manière aléatoire peut être une résistance à la souche. D'autre part, si le chercheur prend en compte des facteurs tels que la constitution génétique et l'origine ethnique, il peut constater qu'une taille d'échantillon sélectionnée à l'aide de ces caractéristiques peut ne pas être résistante à la souche. Par conséquent, on ne peut pas supposer une distribution normale.

Cette méthode est utile lorsque les données ne sont pas interprétées numériquement clairement et qu’il est préférable de l’utiliser avec des données présentant un classement. Par exemple, un test d'évaluation de la personnalité peut avoir un classement de ses mesures défini comme fortement en désaccord, en désaccord, indifférent, en accord et tout à fait d'accord. Dans ce cas, les méthodes non paramétriques doivent être utilisées.

Considérations particulières

Les statistiques non paramétriques ont été mieux appréciées en raison de leur facilité d'utilisation. À mesure que les besoins en paramètres sont évités, les données deviennent plus applicables à une plus grande variété de tests. Ce type de statistiques peut être utilisé sans la moyenne, la taille de l'échantillon, l'écart type ou l'estimation de tout autre paramètre associé lorsqu'aucune de ces informations n'est disponible.

Étant donné que les statistiques non paramétriques émettent moins d'hypothèses sur les données de l'échantillon, leur application a une portée plus étendue que les statistiques paramétriques. Dans les cas où les tests paramétriques sont plus appropriés, les méthodes non paramétriques seront moins efficaces. En effet, les résultats obtenus à partir de statistiques non paramétriques ont un degré de confiance inférieur à celui obtenu si les résultats étaient obtenus à l'aide de statistiques paramétriques.

Points clés à retenir

Les statistiques non paramétriques sont faciles à utiliser mais n'offrent pas la précision exacte d'autres modèles statistiques.
Ce type d’analyse convient mieux pour déterminer l’ordre des résultats, même si les données numériques changent, les résultats resteront probablement les mêmes.

Comparaison des comptes d'investissement Nom du fournisseur Description Divulgation par l'annonceur × Les offres figurant dans ce tableau proviennent de partenariats avec lesquels Investopedia reçoit une rémunération.

Termes connexes

Comprendre la distribution T La distribution AT est un type de fonction de probabilité approprié pour estimer les paramètres de population pour des échantillons de petite taille ou des variances inconnues. more Fonctionnement de la distribution d'échantillonnage Une distribution d'échantillonnage est une distribution de probabilité d'une statistique obtenue à partir d'un grand nombre d'échantillons prélevés dans une population spécifique. plus Comment le test de Wilcoxon est utilisé Le test de Wilcoxon, qui fait référence au test Rank Sum ou au test Signed Rank, est un test non paramétrique qui compare deux groupes appariés. plus Méthode non paramétrique La méthode non paramétrique fait référence à un type de statistique qui n'exige pas que les données analysées respectent certaines hypothèses ou certains paramètres. plus Définition du test t Un test t est un type de statistique inférentielle utilisé pour déterminer s'il existe une différence significative entre les moyennes de deux groupes, qui peut être liée à certaines caractéristiques. more Intervalle de confiance Un intervalle de confiance mesure la probabilité qu'un paramètre de population se situe entre deux valeurs définies. plus de liens partenaires

← Carrières dans les fusions et acquisitions

Prix Propre →

Recommandé

Laissez Vos Commentaires