Les tests non paramétriques n'exigent pas que vos données suivent la distribution normale. Ils sont également connus sous le nom de tests sans distribution et peuvent apporter des avantages dans certaines situations. En règle générale, les personnes qui effectuent des tests d'hypothèses statistiques sont plus à l'aise avec les tests paramétriques que les tests non paramétriques.
Vous avez probablement entendu dire qu'il est préférable d'utiliser des tests non paramétriques si vos données ne sont pas normalement distribuées, ou quelque chose du genre. Cela semble être un moyen facile de choisir, mais la décision est plus que cela.
Dans cet article, je comparerai les avantages et les inconvénients pour vous aider à choisir entre les types de tests d'hypothèses statistiques suivants :
- Analyses paramétriques pour évaluer les moyennes des groupes
- Analyses non paramétriques pour évaluer les médianes de groupe
En particulier, j'aimerais que vous vous concentriez sur une raison clé pour effectuer un test non paramétrique qui n'obtient pas l'attention qu'il mérite ! Si vous avez besoin d'une introduction aux bases, lisez mon aperçu des tests d'hypothèses .
Paires associées de tests paramétriques et non paramétriques
Les tests non paramétriques sont un monde fantôme de tests paramétriques. Dans le tableau ci-dessous, je montre des paires liées de tests d'hypothèses statistiques.
Tests paramétriques de moyennes | Tests non paramétriques des médianes |
1- échantillon de test t | 1 échantillon Sign, 1 échantillon Wilcoxon |
test t à 2 échantillons | Test de Mann Whitney |
ANOVA à un facteur | Kruskal-Wallis, test médian de Mood |
DOE factoriel avec un facteur et une variable de blocage | essai de Friedman |
De plus, la corrélation de Spearman est une alternative non paramétrique à la corrélation de Pearson . Utilisez la corrélation de Spearman pour les relations non linéaires et monotones et pour les données ordinales . Pour plus d'informations, lisez mon article La corrélation de Spearman expliquée !
Pour ce sujet, il est crucial que vous compreniez le concept d'analyses statistiques robustes. Pour plus d'informations, lisez mon article, Que sont les statistiques robustes ?
Avantages des tests paramétriques
Avantage 1 : les tests paramétriques peuvent fournir des résultats fiables avec des distributions asymétriques et non normales
Beaucoup de gens ne sont pas conscients de ce fait, mais les analyses paramétriques peuvent produire des résultats fiables même lorsque vos données continues ne sont pas distribuées normalement. Vous devez juste vous assurer que la taille de votre échantillon répond aux exigences de chaque analyse dans le tableau ci-dessous. Des études de simulation ont identifié ces exigences. Lisez ici pour plus d'informations sur ces études .
Parametric analyses | Exigences relatives à la taille de l' échantillon pour les données non normales |
Test t à 1 échantillon | Supérieur à 20 |
test t à 2 échantillons | Chaque groupe doit avoir plus de 15 observations |
ANOVA à un facteur |
|
Vous pouvez utiliser ces tests paramétriques avec des données distribuées non normalement grâce au théorème central limite. Pour plus d'informations à ce sujet, lisez mon article : Explication du théorème central limite .
Articles connexes : La distribution normale et comment identifier la distribution de vos données .
Avantage 2 : les tests paramétriques peuvent fournir des résultats fiables lorsque les groupes ont des degrés de variabilité différents
Il est vrai que les tests non paramétriques ne nécessitent pas de données normalement distribuées. Cependant, les tests non paramétriques présentent l'inconvénient d'une exigence supplémentaire qui peut être très difficile à satisfaire. Les groupes dans une analyse non paramétrique doivent généralement tous avoir la même variabilité (dispersion). Les analyses non paramétriques peuvent ne pas fournir des résultats précis lorsque la variabilité diffère entre les groupes.
À l'inverse, les analyses paramétriques, comme le test t à 2 échantillons ou l'ANOVA à un facteur, vous permettent d'analyser des groupes avec des variances inégales. Dans la plupart des logiciels de statistiques, c'est aussi simple que de cocher la bonne case ! Vous n'avez pas à vous soucier des groupes ayant des degrés de variabilité différents lorsque vous utilisez une analyse paramétrique.
Article connexe : Mesures de variabilité
Avantage 3 : les tests paramétriques ont une plus grande puissance statistique
Dans la plupart des cas, les tests paramétriques ont plus de puissance . Si un effet existe réellement, une analyse paramétrique est plus susceptible de le détecter.
Article connexe : Puissance statistique et taille de l'échantillon
Avantages des tests non paramétriques
Avantage 1 : Les tests non paramétriques évaluent la médiane qui peut être meilleure pour certaines zones d'étude
Nous arrivons maintenant à ma raison préférée pour laquelle utiliser un test non paramétrique. Celui dont les pratiquants ne parlent pas assez fréquemment !
Pour certains ensembles de données, les analyses non paramétriques offrent un avantage car elles évaluent la médiane plutôt que la moyenne. La moyenne n'est pas toujours la meilleure mesure de tendance centrale pour un échantillon. Même si vous pouvez effectuer une analyse paramétrique valide sur des données asymétriques, cela n'équivaut pas nécessairement à la meilleure méthode. Laissez-moi vous expliquer en utilisant la répartition des salaires.
Les salaires ont tendance à être une distribution asymétrique à droite. La majorité des salaires se concentrent autour de la médiane, qui est le point où la moitié est au-dessus et la moitié en dessous. Cependant, il y a une longue traîne qui s'étend jusqu'aux échelles salariales les plus élevées. Cette longue traîne éloigne la moyenne de la valeur médiane centrale. Les deux distributions sont typiques des distributions salariales.
Dans ces distributions, si plusieurs personnes à revenu très élevé se joignent à l'échantillon, la moyenne augmente considérablement malgré le fait que les revenus de la plupart des gens ne changent pas. Ils se regroupent toujours autour de la médiane.
Dans cette situation, les résultats des tests paramétriques et non paramétriques peuvent vous donner des résultats différents, et ils peuvent tous les deux être corrects ! Pour les deux distributions, si vous tirez un grand échantillon aléatoire de chaque population , la différence entre les moyennes est statistiquement significative. Malgré cela, la différence entre les médianes n'est pas statistiquement significative. Voici comment cela fonctionne.
Pour les distributions asymétriques , les changements dans la queue affectent considérablement la moyenne. Des tests paramétriques peuvent détecter ce changement moyen. A l'inverse, la médiane est relativement peu affectée, et une analyse non paramétrique peut légitimement indiquer que la médiane n'a pas changé de manière significative.
Vous devez décider si la moyenne ou la médiane convient le mieux à votre étude et quel type de différence est le plus important à détecter.
Related posts : Déterminer quelle mesure de la tendance centrale est la meilleure pour vos données et votre médiane : définition et utilisations
Avantage 2 : les tests non paramétriques sont valides lorsque la taille de notre échantillon est petite et que vos données sont potentiellement non normales
Utilisez un test non paramétrique lorsque la taille de votre échantillon n'est pas assez grande pour répondre aux exigences du tableau ci-dessus et que vous n'êtes pas sûr que vos données suivent la distribution normale. Avec des échantillons de petite taille, sachez que les tests de normalité peuvent avoir une puissance insuffisante pour produire des résultats utiles.
Cette situation est difficile. Les analyses non paramétriques ont tendance à avoir une puissance inférieure au départ, et une petite taille d'échantillon ne fait qu'exacerber ce problème.
Avantage 3 : les tests non paramétriques peuvent analyser des données ordinales, des données classées et des valeurs aberrantes
Les tests paramétriques ne peuvent analyser que des données continues et les résultats peuvent être excessivement affectés par les valeurs aberrantes . Inversement, les tests non paramétriques peuvent également analyser des données ordinales et classées, et ne pas être déclenchés par des valeurs aberrantes.
Parfois, vous pouvez légitimement supprimer les valeurs aberrantes de votre ensemble de données si elles représentent des conditions inhabituelles. Cependant, les valeurs aberrantes font parfois véritablement partie de la distribution d'une zone d'étude et vous ne devez pas les supprimer.
Vous devez vérifier les hypothèses pour les analyses non paramétriques, car les différents tests peuvent analyser différents types de données et ont des capacités différentes pour gérer les valeurs aberrantes.
Si vos données utilisent l'échelle Likert ordinale et que vous souhaitez comparer deux groupes, lisez mon article sur l' analyse à utiliser pour analyser les données Likert .
Related posts : Types de données et comment les utiliser et 5 façons de trouver des valeurs aberrantes dans vos données
Avantages et inconvénients des tests paramétriques et non paramétriques
De nombreuses personnes pensent que le choix entre des tests paramétriques et non paramétriques dépend du fait que vos données suivent ou non la distribution normale. Si vous avez un petit ensemble de données, la distribution peut être un facteur décisif. Cependant, dans de nombreux cas, ce problème n'est pas critique pour les raisons suivantes :
- Les analyses paramétriques peuvent analyser des distributions non normales pour de nombreux ensembles de données.
- Les analyses non paramétriques ont d'autres hypothèses fermes qui peuvent être plus difficiles à respecter.
La réponse dépend souvent de savoir si la moyenne ou la médiane est une meilleure mesure de la tendance centrale pour la distribution de vos données.
- Si la moyenne est une meilleure mesure et que vous disposez d'un échantillon suffisamment grand, un test paramétrique est généralement le meilleur choix et le plus puissant.
- Si la médiane est une meilleure mesure, envisagez un test non paramétrique quelle que soit la taille de votre échantillon.
Enfin, si la taille de votre échantillon est petite, vous pourriez être obligé d'utiliser un test non paramétrique. Cela me rendrait extatique si vous préleviez un échantillon plus important pour votre prochaine étude ! Comme le montre le tableau, les exigences relatives à la taille de l'échantillon ne sont pas trop importantes. Si vous disposez d'un petit échantillon et que vous devez utiliser une analyse non paramétrique moins puissante, cela réduit doublement les chances de détecter un effet.