Comprendre la P-values | Définition et exemples

Live
0


La valeur de p est un nombre, calculé à partir d'un test statistique , qui décrit la probabilité que vous ayez trouvé un ensemble particulier d'observations si l' hypothèse nulle était vraie.

Les valeurs P sont utilisées dans les tests d'hypothèse pour aider à décider s'il faut rejeter l'hypothèse nulle. Plus la valeur p est petite , plus vous avez de chances de rejeter l'hypothèse nulle.

Qu'est-ce qu'une hypothèse nulle ?

Tous les tests statistiques ont une hypothèse nulle. Pour la plupart des tests, l'hypothèse nulle est qu'il n'y a pas de relation entre vos variables d'intérêt ou qu'il n'y a pas de différence entre les groupes.

Par exemple, dans un test t bilatéral , l'hypothèse nulle est que la différence entre deux groupes est nulle.

Exemple : hypothèse nulle et alternative
Vous voulez savoir s'il existe une différence de longévité entre deux groupes de souris nourries avec des régimes différents, le régime A et le régime B. Vous pouvez tester statistiquement la différence entre ces deux régimes à l'aide d'un test t bilatéral.

  • Hypothèse nulle : il n'y a pas de différence de longévité entre les deux groupes.
  • Hypothèse alternative : il existe une différence de longévité entre les deux groupes.

Qu'est-ce qu'une p -value exactement ?

La valeur de p , ou valeur de probabilité, vous indique la probabilité que vos données se soient produites sous l'hypothèse nulle. Pour ce faire, il calcule la probabilité de votre statistique de test , qui est le nombre calculé par un test statistique utilisant vos données.

La valeur de p vous indique la fréquence à laquelle vous vous attendez à voir une statistique de test aussi extrême ou plus extrême que celle calculée par votre test statistique si l'hypothèse nulle de ce test était vraie. La valeur de p diminue à mesure que la statistique de test calculée à partir de vos données s'éloigne de la plage de statistiques de test prédites par l'hypothèse nulle.

La valeur de p est une proportion : si votre valeur de p est de 0,05, cela signifie que 5 % du temps, vous verriez une statistique de test au moins aussi extrême que celle que vous avez trouvée si l'hypothèse nulle était vraie.

Exemple : Statistique de test et valeur de p
Si les souris vivent aussi longtemps sur l'un ou l'autre régime, alors la statistique de test de votre test t correspondra étroitement à la statistique de test de l'hypothèse nulle (qu'il n'y a pas de différence entre les groupes), et la valeur de p résultante sera proche de 1 Il n'atteindra probablement pas exactement 1, car dans la vraie vie, les groupes ne seront probablement pas parfaitement égaux.

Si, toutefois, il existe une différence moyenne de longévité entre les deux groupes, alors votre statistique de test s'éloignera davantage des valeurs prédites par l'hypothèse nulle, et la valeur p deviendra plus petite. La valeur de p n'atteindra jamais zéro, car il y a toujours une possibilité, même extrêmement improbable, que les modèles de vos données se soient produits par hasard.

Comment calculer la valeur p ?

Les valeurs P sont généralement calculées automatiquement par votre programme statistique (R, SPSS, etc.).

Vous pouvez également trouver des tableaux pour estimer la valeur p de votre statistique de test en ligne. Ces tableaux montrent, en fonction de la statistique de test et des degrés de liberté (nombre d'observations moins nombre de variables indépendantes) de votre test, à quelle fréquence vous vous attendez à voir cette statistique de test sous l'hypothèse nulle.

Le calcul de la valeur p dépend du test statistique que vous utilisez pour tester votre hypothèse :

  • Différents tests statistiques ont des hypothèses différentes et génèrent des statistiques de test différentes. Vous devez choisir le test statistique qui correspond le mieux à vos données et correspond à l'effet ou à la relation que vous souhaitez tester.
  • Le nombre de variables indépendantes que vous incluez dans votre test modifie la taille que doit avoir la statistique de test pour générer la même valeur de p .
Exemple : Choisir un test statistique
Si vous ne comparez que deux régimes différents, un test t à deux échantillons est un bon moyen de comparer les groupes. Pour comparer trois régimes différents, utilisez plutôt une ANOVA - effectuer plusieurs comparaisons par paires entraînera des valeurs de p artificiellement basses et vous permettra de surestimer l'importance de la différence entre les groupes.

Quel que soit le test que vous utilisez, la valeur p décrit toujours la même chose : la fréquence à laquelle vous pouvez vous attendre à voir une statistique de test aussi extrême ou plus extrême que celle calculée à partir de votre test.

Valeurs P et signification statistique

Les valeurs P sont le plus souvent utilisées par les chercheurs pour dire si un certain modèle qu'ils ont mesuré est statistiquement significatif.

La signification statistique est une autre façon de dire que la valeur p d'un test statistique est suffisamment petite pour rejeter l'hypothèse nulle du test.

À quel point est-ce assez petit ? Le seuil le plus courant est p < 0,05 ; c'est-à-dire lorsque vous vous attendez à trouver une statistique de test aussi extrême que celle calculée par votre test seulement 5 % du temps. Mais le seuil dépend de votre domaine d'études - certains domaines préfèrent des seuils de 0,01, voire 0,001.

La valeur seuil pour déterminer la signification statistique est également connue sous le nom de valeur alpha.

Exemple : Signification statistique
Votre comparaison des deux régimes de souris donne une valeur p inférieure à 0,01, inférieure à votre valeur alpha de 0,05 ; par conséquent, vous déterminez qu'il existe une différence statistiquement significative entre les deux régimes.

Rapporter les valeurs p

Les valeurs p des tests statistiques sont généralement rapportées dans la section des résultats d'un document de recherche, ainsi que les informations clés nécessaires aux lecteurs pour mettre les valeurs p en contexte - par exemple, le coefficient de corrélation dans une régression linéaire ou la différence moyenne entre groupes de traitement dans un test t .

Exemple : Rapporter les résultats
Dans notre comparaison du régime de souris A et du régime de souris B, nous avons constaté que la durée de vie du régime A (moyenne = 2,1 ans ; sd = 0,12) était significativement plus courte que la durée de vie du régime B (moyenne = 2,6 ans ; sd = 0,1), avec une différence moyenne de 6 mois (t(80) = -12,75 ; p < 0,01).

Attention lors de l'utilisation des valeurs p

Les valeurs P sont souvent interprétées comme votre risque de rejeter l'hypothèse nulle de votre test alors que l'hypothèse nulle est réellement vraie.

En réalité, le risque de rejeter l'hypothèse nulle est souvent supérieur à la valeur de p , en particulier lorsqu'on examine une seule étude ou lorsqu'on utilise des échantillons de petite taille. En effet, plus votre cadre de référence est petit, plus vous avez de chances de tomber sur un modèle statistiquement significatif complètement par accident.

Les valeurs P sont également souvent interprétées comme soutenant ou réfutant l'hypothèse alternative. Ce n'est pas le cas. La  valeur p ne peut que vous indiquer si l'hypothèse nulle est prise en charge ou non. Il ne peut pas vous dire si votre hypothèse alternative est vraie, ni pourquoi.


Tags

Post a Comment

0Comments

Post a Comment (0)

#buttons=(Accept !) #days=(20)

Our website uses cookies to enhance your experience. Check Now
Accept !