La valeur de p est un nombre, calculé à partir d'un test statistique , qui décrit la probabilité que vous ayez trouvé un ensemble particulier d'observations si l' hypothèse nulle était vraie.
Les valeurs P sont utilisées dans les tests d'hypothèse pour aider à décider s'il faut rejeter l'hypothèse nulle. Plus la valeur p est petite , plus vous avez de chances de rejeter l'hypothèse nulle.
Qu'est-ce qu'une hypothèse nulle ?
Tous les tests statistiques ont une hypothèse nulle. Pour la plupart des tests, l'hypothèse nulle est qu'il n'y a pas de relation entre vos variables d'intérêt ou qu'il n'y a pas de différence entre les groupes.
Par exemple, dans un test t bilatéral , l'hypothèse nulle est que la différence entre deux groupes est nulle.
Qu'est-ce qu'une p -value exactement ?
La valeur de p , ou valeur de probabilité, vous indique la probabilité que vos données se soient produites sous l'hypothèse nulle. Pour ce faire, il calcule la probabilité de votre statistique de test , qui est le nombre calculé par un test statistique utilisant vos données.
La valeur de p vous indique la fréquence à laquelle vous vous attendez à voir une statistique de test aussi extrême ou plus extrême que celle calculée par votre test statistique si l'hypothèse nulle de ce test était vraie. La valeur de p diminue à mesure que la statistique de test calculée à partir de vos données s'éloigne de la plage de statistiques de test prédites par l'hypothèse nulle.
La valeur de p est une proportion : si votre valeur de p est de 0,05, cela signifie que 5 % du temps, vous verriez une statistique de test au moins aussi extrême que celle que vous avez trouvée si l'hypothèse nulle était vraie.
Comment calculer la valeur p ?
Les valeurs P sont généralement calculées automatiquement par votre programme statistique (R, SPSS, etc.).
Vous pouvez également trouver des tableaux pour estimer la valeur p de votre statistique de test en ligne. Ces tableaux montrent, en fonction de la statistique de test et des degrés de liberté (nombre d'observations moins nombre de variables indépendantes) de votre test, à quelle fréquence vous vous attendez à voir cette statistique de test sous l'hypothèse nulle.
Le calcul de la valeur p dépend du test statistique que vous utilisez pour tester votre hypothèse :
- Différents tests statistiques ont des hypothèses différentes et génèrent des statistiques de test différentes. Vous devez choisir le test statistique qui correspond le mieux à vos données et correspond à l'effet ou à la relation que vous souhaitez tester.
- Le nombre de variables indépendantes que vous incluez dans votre test modifie la taille que doit avoir la statistique de test pour générer la même valeur de p .
Quel que soit le test que vous utilisez, la valeur p décrit toujours la même chose : la fréquence à laquelle vous pouvez vous attendre à voir une statistique de test aussi extrême ou plus extrême que celle calculée à partir de votre test.
Valeurs P et signification statistique
Les valeurs P sont le plus souvent utilisées par les chercheurs pour dire si un certain modèle qu'ils ont mesuré est statistiquement significatif.
La signification statistique est une autre façon de dire que la valeur p d'un test statistique est suffisamment petite pour rejeter l'hypothèse nulle du test.
À quel point est-ce assez petit ? Le seuil le plus courant est p < 0,05 ; c'est-à-dire lorsque vous vous attendez à trouver une statistique de test aussi extrême que celle calculée par votre test seulement 5 % du temps. Mais le seuil dépend de votre domaine d'études - certains domaines préfèrent des seuils de 0,01, voire 0,001.
La valeur seuil pour déterminer la signification statistique est également connue sous le nom de valeur alpha.
Rapporter les valeurs p
Les valeurs p des tests statistiques sont généralement rapportées dans la section des résultats d'un document de recherche, ainsi que les informations clés nécessaires aux lecteurs pour mettre les valeurs p en contexte - par exemple, le coefficient de corrélation dans une régression linéaire ou la différence moyenne entre groupes de traitement dans un test t .
Attention lors de l'utilisation des valeurs p
Les valeurs P sont souvent interprétées comme votre risque de rejeter l'hypothèse nulle de votre test alors que l'hypothèse nulle est réellement vraie.
En réalité, le risque de rejeter l'hypothèse nulle est souvent supérieur à la valeur de p , en particulier lorsqu'on examine une seule étude ou lorsqu'on utilise des échantillons de petite taille. En effet, plus votre cadre de référence est petit, plus vous avez de chances de tomber sur un modèle statistiquement significatif complètement par accident.
Les valeurs P sont également souvent interprétées comme soutenant ou réfutant l'hypothèse alternative. Ce n'est pas le cas. La valeur p ne peut que vous indiquer si l'hypothèse nulle est prise en charge ou non. Il ne peut pas vous dire si votre hypothèse alternative est vraie, ni pourquoi.