Intervalle de confiance

Quel est l'intervalle de confiance:

C'est une estimation d'une plage utilisée dans les statistiques, qui contient un paramètre de population. Ce paramètre de population inconnu est trouvé via un modèle de modèle calculé à partir des données collectées .

Exemple: la moyenne d'un échantillon recueilli x̅ peut correspondre ou non à la moyenne réelle de la population μ. Pour cela, il est possible de considérer une gamme d'échantillons de moyennes où cette moyenne de population peut être contenue. Plus cet intervalle est long, plus la probabilité que cela se produise est grande.

L'intervalle de confiance est exprimé sous forme de pourcentage, désigné par le niveau de confiance, 90%, 95% et 99% étant les plus indiqués. Dans l'image ci-dessous, par exemple, nous avons un intervalle de confiance de 90% entre ses limites supérieure et inférieure (a et -a ).

Exemple d'intervalle de confiance à 90% entre ses limites supérieure (a) et inférieure (-a).

L’intervalle de confiance est l’un des concepts les plus importants des tests d’hypothèses en statistique, car il sert à mesurer l’incertitude. Le terme a été introduit par le mathématicien et statisticien polonais Jerzy Neyman en 1937.

Quelle est la pertinence d'un intervalle de confiance?

L'intervalle de confiance est important pour indiquer la marge d'incertitude (ou d'imprécision) par rapport à un calcul effectué. Ce calcul utilise l'échantillon de l'étude pour estimer la taille réelle du résultat dans la population source.

Le calcul d'un intervalle de confiance est une stratégie qui prend en compte l'échantillonnage d'erreur. La taille du résultat de votre étude et votre intervalle de confiance caractérisent les valeurs présumées pour la population d'origine.

Plus l'intervalle de confiance est étroit, plus la probabilité que le pourcentage de la population d'étude représente le nombre réel de la population source est grande, ce qui donne une plus grande certitude quant au résultat de l'objet étudié.

Comment interpréter un intervalle de confiance?

L'interprétation correcte de l'intervalle de confiance est probablement l'aspect le plus difficile de ce concept statistique. Voici un exemple de l'interprétation la plus courante du concept:

Il existe une probabilité de 95% que, dans le futur, la valeur vraie du paramètre de population (par exemple, la moyenne) se situe dans la plage X (limite inférieure) et Y (limite supérieure).

Ainsi, l'intervalle de confiance est interprété comme suit: il est sûr à 95% que l'intervalle entre X (borne inférieure) et Y (limite supérieure) contient la valeur vraie du paramètre de population.

Il serait totalement faux d' affirmer que: il existe une probabilité de 95% que l'intervalle entre X (borne inférieure) et Y (limite supérieure) contient la valeur réelle du paramètre population.

L'énoncé ci-dessus est l'idée fausse la plus courante concernant l'intervalle de confiance. Une fois la plage statistique calculée, elle peut contenir ou non le paramètre de population.

Cependant, les intervalles peuvent varier d'un échantillon à l'autre, tandis que le paramètre de population réel est le même quel que soit l'échantillon.

Par conséquent, la déclaration de confiance de l'intervalle de confiance ne peut être faite que dans le cas où les intervalles de confiance sont recalculés pour le nombre d'échantillons.

Les étapes du calcul de l'intervalle de confiance

La plage est calculée en procédant comme suit:

  • Recueillir les données de l'échantillon: n ;
  • Calculer la moyenne de l'échantillon x̅;
  • Déterminer si un écart-type de population ( σ ) est connu ou inconnu.
  • Si un écart type de population est connu, un point z peut être utilisé pour le niveau de confiance correspondant;
  • Si un écart-type de population est inconnu, nous pouvons utiliser une statistique t pour le niveau de confiance correspondant;
  • Ainsi, les limites inférieure et supérieure de l'intervalle de confiance sont déterminées à l'aide des formules suivantes:

a) Écart type d'une population connue :

Formule pour le calcul de l'écart type d'une population connue.

b) Écart type d'une population inconnue :

Formule pour le calcul de l'écart type d'une population inconnue.

Exemple pratique d'intervalle de confiance

Une étude clinique a évalué l'association entre la présence d'asthme et le risque de développer une apnée obstructive du sommeil chez l'adulte.

Certains adultes ont été recrutés au hasard sur une liste d'agents de l'État à suivre pendant quatre ans.

Les participants asthmatiques, comparés aux autres patients, avaient un risque plus élevé d'apnée en quatre ans.

En menant une recherche clinique comme celle-ci, un sous-groupe de la population d’intérêt est généralement recruté pour accroître l’efficacité de l’étude (moins de coûts et moins de temps).

Ce sous-groupe d'individus, la population étudiée, est composé de ceux qui répondent aux critères d'inclusion et acceptent de participer à l'étude, comme le montre l'image ci-dessous.

Graphique explicatif de la population étudiée dans l'exemple.

Ensuite, l’étude est terminée et une taille d’effet (par exemple, une différence moyenne ou un risque relatif ) est calculée pour répondre à la question de recherche.

Ce processus, appelé inférence, implique l’utilisation des données recueillies auprès de la population à l’étude pour estimer l’ampleur de l’effet réel sur la population d’intérêt, c’est-à-dire la population d’origine.

Dans l’exemple donné, les chercheurs ont recruté un échantillon aléatoire d’employés de l’État (population source) éligibles et ayant accepté de participer à l’étude (population à l’étude) et ont signalé que l’asthme augmente le risque de développer une apnée dans la population de l’étude.

Pour prendre en compte une erreur d'échantillonnage due au recrutement d'un sous-groupe de la population d'intérêt, ils ont également calculé un intervalle de confiance à 95% (autour de l'estimation) de 1, 06 - 1, 82, indiquant une probabilité de 95 % que le risque relatif réel dans la population source se situerait entre 1, 06 et 1, 82 .

Intervalle de confiance pour la moyenne

Quand on a l'information de l'écart type d'une population, on peut calculer un intervalle de confiance pour la moyenne ou la moyenne de cette population.

Lorsqu'une caractéristique statistique mesurée (comme le revenu, le QI, le prix, la taille, la quantité ou le poids) est numérique, dans la plupart des cas, on estime que la valeur moyenne pour la population est trouvée.

Ainsi, nous essayons de trouver la moyenne de la population ( μ ) en utilisant une moyenne de l’échantillon ( ), avec une marge d’erreur. Le résultat de ce calcul s'appelle l' intervalle de confiance pour la moyenne de la population .

Lorsque l'écart type de la population est connu, la formule d'un intervalle de confiance (IC) pour une moyenne de population est la suivante:

Où:

  • est la moyenne de l'échantillon;
  • σ est l'écart type de la population;
  • n est la taille de l'échantillon;
  • Ζ * représente la valeur appropriée de la distribution normale standard pour le niveau de confiance souhaité.

Les valeurs suivantes correspondent aux différents niveaux de confiance ( * ):

Niveau de confianceValeur de Z * -
80%1, 28
90%1.645 (conventionnel)
95%1, 96
98%2, 33
99%2, 58

Le tableau ci-dessus montre les valeurs z * des niveaux de confiance fournis. Notez que ces valeurs sont obtenues à partir de la distribution normale standard (Z-).

La zone située entre chaque valeur z * et le négatif de cette valeur correspond au pourcentage de confiance (approximatif). Par exemple, l'aire entre z * = 1, 28 et z = -1, 28 est d'environ 0, 80. Par conséquent, ce tableau peut également être étendu à d'autres pourcentages de confiance. Le tableau indique uniquement les pourcentages de confiance les plus couramment utilisés.

Voir aussi la signification de l'hypothèse.