Contrôle de qualité

Estimation des erreurs d'échantillonage

Les résultats d'une enquête par échantillon sont affectés par deux types d'erreurs: 1) les erreurs non liées à l'échantillonage et 2) les erreurs d'échantillonage. Les erreurs non liées à l'échantillonage sont la conséquence d'erreurs de collecte et de saisie. De nombreux eforts sont consentis durant l'exécution de l'enquête MICS 2005-2006 pour minimiser ce type d'erreurs. Cependant, il est impossible d'éviter totalement ces erreurs, et de les évaluer statistiquement.

Les erreurs d'échantillonage peuvent étre estimées statistiquement. L'échantillon tiré pour l'enquête MICS 2005-2006 MICS n'est qu'un parmi de nombreux échantllons possibles de même taille qui pourraient avoir été tirés dans la même population en utilisant la même méthode. Chacun de ces échantillons donneraient des résultats quelque peu différents de ceux obtenus avec l'échantillon enquêté. Les erreurs de sondage sont une mesure de la variabilité de ces résultats entre tous les échantillons possibles, et, bien que le degré de variabilité ne soit pas connu exactement, il peut être estimé. Les erreurs de sondage sont mesurées en ermes d'écart type pour un indicateur particulier (moyenne ou pourcentage) cà d par la racine carrée de la variance. Des intervales de confiance sont calculés pour chaque statistique, au sein desquels on suppose que se trouve la valeur réelle de l'indicateur. MICS retient comme norme un ntervalle de plus ou moins deux écart-types, ce qui représente un intervale de confiance de 95%.

Si l'échantillon enquêté avait été obtenu par tirage aléatoire simple, il aurait été possible de recourir à la formule directe de calcul des écart types. Mais l'échantillon de l'enquête MICS 2005-2006 est le résultat d'une srtatification a plusieurs niveaux, ce qui impose l'utilisation de formules plus complexes. Le module "complex samples" de SPSS a été utilisé pour effectuer ces calculs. Ce module utilise la méthode de linéarisation de Taylor pour l'estimation de la variance des moyennes et proportions. Cette méthode est documentée dans le fichier SPSS CSDescriptives.pdf disponibles sous Help, Algorithms options dans SPSS.

Les erreurs de sondage ont été calculées pour un certain nombre de statistiques (youtes des proportions en raison de la limitation de la méthode de Taylor) pour l'échantillon national, urbain et rural, et pour chacune des 5 régions. Pour chaque statistique, l'estimation, son écart type, le coefficient de variation (ou erreur relative -- le rapport entre l'écart type et l'estimation), le design effect, et la racine carrée du design effect (DEFT -- le ratio entre l'écart type selon le sondage utilisé et l'écart type qui aurait été obtenu si l'échantillon avait été aléatoire simple),de même que l'intervale de confiance à 95 % (+/-2 écart types).

Des détails concernant les erreurs de sondage sont disponibles dans un document annexe.

Autres méthodes d'évaluation des données

Une collection de tableaux et graphiques de controle de qualité sont disponibles, comprenant:

Distribution par âge de la population
Distribution par âge des femmes éligibles et enquêtées
Distribution par âge des enfants éligibles et pour lesquels la mère/tutrice a été enquêtée
Distribution par âge des enfants de moins de 5 ans par groupes d'âges (3 mois)
Rapport aux limites de l'éligibilité
Pourcentage de valeurs manquantes pour diverses variables 
Présence de la mère dans le ménage et personne interrogée au sujet des enfants
Fréquentation scolaire par année d'âge
Rapport des sexes parmi les nouveau-nés, les enfants survivants, et décès par âge du répondant
Distribution des femmes selon le temps écoulé depuis la dernière naissance
Plot du poids par âge, poids par taille, et taille par âge
Pyramide des âges par année d'âge

Les résultats de chacun de ces tableaux de controle est présenté en annexe du rapport final de l'enquête.

La règle générale pour la présentation des valeurs manquantes dans les tableaux du rapport final est qu'une colonne est présentée pour les valeurs manquantes si le nombre de cas représente 1% ou plus. Les enregistrements ayant des valeurs manquantes pour des variables de tabulation (par exemple l'éducation) sont incluses dans les tableaux, mais les lignes de cas manquants sont supprimées et notées au bas des tableaux dans le rapport (mais pas dans l'output des programmes de tabulation SPSS).
Generated: MAY-20-2008 using the IHSN Microdata Management Toolkit