Cycle des statistiques

 

Cycle des statistiques Préparation du questionnaire Échantillonage : plan de sondage, plan d'échantillonnage, stratégie de collecte Démarrage et planification du projet

 

1. Démarrage et planification du projet
L’Institut de la statistique du Québec produit des statistiques sur une multitude de sujets. Comment ces sujets sont-ils choisis? En raison des ressources et des efforts importants qu’il faut déployer pour produire des statistiques, l’Institut a des règles à suivre pour s’assurer de choisir les thématiques les plus pertinentes pour répondre aux besoins de la société québécoise. L’Institut consulte plusieurs comités d’experts externes qui font des recommandations sur les statistiques qu’il faudrait produire pour bien documenter la situation du Québec. Homme qui planifie un projetChacun de ces comités consultatifs porte sur un domaine précis, comme la démographie, la science et la technologie, la culture, la santé, l’économie. Certaines recommandations peuvent aussi venir d’autres ministères et organismes du gouvernement du Québec.

Une fois qu’un besoin a été clairement retenu, un responsable de projet est désigné parmi les employés de l’Institut pour superviser l’enquête. Il s’agit généralement d’une personne experte du domaine traité par l’enquête. Cette personne veille à ce que tous les stades du projet se déroulent avec succès et suivent des normes établies : estimer le coût total, planifier un échéancier des différentes étapes, sélectionner un échantillon, concevoir un questionnaire, collecter les données, compiler les données reçues, préparer des tableaux et des graphiques présentant les résultats, rédiger un texte d’analyse des statistiques, communiquer les résultats publiquement. Le responsable de projet coordonne ces différentes étapes et fait le lien entre les nombreux spécialistes de l’Institut qui collaborent à l’enquête : statisticien, responsable d’enquête, informaticien, webmestre, responsable des communications, etc.

2. Échantillonnage et plan de sondage
Une fois le sujet de l’enquête trouvé et défini, l’objectif est d’obtenir des résultats qui s’appliquent à l’ensemble de la population. Par exemple, si on désire connaître l’état de santé des personnes vivant au Québec, les résultats doivent refléter la condition de la totalité des Québécois, soit près de huit millions de personnes. Puisqu’il est impossible et trop dispendieux de contacter tous ces Québécois, les statisticiens ont développé des méthodes pour choisir seulement un échantillon de la population en s’assurant que les réponses obtenues représentent fidèlement les caractéristiques de la population québécoise. La même chose s’applique lorsqu’il s’agit d’une enquête auprès des entreprises : le statisticien choisit un échantillon de l’ensemble des entreprises.

Pour bien représenter la population, l’échantillon doit d’abord être sélectionné au hasard. Ainsi, on s’assure que chaque personne de la population ait une chance de faire partie de l’échantillon. Il faut éviter un échantillonnage pour lequel certaines personnes n’auraient aucune chance d’être sélectionnées. Par exemple, prendre un échantillon de personnes dans un centre d’achat pour représenter la population québécoise ne serait pas une bonne idée puisque certaines personnes ne vont jamais magasiner. Ces personnes n’auraient aucune chance de faire partie de l’échantillon et donc les résultats de l’enquête ne pourraient pas bien les représenter. Un bon moyen de choisir un échantillon est de le faire à partir d’une liste de noms qui couvre l’ensemble de la population. Par exemple, le fichier des personnes assurées de la Régie de l’assurance maladie du Québec, c’est-à-dire les gens qui possèdent la carte d’assurance-maladie, est souvent utilisé par l’Institut pour choisir un échantillon.

Le fait de sélectionner des gens au hasard n’est toutefois pas suffisant pour bien représenter la population. Il faut aussi s’assurer d’avoir un nombre assez grand de personnes dans l’échantillon. Par exemple, si on sélectionne une seule personne au hasard dans un échantillon, on ne pourrait pas affirmer avec certitude que ses caractéristiques représentent bien celles de l’ensemble de la population québécoise. Il faut donc que l’échantillon soit suffisamment grand pour couvrir des personnes présentant différentes caractéristiques, par exemple divers groupes d'âge, les deux sexes, etc.

La plupart du temps, en plus d’être représentatif de l’ensemble de la population, l’échantillon doit aussi être représentatif de certains sous-groupes de cette population. Par exemple, si on veut produire des résultats pour une région qui est moins populeuse, comme le Bas-Saint-Laurent, il faudrait s’assurer que l’échantillon contienne suffisamment de personnes provenant de cette région. Un tel besoin ainsi que d’autres besoins particuliers doivent être planifiés au démarrage d’une enquête dans ce qu’on appelle un plan de sondage. Ce plan, préparé par les statisticiens, permet de déterminer comment sera sélectionné l’échantillon et combien de personnes il devra comporter.

3. Questionnaire
L’Institut réalise généralement une enquête pour répondre à une question précise concernant la société québécoise. En voici quelques exemples.

  1. Quel est l’état de santé des personnes vivant au Québec? 
  2. Quels sont les sports ou loisirs les plus pratiqués au Québec?
  3. Quel est le taux d’occupation des établissements d’hébergement au Québec?
  4. Quel est le revenu moyen des jeunes québécois de 16 à 24 ans?
  5. Est-ce que la consommation de tabac est en baisse ou en hausse chez les jeunes québécois?
  6. Combien de personnes assistent à des spectacles annuellement au Québec?

Pour répondre correctement à l’une de ces questions, on élabore un questionnaire qui permet de recueillir les renseignements nécessaires pour bien l’analyser et la comprendre. Par exemple, si on étudie la fréquentation des spectacles au Québec, on pourrait se poser les questions suivantes : la langue des spectacles fréquentés (anglais ou français) est-elle une information utile à connaître? Des statistiques pour les différentes régions du Québec sont-elles nécessaires, ou est-ce que des statistiques pour l’ensemble du Québec suffiraient?

Un questionnaire de qualité doit être :

  1. complet : il doit contenir tous les renseignements nécessaires, sans être trop long; un participant pourrait ne pas vouloir répondre à un questionnaire qui est trop long;
  2. précis : le choix du mot juste s’impose afin de s’assurer que chaque question est comprise exactement de la même façon par tous les participants;
  3. clair : les questions doivent être brèves et rédigées dans un langage simple dans le but de minimiser l’effort du participant; il faut à tout prix éviter le jargon. Les consignes doivent aussi être faciles à comprendre.

L’étape de l’élaboration du questionnaire est décisive : la qualité des résultats de l’enquête dépend de la qualité des renseignements recueillis.

4. Collecte des données
Lorsque le questionnaire est construit, il faut déterminer la meilleure stratégie pour recueillir les réponses aux questions. Plusieurs moyens sont possibles :

  1. envoyer un questionnaire par la poste, puis demander aux participants de le remplir et de le retourner;
  2. appeler les participants et leur demander de répondre à une entrevue téléphonique;
  3. se rendre à domicile ou encore dans les écoles pour distribuer les questionnaires;
  4. offrir aux participants de remplir un questionnaire Web. 

Le choix du ou des moyens dépend de :

  1. la population visée par l’enquête : personnes, ménages ou entreprises;
  2. la complexité et la longueur du questionnaire;
  3. les renseignements dont on dispose sur la population visée : adresse, numéro de téléphone, courriel, etc.;
  4. la période de l’année;
  5. etc.

Une stratégie de collecte est préparée pour chaque enquête. Par exemple, si une enquête s’adresse à une entreprise, on lui envoie d’abord un questionnaire par la poste ou par courriel afin qu’elle puisse prendre le temps de réunir les renseignements demandés. Par la suite, on appelle l’entreprise pour saisir ses réponses dans un questionnaire informatisé. Ce dernier est conçu de façon à s’assurer que les participants n’ont pas répondu n’importe quoi aux questions et qu’il existe une logique et une cohérence entre leurs réponses. Cela permet à l’Institut de contrôler la qualité des données utilisées dans ses recherches.

Pour réaliser la collecte des renseignements, plusieurs personnes sont nécessaires. Le responsable d’enquête est chargé d’organiser et de superviser la collecte des informations. Les intervieweurs téléphonent aux personnes, aux ménages ou aux entreprises ciblés par l’enquête pour leur poser les questions. Les techniciens en recherche, enquête et sondage aident le responsable d’enquête dans la réalisation de plusieurs tâches comme la programmation informatique des questionnaires, le suivi de la collecte et le contrôle de la qualité. Les agents de bureau expédient les lettres, les questionnaires et soutiennent le responsable d’enquête dans ses tâches administratives. Les auxiliaires de saisie se chargent de saisir à l’ordinateur les renseignements fournis par les participants. Lorsque la collecte des données est terminée, un fichier est transmis au statisticien. Ce dernier produit des tableaux avec les résultats et les envoie ensuite à l’analyste.

5. Analyse des données
Une fois les données de l’enquête disponibles, l’analyste doit les faire parler. Une donnée n’est utile que si elle est comparée avec une autre, ou si elle permet de voir l’évolution d’un phénomène. Par exemple, si une enquête révèle que le revenu total moyen des jeunes de 16 à 24 ans s’élève à 11 300 $ en 2009, cette information ne dit pas grand-chose. Ce revenu est-il plus élevé ou plus faible que celui des personnes des autres groupes d’âge? Y-a-t-il une différence entre le revenu des femmes et des hommes? Combien gagne un jeune qui travaille à temps plein comparativement à un autre qui travaille à temps partiel? S’agit-il du revenu des jeunes québécois ou canadiens? Le revenu moyen a-t-il augmenté depuis dix ans? Ce sont de multiples exemples de questions auxquelles l’analyste voudra répondre.

Plusieurs étapes sont nécessaires avant de produire une donnée, car l’analyste doit s’assurer que celle-ci reflète correctement la réalité. Reprenons l’exemple du revenu annuel moyen chez les jeunes de 16-24 ans. Si un grand nombre de jeunes ont refusé de répondre, qu’est-ce qui nous assure que le revenu moyen de ceux qui ont répondu est le même que celui de ceux qui n’ont pas répondu? Aussi, puisqu’une enquête est seulement réalisée auprès d’une partie de la population, est-ce que le revenu moyen de ces jeunes sondés diffère de celui que l’on aurait obtenu si l’ensemble de la population avait répondu à l’enquête? Si oui, à combien évalue-t-on cette différence? Voilà deux exemples de difficultés que l’analyste doit résoudre avant de fournir la donnée. Lorsque des doutes persistent sur la qualité, même après avoir fait toutes les corrections appropriées, l’analyste doit mettre en garde les utilisateurs des risques d’imprécisions ou de biais pour les aider à interpréter correctement la donnée.

Aussi, s’il est intéressant de connaître le revenu moyen des jeunes de 16 à 24 ans, rares sont ceux qui veulent que leur propre niveau de revenu soit révélé. Voilà pourquoi des moyens sont mis en place, de la planification de l’enquête à la diffusion des résultats, pour assurer la confidentialité des informations personnelles. Généralement à l’étape de l’analyse de données, l’analyste n’a pas accès aux renseignements personnels d’une personne qui a répondu au sondage, par exemple, son nom et son prénom. Mais imaginons que l’on demande à l’analyste de calculer le revenu moyen des jeunes de 16 à 24 ans, vivant dans une petite ville, handicapés, de race noire, travaillant à temps plein et en plus que ce soit des filles, il ne serait pas surprenant de pouvoir reconnaître une vraie personne et de révéler ainsi son revenu. Il est important que si tel est le cas, l’analyste ne diffuse jamais la donnée. En fait, avant n’importe quelle diffusion, les analystes de l’Institut appliquent des règles de confidentialité qui servent à protéger les renseignements qui sont recueillis auprès des répondants d’une enquête.

Pour présenter ces résultats, l’analyste recourt souvent à des tableaux et graphiques. Plusieurs raisons expliquent le choix de l’un ou de l’autre. En général, lorsque le nombre de données à présenter est important, l’analyste privilégie les tableaux. Lorsque l’on veut faire ressortir un ou deux faits marquants, le graphique est l’outil le plus approprié. Le choix doit aussi tenir compte de la clientèle visée par la publication des résultats. Dans un cas comme dans l’autre, l’analyste doit s’assurer que les graphiques et tableaux produits sont clairs, précis et faciles à interpréter.

Comment analyser un tableau
Comment construire et analyser un graphique

Les tableaux, graphiques et autres résultats d’une analyse peuvent être publiés dans un rapport. En plus de décrire les objectifs de l’enquête et comment celle-ci a été réalisée, le rapport contient toutes les informations utiles pour bien comprendre toutes les données qui s’y trouvent, les méthodes statistiques et la description des moyens utilisés pour garantir la qualité et la confidentialité des données. En somme, la personne qui lit le rapport doit avoir toutes les réponses à ses questions.

6. Communication et diffusion
Lorsque les tableaux et graphiques sont construits et que les rapports d’analyse sont rédigés, c’est le moment de les faire connaître à la population et aux chercheurs. Pour ce faire, l’Institut utilise plusieurs moyens de communication.

Pour aider les chercheurs dans leurs travaux, l’Institut rend disponibles les données de base, c’est-à-dire les données valides recueillies lors de la collecte. Ces données sont fournies de façon confidentielle par le Service d’accès aux données à des fins de recherche.  Ce service s’assure qu’aucun nom ne puisse être associé aux données et que certains masquages sont faits pour respecter la confidentialité des personnes ou entreprises qui ont participé à l’enquête. Des conditions strictes doivent aussi être respectées par les chercheurs pour assurer la confidentialité des données.

Afin de présenter les tableaux et rapports à la population, le webmestre les diffuse sur Internet.  Ce dernier est responsable du site Web de l’Institut de A à Z. Il est chargé de la création, du contenu des pages, du référencement afin que le site soit repéré facilement par les moteurs de recherche, etc. Les documents sont aussi entreposés dans la Banque de données des statistiques officielles sur le Québec. Celle-ci contient toutes les nouvelles données qui sont diffusées sur le site Web de l’Institut, mais archive aussi les données antérieures et publie des données d’autres ministères et organismes gouvernementaux.

Même si les tableaux et rapports sont présentés sur le Web, rien ne nous assure que la population va penser à aller les consulter. C’est à ce moment que le responsable des  communications entre en jeu. Il doit utiliser les relations de presse pour faire connaître l’Institut, son site Web et ses produits. Par exemple, il travaille avec les analystes afin de rédiger un communiqué de presse. Les communiqués de presse sont des textes courts envoyés aux journalistes dans le but de les informer d’une nouveauté ou d’un événement. À l’Institut, des communiqués de presse sont rédigés afin d’annoncer la hausse du taux de chômage ou l’augmentation du nombre de naissances au Québec par exemple. Nous espérons ainsi que les journalistes parleront de nos données dans les médias et qu’ensuite les gens iront les consulter sur notre site Web.

Plus rarement, le responsable des communications organise une conférence de presse. Il invite ainsi les journalistes à pouvoir parler personnellement aux analystes de l’Institut et à leur poser des questions. De plus, le responsable des communications tient parfois un kiosque lors de conférences ou colloques pour présenter les données de l’Institut et le site Web.

Finalement, si le public n’a toujours pas trouvé ce qu’il cherche grâce au Web et aux relations de presse, il peut adresser une demande d’information au Centre d’information et de documentation de l’Institut.