Aller au contenu principal

Les effets de composition (1)

16 juin 2022

Effets de compositionEn lisant de nombreuses analyses sur la situation économique actuelle, que ce soit sur l’emploi, les salaires ou l’inflation, et même sur d’autres sujets, je me suis aperçu que le concept des effets de composition est bien moins compris que je le pensais et donc que cela pourrait être intéressant d’y consacrer un ou même deux billets. Il semble en effet difficile de développer des automatismes pour détecter leur influence ou leurs conséquences sur les données. Je vais dans ce premier billet séparer les effets de composition en deux types, soit quand on compare des données pour des populations différentes et quand on analyse la variation dans le temps des données d’une même population (qui n’est en fait plus la même!).

Populations différentes

– Marché du travail des immigrant.es : J’ai réagi en mai 2021 à une chronique de Jean-François Lisée qui comparait les données sur le marché du travail des immigrant.es à celles des natif.ives en expliquant qu’il fallait tenir compte de la composition démographique de ces deux groupes avant de faire ce genre de comparaison. J’ai ensuite consacré un billet plus complet à cette question, en montrant notamment que les immigrant.es récent.es ne comptent presque pas de personnes âgées de 55 ans et plus (et encore moins de 65 ans et plus) et beaucoup plus de jeunes âgé.es de 15 à 24 ans que les natif.ives, et que les immigrant.es de longue date comptent à l’inverse plus de personnes âgées et moins de jeunes. Pour contrer les effets de ces compositions démographiques différentes, Statistique Canada et moi (et bien d’autres personnes et organismes, dont l’Institut du Québec dans ce rapport récent) comparons plutôt les données sur les personnes âgées de 25 à 54 ans.

M. Lisée n’est pas le seul à avoir mal interprété ces données. Plus récemment, on peut lire dans cet article de La Presse qui cite l’économiste en chef et responsable du développement économique à la Communauté métropolitaine de Montréal (CMM), Sylvain Giguère, que «Pour la première fois depuis des décennies, le taux d’emploi des immigrant.es a surpassé en 2021 dans la grande région de Montréal celui des personnes nées au Canada, du jamais-vu». C’est vrai, leur taux d’emploi de 62,1 % a surpassé celui de 61,9 % des natif.ves en 2021. Il lui était égal en 2020 à 59,5 % et inférieur auparavant, selon le tableau 14-10-0083-01 de Statistique Canada. L’économiste cité ne précise toutefois pas que c’était déjà le cas pour l’ensemble du Québec chaque année depuis 2016, car la population native est plus âgée dans l’ensemble du Québec que dans la région métropolitaine de recensement (RMC) de Montréal ni que, pour la population âgée de 25 à 54 ans, les immigrant.es tiraient encore de l’arrière fortement en 2021, avec un taux d’emploi de 78,0 % par rapport à celui de 86,0 % pour les natif.ives. Il n’affirme au moins pas que les immigrant.es récent.es sont encore plus choyé.es avec un taux d’emploi de 65,3 % (par rapport à 61,9 % pour les natif.ives). Heureusement, car il est de 70,1 % chez les immigrant.es récent.es âgé.es de 25-54 ans (par rapport à 86,0 % pour les natif.ives). Bref, les effets de composition semblent bien mystérieux pour certaines personnes…

– Marché du travail entre les provinces : Dans mes billets sur le marché du travail au Québec et au Canada, et la COVID-19 (dont celui-ci), je mettais toujours en garde contre les comparaisons directes des taux d’emploi et d’activité entre le Québec et le reste du Canada. Comme Statistique Canada publie des données selon 12 tranches d’âge plutôt que trois pour les immigrant.es, on peut utiliser une méthode plus sophistiquée pour faire ces comparaisons correctement que de simplement comparer la situation des 25-54 ans. On peut dans ce cas utiliser les taux d’emploi et d’activité de chacune de ces tranches d’âge du Québec et les multiplier par la part de ces tranches dans la population totale du reste du Canada, puis les additionner. Cela permet une comparaison encore plus précise et juste.

Par exemple, en mai 2022, le taux d’activité dans le reste du Canada était de 66,4 %, 2,0 points de plus qu’au Québec. Par contre, si la composition démographique avait été au Québec la même que dans le reste du Canada, son taux d’activité aurait été de 66,6 %, 0,2 point de plus que dans le reste du Canada! Bref, la composition démographique du Québec lui faisait «perdre» 2,2 points de pourcentage de taux d’activité par rapport à celle du reste du Canada. La principale raison de cet écart était la proportion différente de personnes âgées de 65 ans et plus dans la population âgée de 15 ans et plus, soit 24,2 % au Québec et 21,4 % dans le reste du Canada.

– Résultats scolaires des écoles : Les effets de composition ne dépendent pas que de la démographie, mais de nombreux autres facteurs. C’est pourquoi les comparaisons entre les écoles, comme celles que faisait jusqu’en 2008 le palmarès des écoles secondaires de l’Actualité (avec l’aide des Instituts Fraser et économique de Montréal, deux organismes pas du tout idéologiques…), n’ont aucune valeur, même en tenant compte de variables socio-économiques, comme l’indice de milieu socio-économique (IMSE) du ministère de l’Éducation. En effet, même si les variables socio-économiques influencent la réussite éducative et sont liées au décrochage scolaire, ces indices sont en fait des moyennes de ces variables pour un secteur donné qu’on applique à chaque famille habitant ce secteur, peu importe leurs carcactéristiques réelles. En plus, la réussite dépend de nombreux autres facteurs, dont quelques-uns sont individuels (environnement familial et social, encouragements, intérêts, aptitudes et bien d’autres). Or, les écoles qui se classaient le mieux dans ce palmarès étaient toujours des écoles, privées ou publiques, qui sélectionnaient leurs élèves. Bref, on n’obtenait pas un palmarès des meilleures écoles, mais un palmarès des «meilleur.es» élèves… Pour plus de détails sur cette question, je conseille la lecture de ce texte intitulé Une analyse des effets de composition du groupe-classe au Québec : influence de la ségrégation scolaire et des projets pédagogiques.

Variations au sein d’une même population

– Marché du travail : La méthode que j’ai expliquée dans la section précédente, c’est-à-dire d’appliquer la composition démographique d’une population à une autre, permet aussi d’estimer l’effet du vieillissement et d’autres changements démographiques d’une même population, comme je l’ai fait en 2017 dans ce billet. Pour illustrer les résultats que j’ai obtenus avec cette méthode, j’ai reproduit ci-après en le mettant à jour un des graphiques que j’avais présentés dans ce billet.

Effets de composition_1_taux d'emploi

La ligne bleue représente le taux d’emploi réel, tel que publié dans le tableau 14-10-0327-01 de Statistique Canada. La ligne rouge est le résultat de l’application de la structure démographique de 1976 (pourcentage de la population adulte dans les 12 tranches d’âge pour lesquelles ce tableau fournit des données, soit 15-19 ans, 20-24 ans, jusqu’à 65-69 ans et 70 ans et plus) aux taux d’emploi de ces 12 tranches d’âge de 1976 à 2021.

On peut voir que l’écart entre les deux lignes est très faible jusqu’en 1997 (moins de 0,5 point de pourcentage), qu’il augmente légèrement jusqu’en 2002, année où l’écart entre le taux réel et le taux ajusté avec la structure démographique de 1976 dépasse 2 points, et qu’il s’agrandit plus rapidement par la suite pour atteindre 5 points en 2012 et finalement 8,5 points en 2021. Cela veut dire que, si la population du Québec avait gardé sa structure démographique de 1976 tout en conservant ses taux d’emploi par tranches d’âge de 2021, son taux d’emploi global aurait été en 2021 de 68,6 % plutôt que de 60,1 %. Au lieu de rester assez stable depuis 2003 (60,1 % en 2003 et en 2021), ce taux aurait augmenté de près de 6 points entre 2003 et 2021. Dit autrement, si ses taux d’emploi par tranche d’âge étaient demeurés les mêmes qu’en 2003, son taux d’emploi global aurait chuté à 52,9 % plutôt que de demeurer à 60,1 %. On voit avec ces exemples que ces calculs permettent de quantifier aussi bien l’impact du vieillissement que celui de l’amélioration des taux d’emploi par tranche d’âge.

– Données touchant les jeunes (population âgée de 15 à 24 ans) : Les jeunes, soit les personnes âgées de 15 à 24 ans, sont une des populations les plus difficiles à analyser. La première des difficultés est qu’une personne âgée de 15 ans a peu de caractéristiques communes avec une autre âgée de 24 ans. Et, même le recensement ne fournit pas de données par âge précis, sinon leur nombre selon le genre… Pourtant, il est clair que les jeunes de 15 ans ont un taux de fréquentation scolaire de près de 100 %, ce qui est loin d’être le cas des jeunes de 24 ans, que les premier.ères ont un taux d’emploi bien moins élevé que les deuxièmes, mais un taux de chômage bien plus élevé, et qu’iels sont proportionnellement moins nombreux.euses à détenir un permis de conduire. Entre autres…

Effets de composition_1_jeunesLe graphique ci-contre, tiré des données du tableau 17-10-0005-01 de Statistique Canada, montre l’évolution de la part des jeunes âgé.es de 15 ans et de 24 ans parmi les 15-24 ans. Si le nombre de personnes était parfaitement réparti dans les 10 âges compris dans cette tranche d’âge, on retrouverait 10 % de cette population dans chacun de ces 10 âges. Le graphique montre que ce n’est pas le cas!

En fait, on a compté une proportion moyenne de 9,2 % de jeunes âgé.es de 15 ans et de 10,6 % âgé.es de 24 ans entre 1976 et 2021. Ainsi, le nombre de jeunes âgées de 15 ans n’a été plus élevé que le nombre de jeunes âgées de 24 ans qu’au cours de 9 des 46 années étudiées. Comment est-ce possible? Simplement parce que le nombre de personnes dans cette tranche d’âge a presque constamment diminué, pour une baisse de 31,0 % entre 1976 et 2021. L’écart le plus élevé entre les deux a été observé en 1987, un écart de 4,0 points, soit 12,22 % de 24 ans et 8,22 % de 15 ans. Il est donc clair qu’en 1987, les données montraient un taux de fréquentation scolaire anormalement bas et un taux d’emploi artificiellement élevé, et que c’était l’inverse en 1976, 1996 ou 2007, trois années où il y avait plus de jeunes âgé.es de 15 ans que de 24 ans.

La composition démographique n’est pas la seule caractéristique dont il faut tenir compte quand on analyse les données de cette population. Il faut aussi tenir compte de leur fréquentation scolaire (par exemple, le taux d’emploi des étudiant.es à temps plein est toujours beaucoup moins élevé que celui des non-étudiants, avec une différence qui a varié de 24 à 51 points de pourcentage au cours de cette période, selon le tableau 14-10-0081-01), de la scolarité et du revenu de leurs parents, et j’en passe. Bref, il faut faire très attention quand on regarde l’évolution des données dans ce groupe d’âge et quand on compare ces données entre des territoires (provinces ou pays).

– Revenu des ménages : Le revenu des ménages (ou des familles) est un autre domaine où les effets de composition sont très nombreux, ce qui peut fausser nos analyses. Les facteurs qui ont le plus fort potentiel de les fausser sont l’évolution de la taille des ménages et celle du type de ménage. Ces effets de composition peuvent être tellement importants que c’est avec ces données que j’ai trouvé le plus beau paradoxe de Simpson que j’ai vu dans mon existence. Précisons qu’un paradoxe de Simpson est un cas où tous les éléments d’un tout diminuent alors que le tout augmente ou vice-versa. Par exemple, dépendant de la composition démographique des 15-24 ans, le taux de fréquentation scolaire pourrait augmenter pour les 15-19 et les 20-24, mais baisser pour l’ensemble des 15-24 (si la proportion de 20-24 augmentait tout d’un coup).

Le paradoxe de Simpson exceptionnel dont je parlais plus tôt se trouve dans un tableau que j’ai vu dans une étude de Luc Godbout et Suzie St-Cerny qui a été publiée par la Chaire de recherche en fiscalité et en finances publiques de l’Université de Sherbrooke et que j’ai présentée dans ce billet. Comme ce tableau comparait les revenus de 1976 et de 2011, j’ai pensé le mettre à jour en utilisant des données plus récentes.

Effets de composition_1_revenus

En mettant ce tableau à jour à l’aide des données du tableau 11-10-0190-01, j’ai réalisé que le paradoxe de Simpson s’observait en fait seulement jusqu’en 2016. J’ai donc indiqué dans ce tableau les données de 1976, 2016 et celles de 2020, les plus récentes.

Ce tableau montre que le revenu médian après impôt en dollars constants de 2020 de l’ensemble des unités familiales a diminué de 0,9 % entre 1976 et 2016, mais que le revenu médian des cinq types d’unités familiales a augmenté d’au moins 27,2 % et même de plus de 80 % dans un cas! Notons que ces cinq types de familles ne sont pas toutes mutuellement exclusives. En effet, les couples avec enfants et les familles monoparentales peuvent avoir comme chef.fe de famille une personne non âgée ou âgée (ce qui est sûrement moins souvent le cas). D’ailleurs, on peut voir dans la seconde partie du tableau que le nombre d’unités familiales correspond à la somme des familles de personnes âgées et non âgées, et des personnes seules.

Ce paradoxe s’explique bien. En effet, on peut voir dans la deuxième partie de ce tableau que, si le nombre d’unités familiales a augmenté de 76,2 % entre ces deux années, cette hausse fut de 145,1 % pour celles de personnes âgées, de 80,3 % pour les familles monoparentales et de 219,1 % pour les personnes seules, trois types d’unités familiales qui avaient un revenu inférieur à la moyenne en 1976, et que ce nombre a baissé de 27,1 % chez les couples avec enfants, type de famille qui avait en 1976 et en 2016 (ainsi qu’en 2020) de loin le revenu le plus élevé. Comme les types d’unités familiales à faible revenu étaient proportionnellement plus nombreuses en 2016 qu’en 1976 et le type de famille à revenu plus élevé proportionnellement moins nombreux, la moyenne des revenus a baissé.

Le tableau montre aussi que le revenu de toutes les unités familiales a augmenté entre 1976 et 2020, donc qu’il n’y a pas dans ce cas de paradoxe de Simpson. Par contre, on peut voir que le revenu de l’ensemble des unités familiales a augmenté de seulement 12,2 %, alors que le revenu des cinq types de ménages a augmenté beaucoup plus (d’entre 47,3 % et 117,3 %, soit d’entre 3,9 et 9,6 fois plus!), ce qui demeure contre-intuitif.

Et alors…

Quand j’ai réalisé qu’après tout ce contenu je n’avais pas encore commencé de parler de quatre sujets que j’avais en tête en plus de ceux abordés ici, dont les trois qui m’ont incité à écrire ce billet, j’ai décidé de consacrer deux billets aux effets de composition, qui est de toute façon un concept suffisamment important pour que ça vaille la peine de l’aborder à fond. Ces quatre sujets sont l’évolution de la productivité, des salaires et de l’inflation depuis le début de la pandémie et un article du magazine Pivot (que j’aime bien) qui contient malheureusement quelques mauvaises interprétations dues à des effets de composition dans des domaines différents de ceux que j’ai abordés dans ce premier billet. À suivre dans ce billet!

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s

%d blogueurs aiment cette page :