Naissances en France

Ce sujet est inspiré du sujet sur les naissances en France, par R. Lobry. Ici, on propose en plus un exercice utilisant l'Analyse en Composantes Principales (ACP).

On considère chaque année comme une observation, et les nombres de naissances mensuelles comme des variables. Alors, les deux premières composantes totalisent 90% de l'inertie.

La première composante est pratiquement constante, elle représente les variations en niveau. Les projections sur le premier axe sont peu prévisibles.

En revanche, la seconde composante a une forme très marquée, et son évolution est presque linéaire (corrélation de 0,9 avec l'année). Cette seconde composante décrit une évolution presque déterministe de la répartition des naissances dans l'année : le pic de naissances au printemps s'atténue, les naissances deviennent plus uniformes dans l'année.

L'année moyenne

Les deux premières composantes

Les projections sur les deux premiers axes

Intérêt pédagogique

On est ici amené à représenter les composantes principales et les projections sur les axes principaux de manière inhabituelle.

Le calcul du nombre de naissances par jour pose le problème des années bissextiles. Le traitement exact est facile, mais il est en plus facile de montrer a priori qu'il est indispensable, puisque la variabilité des anissances mensuelles est de l'ordre de 3%, soit l'erreur introduite en oubliant les années bissextiles.

Les données

Retour projets