Commit e0bfbfdd authored by Loïc Haÿ's avatar Loïc Haÿ

Update README.md

parent 3d7ddcf4
## Origine et références ##
- Ce jeu de données fait partie du Socle Commun des Données Locales v1.0
Un [document téléchargeable](https://docs.google.com/document/d/1Vk0kpBw3MIocai9JqovLK2HxcUA_3QHnZicqxuOpcQ8/) établit les spécifications du modèle de données.
- Un [document téléchargeable](https://docs.google.com/document/d/1Vk0kpBw3MIocai9JqovLK2HxcUA_3QHnZicqxuOpcQ8/) établit les spécifications du modèle de données.
- Les travaux de Charles Népote servent de référence pour élaborer le schéma de validation.
Ils sont disponibles sur son dépôt Github : https://github.com/CharlesNepote/liste-prenoms-nouveaux-nes
- Ils sont disponibles sur son dépôt Github : https://github.com/CharlesNepote/liste-prenoms-nouveaux-nes
## Modèle de données ##
| **Nom du champ** | **Objet** | **Obligatoire** | **Format** | **Commentaire ou référence** |
| ------------------ | -------------------------------------------------------------------------------------------------------------- | --------------- | -------------------------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------------------------------------- |
| COMMUNE_NOM | Nom officiel de la commune | NON | Texte / Majuscule initiale et minuscules > Ex : Nice, Le Mans, Épernay, Digne-les-Bains | Le renseignement de ce champ est facultatif. Il permet cependant de faciliter l'usage des données, notamment par le grand public |
| COLL_INSEE | Code INSEE de la commune où les prénoms sont enregistrés à l'état-civil, c'est-à-dire le lieu de naissance | OUI | Alphanumérique > Ex : 06088, 2B002 (pour une commune corse) | Voir le commentaire sous ce tableau |
| ENFANT_SEXE | Sexe correspondant au prénom | OUI | Texte codifié > M ou F ou I, respectivement pour masculin, féminin ou intersexué/indéterminé | Voir le commentaire sous ce tableau |
| ENFANT_PRENOM | Prénom de nouveau(x)-né(s) constaté comme premier prénom dans les actes d'état-civil de l'année correspondante | OUI | Texte > Ex: Marianne, Jean-Philippe, Gwenc'Hlan, O'Ryan, Mohamed-El-Amine | Voir le commentaire sous ce tableau |
| NOMBRE_OCCURRENCES | Nombre d'occurrences du prénom pour l'année correspondante. | OUI | Numérique > Ex : 1, 102, 5, 10, 1053 | Voir le commentaire sous ce tableau |
| ANNEE | Année de relevé, sur quatre chiffres. | OUI | Numérique > Ex : 2005, 1992,1886 | |
| **Nom du champ** | **Objet** | **Obligatoire** | **Format** | **Commentaire ou référence** |
| ------------------ | -------------------------------------------------------------------------------------------------------------- | :---------------: | -------------------------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------------------------------------- |
| COMMUNE_NOM | Nom officiel de la commune | NON | Texte / Majuscule initiale et minuscules > Ex : Nice, Le Mans, Épernay, Digne-les-Bains | Le renseignement de ce champ est facultatif. Il permet cependant de faciliter l'usage des données, notamment par le grand public |
| COLL_INSEE | Code INSEE de la commune où les prénoms sont enregistrés à l'état-civil, c'est-à-dire le lieu de naissance | OUI | Alphanumérique > Ex : 06088, 2B002 (pour une commune corse) | Voir le commentaire sous ce tableau |
| ENFANT_SEXE | Sexe correspondant au prénom | OUI | Texte codifié > M ou F ou I, respectivement pour masculin, féminin ou intersexué/indéterminé | Voir le commentaire sous ce tableau |
| ENFANT_PRENOM | Prénom de nouveau(x)-né(s) constaté comme premier prénom dans les actes d'état-civil de l'année correspondante | OUI | Texte > Ex: Marianne, Jean-Philippe, Gwenc'Hlan, O'Ryan, Mohamed-El-Amine | Voir le commentaire sous ce tableau |
| NOMBRE_OCCURRENCES | Nombre d'occurrences du prénom pour l'année correspondante. | OUI | Numérique > Ex : 1, 102, 5, 10, 1053 | Voir le commentaire sous ce tableau |
| ANNEE | Année de relevé, sur quatre chiffres. | OUI | Numérique > Ex : 2005, 1992,1886 | |
# Commentaires #
`COLL_INSEE`
Le lieu de naissance peut être différent du lieu de résidence des parents, comme cela peut être le cas pour les enfants nés dans une maternité. Issu du Code Officiel Géographique (COG), le code INSEE est composé de 5 caractères alphanumériques (les deux premiers correspondent au département et peuvent donc contenir les lettres A et B, utilisées pour la Corse).
......@@ -32,14 +33,14 @@ Tous les prénoms sont comptabilisés, y compris les prénoms uniques - un seuil
## Schéma de validation ##
| **Nom du champ** | **Type** | **Expression régulière (Regex) ou autre mécanisme de vérification** |
| ------------------ | -------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| COMMUNE_NOM | String | ^(Le |La |Les |Los |Aux |L'|)([A-ZÉÇŒÈÎ])(((-| | - |')[A-ZÉÇŒÈÎ])|('|-| |)[a-zàâéèêëïîÿôûüœç])*( \\([A-Z][a-z]*\\)|)$ |
| COLL_INSEE | String | ^([013-9]\\d|2[AB1-9])\\d{3}$ |
| ENFANT_SEXE | String | ^(M|F|I)$ |
| ENFANT_PRENOM | String | ^'?[A-ZÉÀÈÙÄËÏÖÜŸÂÊÎÔÛŶÇ][a-zéàèùäëïüöÿâêîôûŷç]*('|(('[A-ZÉÀÈÙÄËÏÖÜŸÂÊÎÔÛŶÇ][a-zéàèùäëïüöÿâêîôûŷç]*){1,2}|(-[A-ZÉÀÈÙÄËÏÖÜŸÂÊÎÔÛŶÇ][a-zéàèùäëïüöÿâêîôûŷç']*){1,2}){1,3}|)$ |
| NOMBRE_OCCURRENCES | String | ^[1-9]\\d{0,5}$ |
| ANNEE | String | ^[1-2]\\d\\d\\d$ |
| **Nom du champ** | **Type** | **RegEx ou autre mécanisme de vérification** |
| ------------------ | :--------: | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| COMMUNE_NOM | String | ```^(Le |La |Les |Los |Aux |L' |)([A-ZÉÇŒÈÎ])(((-| | - |')[A-ZÉÇŒÈÎ])|('|-| |)[a-zàâéèêëïîÿôûüœç])*( \\([A-Z][a-z]*\\)|)$``` |
| COLL_INSEE | String | ```^([013-9]\\d|2[AB1-9])\\d{3}$``` |
| ENFANT_SEXE | String | ```^(M|F|I)$``` |
| ENFANT_PRENOM | String | ```^'?[A-ZÉÀÈÙÄËÏÖÜŸÂÊÎÔÛŶÇ][a-zéàèùäëïüöÿâêîôûŷç]*('|(('[A-ZÉÀÈÙÄËÏÖÜŸÂÊÎÔÛŶÇ][a-zéàèùäëïüöÿâêîôûŷç]*){1,2}|(-[A-ZÉÀÈÙÄËÏÖÜŸÂÊÎÔÛŶÇ][a-zéàèùäëïüöÿâêîôûŷç']*){1,2}){1,3}|)$``` |
| NOMBRE_OCCURRENCES | String | ```^[1-9]\\d{0,5}$``` |
| ANNEE | String | ```^[1-2]\\d\\d\\d$``` |
## Notes de version ##
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment