Commit 3d7ddcf4 authored by Loïc Haÿ's avatar Loïc Haÿ

Update README.md

parent 1d51e153
## Origine et références ##
Ce jeu de données fait partie du Socle Commun des Données Locales v1.0
- Ce jeu de données fait partie du Socle Commun des Données Locales v1.0
Un [document téléchargeable](https://docs.google.com/document/d/1Vk0kpBw3MIocai9JqovLK2HxcUA_3QHnZicqxuOpcQ8/) établit les spécifications du modèle de données.
Un document téléchargeable établit les spécifications du modèle de données.
Les travaux de Charles Népote servent de référence pour élaborer le schéma de validation.
Ils sont disponibles sur son dépôt Github : [https://github.com/CharlesNepote/liste-prenoms-nouveaux-nes](https://github.com/CharlesNepote/liste-prenoms-nouveaux-nes)
- Les travaux de Charles Népote servent de référence pour élaborer le schéma de validation.
Ils sont disponibles sur son dépôt Github : https://github.com/CharlesNepote/liste-prenoms-nouveaux-nes
## Modèle de données ##
| Champ | Objet | Obligatoire | Format | Commentaire |
| ------------------ | ----------------------------------- | :-----------: | --------------------------------------------------------------------------------------- | -------------------------------------------------------------------- |
| `COMMUNE_NOM` | Nom officiel de la commune | NON | Texte / Majuscule initiale et minuscules / Ex : Nice, Le Mans, Épernay, Digne-les-Bains | Ce champ facilite l'usage des données, notamment par le grand public |
| **Nom du champ** | **Objet** | **Obligatoire** | **Format** | **Commentaire ou référence** |
| ------------------ | -------------------------------------------------------------------------------------------------------------- | --------------- | -------------------------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------------------------------------- |
| COMMUNE_NOM | Nom officiel de la commune | NON | Texte / Majuscule initiale et minuscules > Ex : Nice, Le Mans, Épernay, Digne-les-Bains | Le renseignement de ce champ est facultatif. Il permet cependant de faciliter l'usage des données, notamment par le grand public |
| COLL_INSEE | Code INSEE de la commune où les prénoms sont enregistrés à l'état-civil, c'est-à-dire le lieu de naissance | OUI | Alphanumérique > Ex : 06088, 2B002 (pour une commune corse) | Voir le commentaire sous ce tableau |
| ENFANT_SEXE | Sexe correspondant au prénom | OUI | Texte codifié > M ou F ou I, respectivement pour masculin, féminin ou intersexué/indéterminé | Voir le commentaire sous ce tableau |
| ENFANT_PRENOM | Prénom de nouveau(x)-né(s) constaté comme premier prénom dans les actes d'état-civil de l'année correspondante | OUI | Texte > Ex: Marianne, Jean-Philippe, Gwenc'Hlan, O'Ryan, Mohamed-El-Amine | Voir le commentaire sous ce tableau |
| NOMBRE_OCCURRENCES | Nombre d'occurrences du prénom pour l'année correspondante. | OUI | Numérique > Ex : 1, 102, 5, 10, 1053 | Voir le commentaire sous ce tableau |
| ANNEE | Année de relevé, sur quatre chiffres. | OUI | Numérique > Ex : 2005, 1992,1886 | |
- COMMUNE_NOM
- Nom officiel de la commune
`COLL_INSEE`
Le lieu de naissance peut être différent du lieu de résidence des parents, comme cela peut être le cas pour les enfants nés dans une maternité. Issu du Code Officiel Géographique (COG), le code INSEE est composé de 5 caractères alphanumériques (les deux premiers correspondent au département et peuvent donc contenir les lettres A et B, utilisées pour la Corse).
- COLL_INSEE
- Code INSEE de la commune
`ENFANT_SEXE`
L'information est importante car certains prénoms sont aussi bien masculins que féminin, comme Camille. "I" signale un genre spécifiquement intersexué ou indéterminé ; il ne mentionne pas un sexe inconnu. "I" n'est théoriquement pas encore utilisé en France mais plusieurs pays on créé un tel statut et de nombreux éléments suggèrent une évolution prochaine du droit en France (affaires judiciaires, recommandations d'experts juridiques, demandes des associations, etc.).
- ENFANT_SEXE
- Sexe correspondant au prénom : M ou F ou I, respectivement pour masculin, féminin ou intersexué/indéterminé
`ENFANT_PRENOM`
Un acte de naissance peut désigner un nouveau-né avec plusieurs prénoms et le législateur a prévu que "tout prénom inscrit dans l'acte de naissance peut être choisi comme prénom usuel." (article 52 du Code Civil). La plupart du temps le premier prénom est le prénom d'usage initialement choisi par le(s) parent(s). Cette spécification ne retient donc que le premier prénom : si un nouveau-né est appelé "Armelle Julia Blanche", seul "Armelle" sera retenu pour constituer ce jeu de données. Un prénom composé comme Marie-Jeanne compte pour un prénom complet. Le site service-public.fr signale que "l'alphabet utilisé doit être celui qui sert à l'écriture du français. Les caractères alphabétiques étrangers ne sont donc pas autorisés (par exemple le « ñ »)". Outre les caractères alphabétiques, un prénom peut posséder un trait d'union, voire deux, comme dans Lou-Anne ou Mohamed-El-Amine. Des prénoms peuvent posséder une apostrophe comme dans Gwenc'Hlan ou N'Deye, voire peut-être deux. Nous considérons aussi qu'un prénom pourrait terminer voire débuter par une apostrophe - cette dernière étant parfois utilisée en français pour marquer la suppression de la finale ou du début d'un mot, comme dans Boul' Mich'.
- ENFANT_PRENOM
- Prénom de nouveau(x)-né(s) constaté comme premier prénom dans les actes d'état-civil de l'année correspondante
- NOMBRE_OCCURRENCES
- Nombre d'occurrences du prénom pour l'année correspondante
- ANNEE
- Année de relevé, sur quatre chiffres
`NOMBRE_OCCURRENCES`
Tous les prénoms sont comptabilisés, y compris les prénoms uniques - un seuil minimum est exclu car il conduirait à passer sous silence une importante part des naissances, voire la totalité dans les petites communes. La valeur de ce champ est donc un nombre entier d'un à 6 chiffres maximum, 0 étant exclu.
## Schéma de validation ##
| **Nom du champ** | **Type** | **Expression régulière (Regex) ou autre mécanisme de vérification** |
| ------------------ | -------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| COMMUNE_NOM | String | ^(Le |La |Les |Los |Aux |L'|)([A-ZÉÇŒÈÎ])(((-| | - |')[A-ZÉÇŒÈÎ])|('|-| |)[a-zàâéèêëïîÿôûüœç])*( \\([A-Z][a-z]*\\)|)$ |
| COLL_INSEE | String | ^([013-9]\\d|2[AB1-9])\\d{3}$ |
| ENFANT_SEXE | String | ^(M|F|I)$ |
| ENFANT_PRENOM | String | ^'?[A-ZÉÀÈÙÄËÏÖÜŸÂÊÎÔÛŶÇ][a-zéàèùäëïüöÿâêîôûŷç]*('|(('[A-ZÉÀÈÙÄËÏÖÜŸÂÊÎÔÛŶÇ][a-zéàèùäëïüöÿâêîôûŷç]*){1,2}|(-[A-ZÉÀÈÙÄËÏÖÜŸÂÊÎÔÛŶÇ][a-zéàèùäëïüöÿâêîôûŷç']*){1,2}){1,3}|)$ |
| NOMBRE_OCCURRENCES | String | ^[1-9]\\d{0,5}$ |
| ANNEE | String | ^[1-2]\\d\\d\\d$ |
## Notes de version ##
- Version 1.0 (reprise de la version 1.1 de Charles Népote)
\ No newline at end of file
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment