Information sur le datacamp: https://www.etalab.gouv.fr/event/open-data-camp-cadastre-electoral
Inscription ouverte sur: https://rdv.etalab.gouv.fr/e/11/open-data-camp-cadastre-electoral
Durant cette journée, les participants sont invités à travailler sous la forme d’ateliers afin de répondre à plusieurs défis :
-
Comment réaliser une cartographie des bureaux de vote à partir des seuls arrêtés préfectoraux ?
-
Quelles méthodes et quels procédés pour généraliser la géolocalisation des bureaux de vote et standardiser les arrêtés préfectoraux ?
-
Et tous les autres défis que vous pourrez proposer !
Ces arrêtés définissent les limites géographiques des bureaux de vote.
Ils sont en deux partie, c'est dans la partie des annexes que se trouvent la définition textuelle ou sous forme de tableaux des bureaux de votes.
Ils ne sont facilement disponibles en général que sous forme de PDF scannés.
Leur contenu et formatage est hétérogène, c'est donc le principal challenge de ce datacamp !
Elles sont disponibles sous forme de fichiers CSV conprenant uniquement:
- le N° du bureau de vote
- l'adresse (numéro et libellé de voie)
- le code postal
- le nom de la commune (ou libellé d'acheminement postal)
Ces fichiers CSV ont été générés à partir de 3 types de sources:
- des fichiers CSV
- des tableaux Excel
- des fichiers XML
Ils ont été remis en forme pour avoir une structure identique (ce qui n'était pas le cas dans les sources).
Ils ont ensuite été géocodés à l'aide de l'API publique de la Base Adresse Nationale (http://adresse.data.gouv.fr/api/) et leur contenu est trié par "score" croissant afin de faire remonter les adresses ayant un géocodage peu fiable en premier.
Vous pouvez d'ores et déjà travailler sur les documents et données mis à disposition.
N'hésitez pas à proposer vos améliorations en amont du datacamp, ceci permettra sûrement de produire certains résultats intermédiaires. Vous pouvez faire des "pull-request" pour intégrer vos améliorations sur ce projet git.
De même, les "issues" peuvent servir d'espace de discussion et le wiki peut servir à documenter les méthodes, process et outils utilisés.
A titre d'information les scripts utilisés pour les traitements préparatoires sont dans le dossier "scripts".