Bienvenue dans ReStore
Les données provenant de nombreuses sources, y compris les enregistrements administratifs et les enquêtes, sont de plus en plus enregistrées en association avec des informations d’adresse complètes. Au cours des décennies précédentes, de nombreux ensembles de données de ce type ne contenaient qu’un code postal ou un nom de lieu. Les informations d’adresse sont d’une grande valeur pour le référencement géographique, mais la structure potentiellement complexe des adresses doit être comprise afin de maximiser les avantages potentiels pour la cartographie ou la liaison de données.
Adresses en pratique
Il est important de reconnaître que les informations de localisation enregistrées dans la plupart des adresses postales ne correspondent en aucune manière directe aux références géographiques attachées à la plupart des ensembles de données de sciences sociales. Ceci peut être illustré par quelques exemples.
Exemple d’adresse 1:
Adresse | Éléments d’adresse |
39 Acacia Avenue | Numéro de propriété et adresse municipale |
Silhurst | Ville postale |
SH15 6BP | Code postal de l’unité |
Dans ce très exemple simple, tous les éléments requis sont présents pour faire une adresse postale valide. Il s’agit notamment d’un identifiant de propriété (dans ce cas un numéro de maison, bien que dans d’autres circonstances, il puisse s’agir d’un nom de maison), le nom de la voie (rue), la ville postale et le code postal. Ces éléments sont entièrement suffisants à des fins quotidiennes telles que la livraison du courrier ou la visite de l’adresse. Cependant, peu de ces éléments sont susceptibles de se rapporter sans ambiguïté aux unités géographiques et aux codes utilisés pour la plupart des données en sciences sociales. Le numéro de maison «39» peut correspondre exactement à une propriété qui est une unité d’étude. Cependant, si le chercheur s’intéresse vraiment aux ménages, aux particuliers ou aux entreprises, il est important de reconnaître que le nombre 39 peut ne pas être suffisant pour identifier sans ambiguïté les unités d’intérêt. «Acacia Avenue» ne correspondra directement à aucune unité statistique – en effet, une longue rue traversera souvent de nombreuses zones géographiques différentes avec des codes différents et des données statistiques disponibles. «Silhurst», une ville postale, est une entité géographique définie pour la distribution du courrier et il est très peu probable qu’elle corresponde exactement à un quartier de recensement, une zone de super production, un district d’autorité locale ou une autre zone géographique standard. Le code postal de l’unité «SH15 6BP» ne constitue pas à lui seul une zone statistique, mais peut être associé à la plupart des unités géographiques officielles à l’aide d’annuaires standard. Il est probable que l’adresse, dans son intégralité, puisse être mise en correspondance avec une ou plusieurs entrées dans les principales listes d’adresses nationales. Il est également possible qu’elle ne corresponde pas de manière unique pour diverses raisons – par exemple s’il y a plus d’un lotissement de la propriété au 39, avenue Acacia, ou s’il y a plus d’une avenue Acacia à Silhurst. La certitude supplémentaire fournie par le code postal de l’unité, qui se rapporte généralement à environ 15 adresses, explique l’utilité du code postal comme référence de localisation.
Exemple d’adresse 2:
Adresse | Éléments d’adresse |
Geo-Refer Enterprises Inc. | Nom de l’entreprise |
Appartement B | Lotissement de propriété |
39, avenue Acacia | Numéro et adresse de la propriété |
North End | Adresse de la localité |
Silhurst | Ville de poste |
Loamshire | Comté |
SH15 6BP | Code postal de l’unité |
Dans cet exemple, quatre éléments supplémentaires ont été ajoutés à l’exemple d’adresse 1, qui démontrent des aspects supplémentaires de la structure d’adresse. Geo-Refer Enterprises Inc. semble être un nom commercial. Ceci est susceptible d’être important pour certains chercheurs, mais cela ne fait pas officiellement partie de l’adresse. Cela peut être l’adresse enregistrée de nombreuses entreprises différentes et les noms commerciaux sont souvent sujets à de fréquents changements alors que la propriété elle-même reste la même. « Flat B » suggère que la propriété au « 39 Acacia Avenue » soit subdivisée. Certaines adresses résidentielles sont également utilisées comme adresses professionnelles et il peut être très difficile de séparer ces différents types d’adresses à des fins d’analyse. De même, il est difficile de confirmer si un enregistrement relatif à «Appartement B, 39 Acacia Avenue» correspond effectivement à la même adresse qu’un enregistrement pour «39 Acacia Avenue». Dans cet exemple, un nom de localité « North End » a été inclus.La localité est une partie nécessaire de l’adresse postale de Royal Mail s’il y a plus d’une « avenue Acacia » dans la ville postale « Silhurst ». La localité ne présente pas d’association plus forte avec les géographies administratives ou statistiques que la ville postale. Le nom du comté est souvent inclus dans les adresses postales, mais n’est pas obligatoire et il ne peut pas être garanti que le comté correspondra au comté administratif du même nom.
Exemple d’adresse 3:
Adresse | Éléments d’adresse |
501a Halfway Street | Numéro de propriété et adresse postale |
Sidcup | Ville de la poste |
Kent | Comté |
DA15 7XZ | Code postal de l’unité |
Bien que cette adresse exacte est fictif, ses éléments majeurs sont authentiques et il sert à démontrer l’inadéquation entre les géographies postales et administratives. La ville postale de Sidcup ne fait pas partie du comté administratif de Kent mais de l’arrondissement londonien de Bexley. Le district postal DA15 concerne Dartford, qui se trouve en fait dans le Kent. Halfway Street se situe principalement dans le London Borough of Bexley mais s’étend sur une petite distance dans le London Borough of Greenwich. Il doit donc être clair qu’aucun des éléments d’adresse postale ne doit être utilisé directement comme base de référencement géographique. L’adresse complète et structurée ou le code postal de l’unité doivent être comparés à un répertoire de confiance afin de fournir les codes géographiques correspondants à un niveau de résolution approprié.
Dans la mesure du possible, les chercheurs doivent chercher à enregistrer, stocker et manipuler les informations d’adresse dans un format structuré, même si une adresse entièrement conforme aux normes ne peut pas être produite. Le fractionnement des adresses en champs séparés et le fait d’exiger que chacun des principaux éléments soit clairement délimité augmentera toujours l’utilité des informations d’adresse et facilitera la correspondance. La correspondance des chaînes de texte des adresses est complexe et il existe de nombreuses causes de confusion potentielle, notamment des variantes orthographiques, des langues multiples et des abréviations de variantes. Celles-ci sont nettement réduites lorsque les informations sont clairement structurées. Les chercheurs qui doivent effectuer une correspondance de listes d’adresses à grande échelle devraient envisager d’utiliser des logiciels ou des services de correspondance d’adresses commerciales.