Velkommen til ReStore
Data fra mange kilder, herunder administrative poster og undersøgelser, registreres i stigende grad i forbindelse med fuld adresseoplysninger. I de foregående årtier indeholdt mange af disse datasæt kun et postnummer eller et stednavn. Adresseoplysninger er af stor værdi for geografisk henvisning, men den potentielt komplekse struktur af adresser skal forstås for at maksimere potentielle fordele ved kortlægning eller datakobling.
Adresser i praksis
Det er vigtigt at erkende, at lokaliseringsinformationen, der er registreret i de fleste postadresser, ikke på nogen måde svarer til de geografiske referencer, der er knyttet til de fleste samfundsvidenskabelige datasæt. Dette kan illustreres ved hjælp af nogle eksempler.
Adresseeksempel 1:
Adresse | Adresseelementer |
39 Acacia Avenue | Ejendomsnummer og gadenavn |
Silhurst | Postby |
SH15 6BP | Enhedens postnummer |
I dette meget simpelt eksempel er alle de nødvendige elementer til stede for at oprette en gyldig postadresse. Disse inkluderer en ejendomsidentifikator (i dette tilfælde et husnummer, skønt det under andre omstændigheder kan være et husnavn), hovedvej (gade), postby og postnummer. Disse elementer er fuldstændig tilstrækkelige til hverdagsformål som at levere post eller besøge adressen. Imidlertid er det kun få af disse elementer, der sandsynligvis vil forholde sig entydigt til de geografiske enheder og koder, der bruges til de fleste samfundsvidenskabelige data. Husnummer ’39’ kan svare nøjagtigt til en ejendom, der er en studienhed. Men hvis forskeren virkelig er interesseret i husholdninger, enkeltpersoner eller virksomheder, er det vigtigt at erkende, at nummer 39 muligvis ikke er tilstrækkeligt til entydigt at identificere de interesseenheder. ‘Acacia Avenue’ svarer ikke direkte til nogen statistisk enhed – faktisk vil en lang gade ofte skære gennem mange forskellige geografiske områder med forskellige koder og tilgængelige statistiske data. ‘Silhurst’, en postby, er en geografisk enhed, der er defineret til postleveringsformål og svarer højst usandsynligt nøjagtigt til nogen folketællingsafdeling, super outputområde, kommunal distrikt eller andet standard geografisk område. Enhedens postnummer ‘SH15 6BP’ omfatter ikke i sig selv et statistisk område, men kan tilknyttes de fleste officielle geografiske enheder ved hjælp af standardmapper. Det er sandsynligt, at adressen i sin helhed kunne matches med en eller flere poster på de store nationale adresselister. Det er lige så muligt, at det muligvis ikke kan matche unikt af forskellige årsager – for eksempel hvis der er mere end en underopdeling af ejendommen på Acacia Avenue 39, eller hvis der er mere end en Acacia Avenue i Silhurst. Den yderligere sikkerhed, der leveres af enhedens postnummer, som typisk vedrører omkring 15 adresser, forklarer postnummerets anvendelighed som en lokalreference.
Adresseeksempel 2:
Adresse | Adresseelementer |
Geo-Refer Enterprises Inc. | Virksomhedsnavn |
Flad B | Ejendomsinddeling |
39 Acacia Avenue | Ejendomsnummer og gadenavn |
North End | Lokalitetsadresse |
Silhurst | Postby |
Loamshire | County |
SH15 6BP | Enhedens postnummer |
I dette eksempel er der tilføjet fire yderligere elementer til adresseeksempel 1, som viser yderligere aspekter af adressestruktur. Geo-Refer Enterprises Inc. ser ud til at være et firmanavn. Dette er sandsynligvis vigtigt for nogle forskere, men det er ikke formelt en del af adressen. Dette kan være den registrerede adresse på mange forskellige virksomheder, og virksomhedsnavne kan ofte ændres, mens ejendommen selv forbliver den samme. “Flad B” antyder, at ejendommen ved “39 Acacia Avenue” er opdelt. Nogle boligadresser bruges også som forretningsadresser, og det kan være meget vanskeligt at adskille disse forskellige adresser til analytiske formål. Tilsvarende er det vanskeligt at bekræfte, om en post, der vedrører “Flad B, 39 Acacia Avenue” faktisk svarer til den samme adresse som en post for “39 Acacia Avenue”. I dette eksempel er et lokalitetsnavn “North End” medtaget.Lokaliteten er en nødvendig del af Royal Mail-postadressen, hvis der er mere end en “Acacia Avenue” i “Silhurst” postbyen. Lokaliteten har ingen stærkere tilknytning til administrative eller statistiske geografier end postbyen. Amtsnavnet er ofte inkluderet i postadresser, men er ikke et krav, og det kan ikke garanteres, at amtet svarer til det administrative amt med samme navn.
Adresseeksempel 3:
Adresse | Adresseelementer |
501a Halfway Street | Ejendomsnummer og gadenavn |
Sidcup | Postby |
Kent | County |
DA15 7XZ | Enhedens postnummer |
Selvom denne nøjagtige adresse er fiktiv, dets vigtigste elementer er ægte, og det tjener til at demonstrere uoverensstemmelsen mellem post- og administrative geografiske områder. Postbyen Sidcup falder ikke inden for det administrative amt Kent, men inden for London Borough of Bexley. DA15-postdistriktet vedrører Dartford, som faktisk er i Kent. Halfway Street falder hovedsageligt inden for London Borough of Bexley, men strækker sig en lille afstand ind i London Borough of Greenwich. Det bør således være klart, at ingen af postadresseelementerne skal bruges direkte som grundlag for geografisk henvisning. Enten skal den fulde, strukturerede adresse eller enhedens postnummer matches med en betroet mappe for at give tilsvarende geografiske koder på et passende opløsningsniveau.
Hvor det er muligt, bør forskere søge at registrere, gemme og manipulere adresseoplysninger i et struktureret format, selvom en fuldt standard-kompatibel adresse ikke kan produceres. Opdeling af adresser i separate felter og krav om, at hvert af hovedelementerne skal afgrænses tydeligt, vil altid øge anvendeligheden af adresseoplysningerne og hjælpematchning. Tekststrengstilpasning af adresser er kompleks, og der er mange årsager til potentiel forvirring, herunder stavemåder, flere sprog og variantforkortelser. Disse reduceres meget, når informationen er tydeligt struktureret. Forskere, der har brug for at foretage matchning i stor skala af adresselister, bør overveje at bruge kommerciel adressematchningssoftware eller -tjenester.