Velkommen til ReStore (Norsk)
Data fra mange kilder, inkludert administrative poster og undersøkelser, blir i økende grad registrert i forbindelse med full adresseinformasjon. I tidligere tiår inneholdt mange slike datasett bare et postnummer eller stedsnavn. Adresseinformasjon er av stor verdi for geografisk referanse, men den potensielt komplekse adressestrukturen må forstås for å maksimere potensielle fordeler for kartlegging eller datakobling.
Adresser i praksis
Det er viktig å erkjenne at lokaliseringsinformasjonen som er registrert i de fleste postadresser, ikke på noen direkte måte tilsvarer de geografiske referansene som er knyttet til de fleste samfunnsvitenskapelige datasett. Dette kan illustreres ved hjelp av noen eksempler.
Adresseeksempel 1:
Adresse | Adresseelementer |
39 Acacia Avenue | Bolignummer og gateadresse |
Silhurst | Postby |
SH15 6BP | Enhetens postnummer |
I dette enkelt eksempel, alle nødvendige elementer er til stede for å lage en gyldig postadresse. Disse inkluderer en eiendomsidentifikator (i dette tilfellet et husnummer, selv om det i andre tilfeller kan være et husnavn), hovedvei (gatenavn), poststed og postnummer. Disse elementene er helt tilstrekkelige for hverdagsformål som å levere post eller besøke adressen. Imidlertid vil få av disse elementene sannsynligvis forholde seg entydig til de geografiske enhetene og kodene som brukes for de fleste samfunnsvitenskapelige data. Husnummer ‘39’ kan tilsvare nøyaktig en eiendom som er en studieenhet. Men hvis forskeren virkelig er interessert i husholdninger, enkeltpersoner eller bedrifter, er det viktig å erkjenne at nummer 39 kanskje ikke er tilstrekkelig til entydig å identifisere interesseenhetene. ‘Acacia Avenue’ tilsvarer ikke direkte noen statistisk enhet – faktisk vil en lang gate ofte skjære gjennom mange forskjellige geografiske områder med forskjellige koder og tilgjengelige statistiske data. ‘Silhurst’, en postby, er en geografisk enhet definert for postleveringsformål og vil sannsynligvis ikke korrespondere nøyaktig med noen folketellingsavdeling, superutgangsområde, kommunedistrikt eller annet standard geografisk område. Enhetens postnummer ‘SH15 6BP’ utgjør ikke i seg selv et statistisk område, men kan knyttes til de fleste offisielle geografiske enheter ved bruk av standardkataloger. Det er sannsynlig at adressen i sin helhet kan matches med en eller flere oppføringer i de store nasjonale adresselistene. Det er like mulig at det kan mislykkes å matche unikt av forskjellige grunner – for eksempel hvis det er mer enn en underavdeling av eiendommen på Acacia Avenue 39, eller hvis det er mer enn en Acacia Avenue i Silhurst. Den ekstra sikkerheten som tilbys av enhetens postnummer, som vanligvis er relatert til rundt 15 adresser, forklarer nytten av postnummeret som en lokaliseringsreferanse.
Adresseeksempel 2:
Adresse | Adresseelementer |
Geo-Refer Enterprises Inc. | Foretaksnavn |
Flat B | Eiendomsinndeling |
39 Acacia Avenue | Bolignummer og gateadresse |
Nordenden | Lokalitetsadresse |
Silhurst | Postby |
Loamshire | County |
SH15 6BP | Enhetens postnummer |
I dette eksemplet er fire tilleggselementer lagt til adresseeksempel 1, som viser ytterligere aspekter av adressestruktur. Geo-Refer Enterprises Inc. ser ut til å være et firmanavn. Dette er sannsynlig viktig for noen forskere, men det er ikke formelt en del av adressen. Dette kan være den registrerte adressen til mange forskjellige virksomheter, og firmanavn kan ofte endres mens eiendommen i seg selv forblir den samme. «Flat B» antyder at eiendommen ved «39 Acacia Avenue» er delt inn. Noen boligadresser brukes også som forretningsadresser, og det kan være veldig vanskelig å skille ut disse forskjellige adressene for analytiske formål. Tilsvarende er det vanskelig å bekrefte om en plate relatert til «Flat B, 39 Acacia Avenue» faktisk tilsvarer samme adresse som en post for «39 Acacia Avenue». I dette eksemplet er et lokalnavn «North End» inkludert.Lokaliteten er en nødvendig del av Royal Mail-postadressen hvis det er mer enn en «Acacia Avenue» i «Silhurst» postbyen. Lokaliteten har ingen sterkere tilknytning til administrative eller statistiske geografier enn postbyen. Fylkesnavnet er ofte inkludert i postadressene, men er ikke et krav, og det kan ikke garanteres at fylket vil korrespondere med det administrative fylket med samme navn.
Adresseeksempel 3:
Adresse | Adresseelementer |
501a Halfway Street | Eiendomsnummer og gateadresse |
Sidcup | Postby |
Kent | County |
DA15 7XZ | Enhetens postnummer |
Selv om denne eksakte adressen er fiktiv, hovedelementene er ekte, og det tjener til å demonstrere misforholdet mellom post- og administrasjonsområder. Postbyen Sidcup faller ikke inn under det administrative fylket Kent, men innenfor London Borough of Bexley. Postdistriktet DA15 er knyttet til Dartford, som faktisk er i Kent. Halfway Street faller hovedsakelig i London Borough of Bexley, men strekker seg et lite stykke inn i London Borough of Greenwich. Det bør således være klart at ingen av postadresseelementene skal brukes direkte som grunnlag for geografisk referanse. Enten den fulle, strukturerte adressen eller enhetens postnummer skal matches med en pålitelig katalog for å gi tilsvarende geografiske koder på et passende oppløsningsnivå.
Forskere bør der det er mulig søke å registrere, lagre og manipulere adresseinformasjon i et strukturert format, selv om en ikke fullstendig standard kompatibel adresse ikke kan produseres. Å dele adresser i separate felt og kreve at hvert av hovedelementene skal være tydelig avgrenset, vil alltid øke bruken av adresseinformasjonen og hjelpematching. Tekststrengs matching av adresser er kompleks, og det er mange årsaker til potensiell forvirring, inkludert stavemåter, flere språk og variantforkortelser. Disse reduseres mye når informasjonen er tydelig strukturert. Forskere som trenger å utføre samsvar med adresselister i stor skala, bør vurdere å bruke kommersiell adressematchingsprogramvare eller -tjenester.