Witamy w ReStore
Dane z wielu źródeł, w tym rejestry administracyjne i ankiety, są coraz częściej rejestrowane w połączeniu z pełnymi danymi adresowymi. W poprzednich dziesięcioleciach wiele takich zbiorów danych zawierało tylko kod pocztowy lub nazwę miejsca. Informacje adresowe mają wielką wartość w odniesieniu do odniesień geograficznych, ale należy zrozumieć potencjalnie złożoną strukturę adresów, aby zmaksymalizować potencjalne korzyści z mapowania lub łączenia danych.
Adresy w praktyce
Ważne jest, aby zdać sobie sprawę, że informacje o lokalizacji zapisane w większości adresów pocztowych nie są w żaden sposób tożsame z odniesieniami geograficznymi dołączonymi do większości zbiorów danych z zakresu nauk społecznych. Można to zilustrować na kilku przykładach.
Przykład adresu 1:
Adres | Elementy adresu |
39 Acacia Avenue | Numer nieruchomości i adres |
Silhurst | Poczta |
SH15 6BP | Kod pocztowy jednostki |
W tym bardzo prosty przykład, wszystkie wymagane elementy są obecne, aby utworzyć prawidłowy adres pocztowy. Obejmują one identyfikator nieruchomości (w tym przypadku numer domu, chociaż w innych okolicznościach może to być nazwa domu), nazwę drogi (ulica), miejscowość pocztową i kod pocztowy. Te elementy w zupełności wystarczają do codziennych celów, takich jak dostarczanie poczty czy odwiedzanie adresu. Jednak kilka z tych elementów prawdopodobnie odnosi się jednoznacznie do jednostek geograficznych i kodów używanych w większości danych z nauk społecznych. Numer domu „39” może oznaczać dokładnie jedną nieruchomość, która jest jednostką studiów. Jeśli jednak badacza rzeczywiście interesują gospodarstwa domowe, osoby fizyczne lub firmy, ważne jest, aby uznać, że liczba 39 może nie wystarczyć do jednoznacznej identyfikacji interesujących go jednostek. „Acacia Avenue” nie będzie oznaczać bezpośrednio żadnej jednostki statystycznej – w rzeczywistości długa ulica często będzie przecinać wiele różnych obszarów geograficznych z różnymi kodami i dostępnymi danymi statystycznymi. „Silhurst”, miasto pocztowe, to jednostka geograficzna zdefiniowana do celów dostarczania poczty i najprawdopodobniej nie będzie dokładnie odpowiadać żadnemu okręgowi spisowemu, obszarowi superwydajnemu, okręgowi władz lokalnych lub innym standardowym obszarom geograficznym. Kod pocztowy jednostki „SH15 6BP” sam w sobie nie obejmuje obszaru statystycznego, ale może być powiązany z większością oficjalnych jednostek geograficznych przy użyciu standardowych katalogów. Prawdopodobnie cały adres mógłby zostać pomyślnie dopasowany do jednego lub więcej wpisów na głównych krajowych listach adresowych. Równie możliwe jest, że z różnych powodów może nie pasować w wyjątkowy sposób – na przykład jeśli istnieje więcej niż jeden podział nieruchomości przy 39 Acacia Avenue lub jeśli jest więcej niż jedna Acacia Avenue w Silhurst. Dodatkowa pewność zapewniana przez kod pocztowy jednostki, który zwykle odnosi się do około 15 adresów, wyjaśnia użyteczność kodu pocztowego jako odniesienia do lokalizacji.
Przykład adresu 2:
Adres | Elementy adresu |
Geo-refer Enterprises Inc. | Nazwa firmy |
Mieszkanie B | Podział nieruchomości |
39 Acacia Avenue | Numer nieruchomości i adres |
North End | Adres miejscowości |
Silhurst | Poczta |
Loamshire | County |
SH15 6BP | Kod pocztowy jednostki |
W tym przykładzie cztery dodatkowe elementy zostały dodane do przykładu adresu 1, które demonstrują dodatkowe aspekty struktury adresu. Wydaje się, że nazwa firmy Geo-Refer Enterprises Inc. Może to być ważne dla niektórych badaczy, ale formalnie nie jest to część adresu. Może to być zarejestrowany adres wielu różnych firm, a nazwy firm często podlegają częstym zmianom, podczas gdy sama nieruchomość pozostaje taka sama. „Mieszkanie B” sugeruje, że nieruchomość przy „39 Acacia Avenue” jest podzielona. Niektóre adresy zamieszkania są również używane jako adresy firmowe i wyodrębnienie tych różnych typów adresów do celów analitycznych może być bardzo trudne. Podobnie trudno jest potwierdzić, czy wpis dotyczący „Flat B, 39 Acacia Avenue” faktycznie odpowiada temu samemu adresowi, co wpis dotyczący „39 Acacia Avenue”. W tym przykładzie uwzględniono nazwę miejscowości „North End”.Miejscowość jest niezbędną częścią adresu pocztowego Royal Mail, jeśli w miasteczku pocztowym Silhurst znajduje się więcej niż jedna „Acacia Avenue”. Miejscowość nie ma silniejszego związku z geografią administracyjną czy statystyczną niż miasto pocztowe. Nazwa hrabstwa jest często umieszczana w adresach pocztowych, ale nie jest wymagana i nie można zagwarantować, że hrabstwo będzie korespondować z hrabstwem o tej samej nazwie.
Przykład adresu 3:
Adres | Elementy adresu |
501a Ulica w połowie drogi | Numer nieruchomości i adres |
Sidcup | Poczta |
Kent | Hrabstwo |
DA15 7XZ | Kod pocztowy jednostki |
Chociaż ten dokładny adres jest fikcyjna, jej główne elementy są autentyczne i służy do wykazania rozbieżności między geografią pocztową i administracyjną. Pocztowe miasto Sidcup nie należy do hrabstwa Kent, ale do London Borough of Bexley. Okręg pocztowy DA15 odnosi się do Dartford, w rzeczywistości w hrabstwie Kent. Halfway Street znajduje się głównie w London Borough of Bexley, ale rozciąga się na niewielką odległość do London Borough of Greenwich. Powinno zatem być jasne, że żaden z elementów adresu pocztowego nie powinien być bezpośrednio wykorzystywany jako podstawa odniesienia geograficznego. Pełny, ustrukturyzowany adres lub kod pocztowy jednostki należy porównać z zaufanym katalogiem, aby zapewnić odpowiednie kody geograficzne na odpowiednim poziomie rozdzielczości.
W miarę możliwości badacze powinni starać się rejestrować, przechowywać i przetwarzać informacje adresowe w ustrukturyzowanym formacie, nawet jeśli nie można wygenerować adresu w pełni zgodnego z normami. Dzielenie adresów na oddzielne pola i wymaganie wyraźnego rozgraniczenia każdego z głównych elementów zawsze zwiększy użyteczność informacji adresowych i ułatwi dopasowanie. Dopasowywanie adresów tekstowych jest złożone i istnieje wiele przyczyn potencjalnego zamieszania, w tym różne warianty pisowni, wiele języków i warianty skrótów. Są one znacznie mniejsze, gdy informacje są jasno zorganizowane. Badacze, którzy muszą przeprowadzić dopasowywanie listy adresów na dużą skalę, powinni rozważyć użycie komercyjnego oprogramowania lub usług dopasowywania adresów.