Willkommen bei ReStore
Daten aus vielen Quellen, einschließlich Verwaltungsunterlagen und Umfragen, werden zunehmend in Verbindung mit vollständigen Adressinformationen aufgezeichnet. In früheren Jahrzehnten enthielten viele solcher Datensätze nur eine Postleitzahl oder einen Ortsnamen. Adressinformationen sind für die geografische Referenzierung von großem Wert, aber die potenziell komplexe Struktur von Adressen muss verstanden werden, um den potenziellen Nutzen für die Zuordnung oder Datenverknüpfung zu maximieren.
Adressen in der Praxis
Es ist wichtig zu erkennen, dass die in den meisten Postanschriften aufgezeichneten Standortinformationen in keiner direkten Weise mit den geografischen Referenzen übereinstimmen, die den meisten sozialwissenschaftlichen Datensätzen zugeordnet sind. Dies kann anhand einiger Beispiele veranschaulicht werden.
Adressbeispiel 1:
Adresse | Adresselemente |
39 Acacia Avenue | Objektnummer und Straße |
Silhurst | Poststadt |
SH15 6BP | Postleitzahl der Einheit |
In diesem Fall Ein einfaches Beispiel: Alle erforderlichen Elemente sind vorhanden, um eine gültige Postanschrift zu erstellen. Dazu gehören eine Immobilienkennung (in diesem Fall eine Hausnummer, unter anderen Umständen auch ein Hausname), ein Straßenname, eine Poststadt und eine Postleitzahl. Diese Elemente sind für alltägliche Zwecke wie die Zustellung von Post oder den Besuch der Adresse völlig ausreichend. Es ist jedoch wahrscheinlich, dass nur wenige dieser Elemente eindeutig mit den geografischen Einheiten und Codes zusammenhängen, die für die meisten sozialwissenschaftlichen Daten verwendet werden. Die Hausnummer „39“ kann genau einer Immobilie entsprechen, die eine Lerneinheit darstellt. Wenn der Forscher jedoch wirklich an Haushalten, Einzelpersonen oder Unternehmen interessiert ist, ist es wichtig zu erkennen, dass die Zahl 39 möglicherweise nicht ausreicht, um die interessierenden Einheiten eindeutig zu identifizieren. Die „Acacia Avenue“ entspricht nicht direkt einer statistischen Einheit. In der Tat führt eine lange Straße häufig durch viele verschiedene geografische Gebiete mit unterschiedlichen Codes und verfügbaren statistischen Daten. „Silhurst“, eine Poststadt, ist eine für Postzustellungszwecke definierte geografische Einheit und entspricht höchstwahrscheinlich nicht genau einer Volkszählungsstation, einem Super-Output-Gebiet, einem Gemeindebezirk oder einem anderen geografischen Standardgebiet. Die Postleitzahl der Einheit „SH15 6BP“ umfasst kein eigenständiges statistisches Gebiet, kann jedoch mithilfe von Standardverzeichnissen den meisten offiziellen geografischen Einheiten zugeordnet werden. Es ist wahrscheinlich, dass die Adresse in ihrer Gesamtheit erfolgreich mit einem oder mehreren Einträgen in den wichtigsten nationalen Adresslisten abgeglichen werden kann. Es ist ebenso möglich, dass es aus verschiedenen Gründen nicht eindeutig übereinstimmt – zum Beispiel, wenn es mehr als eine Unterteilung des Grundstücks in der 39 Acacia Avenue gibt oder wenn es mehr als eine Acacia Avenue in Silhurst gibt. Die zusätzliche Sicherheit, die die Postleitzahl des Geräts bietet, die sich normalerweise auf etwa 15 Adressen bezieht, erklärt die Nützlichkeit der Postleitzahl als Standortreferenz.
Adressbeispiel 2:
Adresse | Adresselemente |
Geo-Refer Enterprises Inc. | Firmenname |
Wohnung B | Unterteilung der Eigenschaften |
39 Acacia Avenue | Eigenschaftsnummer und Straße |
North End | Ortsadresse |
Silhurst | Poststadt |
Loamshire | County |
SH15 6BP | Postleitzahl der Einheit |
In diesem Beispiel wurden dem Adressbeispiel 1 vier zusätzliche Elemente hinzugefügt, die zusätzliche Aspekte der Adressstruktur veranschaulichen. Geo-Refer Enterprises Inc. scheint ein Firmenname zu sein. Dies dürfte für einige Forscher wichtig sein, ist jedoch formal nicht Bestandteil der Ansprache. Dies kann die registrierte Adresse vieler verschiedener Unternehmen sein, und Firmennamen können häufig geändert werden, während die Immobilie selbst dieselbe bleibt. „Wohnung B“ legt nahe, dass das Grundstück an der „39 Acacia Avenue“ unterteilt ist. Einige Wohnadressen werden auch als Geschäftsadressen verwendet, und es kann sehr schwierig sein, diese verschiedenen Adresstypen für Analysezwecke zu trennen. Ebenso ist es schwierig zu bestätigen, ob ein Datensatz in Bezug auf „Wohnung B, 39 Acacia Avenue“ tatsächlich der gleichen Adresse entspricht wie ein Datensatz in Bezug auf „39 Acacia Avenue“. In diesem Beispiel wurde ein Ortsname „North End“ eingefügt.Der Ort ist ein notwendiger Bestandteil der Postanschrift der Royal Mail, wenn es in der Poststadt „Silhurst“ mehr als eine „Acacia Avenue“ gibt. Der Ort weist keine stärkere Assoziation mit administrativen oder statistischen Regionen auf als die Poststadt. Der Name des Landkreises ist häufig in Postanschriften enthalten, ist jedoch keine Voraussetzung und es kann nicht garantiert werden, dass der Landkreis dem gleichnamigen Verwaltungsbezirk entspricht.
Adressbeispiel 3:
Adresse | Adresselemente |
501a Halfway Street | Eigenschaftsnummer und Straße |
Sidcup | Poststadt |
Kent | County |
DA15 7XZ | Postleitzahl der Einheit |
Obwohl genau diese Adresse ist fiktiv, seine Hauptelemente sind echt und es dient dazu, die Diskrepanz zwischen Post- und Verwaltungsgebieten zu demonstrieren. Die Poststadt Sidcup gehört nicht zur Verwaltungsbezirk Kent, sondern zum Londoner Stadtteil Bexley. Der Postbezirk DA15 bezieht sich auf Dartford, das sich tatsächlich in Kent befindet. Die Halfway Street gehört hauptsächlich zum Londoner Stadtteil Bexley, erstreckt sich jedoch ein Stück weit in den Londoner Stadtteil Greenwich. Es sollte daher klar sein, dass keines der Postanschriftelemente direkt als Grundlage für die geografische Referenzierung verwendet werden sollte. Entweder die vollständige, strukturierte Adresse oder die Postleitzahl der Einheit sollten mit einem vertrauenswürdigen Verzeichnis abgeglichen werden, um entsprechende geografische Codes mit einer angemessenen Auflösung bereitzustellen.
Nach Möglichkeit sollten Forscher versuchen, aufzuzeichnen, zu speichern und zu manipulieren Adressinformationen in einem strukturierten Format, auch wenn keine vollständig standardkonforme Adresse erstellt werden kann. Das Aufteilen von Adressen in separate Felder und das Erfordernis, dass jedes der Hauptelemente klar abgegrenzt ist, erhöht immer den Nutzen der Adressinformationen und hilft beim Abgleichen. Die Übereinstimmung von Textzeichenfolgen mit Adressen ist komplex und es gibt viele Ursachen für mögliche Verwirrung, einschließlich Schreibweisen, mehreren Sprachen und Abkürzungen für Varianten. Diese sind stark reduziert, wenn die Informationen klar strukturiert sind. Forscher, die einen umfangreichen Adresslistenabgleich durchführen müssen, sollten die Verwendung kommerzieller Adressabgleichsoftware oder -dienste in Betracht ziehen.