Benvenuti in ReStore
I dati provenienti da molte fonti, inclusi i registri amministrativi e i sondaggi, vengono sempre più registrati insieme alle informazioni complete sull’indirizzo. Nei decenni precedenti, molti di questi set di dati contenevano solo un codice postale o un nome di luogo. Le informazioni sugli indirizzi sono di grande valore per la referenziazione geografica, ma la struttura potenzialmente complessa degli indirizzi deve essere compresa al fine di massimizzare i potenziali benefici per la mappatura o il collegamento dei dati.
Indirizzi in pratica
È importante riconoscere che le informazioni sulla località registrate nella maggior parte degli indirizzi postali non corrispondono in alcun modo diretto ai riferimenti geografici allegati alla maggior parte dei set di dati delle scienze sociali. Ciò può essere illustrato mediante alcuni esempi.
Esempio di indirizzo 1:
Indirizzo | Elementi indirizzo |
39 Acacia Avenue | Numero della proprietà e indirizzo |
Silhurst | Città di posta |
SH15 6BP | Codice postale unità |
In questo semplice esempio, sono presenti tutti gli elementi necessari per rendere valido un indirizzo postale. Questi includono un identificatore di proprietà (in questo caso un numero civico, sebbene in altre circostanze possa essere il nome di una casa), il nome del passaggio (via), la città e il codice postale. Questi elementi sono del tutto sufficienti per scopi quotidiani come recapitare la posta o visitare l’indirizzo. Tuttavia, è probabile che pochi di questi elementi siano collegati in modo inequivocabile alle unità geografiche e ai codici utilizzati per la maggior parte dei dati delle scienze sociali. Il numero civico “39” può corrispondere esattamente a una proprietà che è un’unità di studio. Tuttavia, se il ricercatore è davvero interessato a famiglie, individui o imprese, è importante riconoscere che il numero 39 potrebbe non essere sufficiente per identificare in modo univoco le unità di interesse. “Acacia Avenue” non equivarrà direttamente a nessuna unità statistica, anzi, una strada lunga spesso attraverserà molte aree geografiche diverse con codici e dati statistici disponibili diversi. “Silhurst”, una città postale, è un’entità geografica definita ai fini della consegna della posta ed è molto improbabile che corrisponda esattamente a qualsiasi reparto di censimento, area di super uscita, distretto di autorità locale o altra area geografica standard. Il codice postale dell’unità “SH15 6BP” non comprende di per sé un’area statistica, ma può essere associato alla maggior parte delle unità geografiche ufficiali utilizzando elenchi standard. È probabile che l’indirizzo, nella sua interezza, possa essere abbinato con successo a una o più voci nei principali elenchi di indirizzi nazionali. È ugualmente possibile che non corrisponda in modo univoco per vari motivi, ad esempio se c’è più di una suddivisione della proprietà in 39 Acacia Avenue, o se c’è più di una Acacia Avenue a Silhurst. La certezza aggiuntiva fornita dal codice postale dell’unità, che in genere si riferisce a circa 15 indirizzi, spiega l’utilità del codice postale come riferimento di località.
Esempio di indirizzo 2:
Indirizzo | Elementi indirizzo |
Geo-Refer Enterprises Inc. | Nome azienda |
Appartamento B | Suddivisione della proprietà |
39 Acacia Avenue | Numero proprietà e indirizzo |
North End | Indirizzo località |
Silhurst | Città della posta |
Loamshire | Contea |
SH15 6BP | Codice postale unità |
In questo esempio, quattro elementi aggiuntivi sono stati aggiunti all’esempio 1 dell’indirizzo, che dimostrano aspetti aggiuntivi della struttura dell’indirizzo. Geo-Refer Enterprises Inc. sembra essere un nome commerciale. È probabile che questo sia importante per alcuni ricercatori, ma non fa formalmente parte dell’indirizzo. Questo può essere l’indirizzo registrato di molte attività diverse e i nomi delle aziende sono spesso soggetti a frequenti modifiche mentre la proprietà stessa rimane la stessa. “Flat B” suggerisce che la proprietà in “39 Acacia Avenue” è suddivisa. Alcuni indirizzi residenziali vengono utilizzati anche come indirizzi aziendali e può essere molto difficile separare questi diversi tipi di indirizzi per scopi analitici. Allo stesso modo, è difficile confermare se un record relativo a “Flat B, 39 Acacia Avenue” corrisponde effettivamente allo stesso indirizzo di un record per “39 Acacia Avenue”. In questo esempio, è stato incluso un nome di località “North End”.La località è una parte necessaria dell’indirizzo postale della Royal Mail se c’è più di una “Acacia Avenue” nella città postale “Silhurst”. La località non presenta alcuna associazione più forte con geografie amministrative o statistiche rispetto alla città postale. Il nome della contea è spesso incluso negli indirizzi postali, ma non è un requisito e non è possibile garantire che la contea corrisponderà alla contea amministrativa con lo stesso nome.
Esempio di indirizzo 3:
Indirizzo | Elementi indirizzo |
501a Halfway Street | Numero proprietà e indirizzo |
Sidcup | Città della posta |
Kent | Contea |
DA15 7XZ | Codice postale unità |
Sebbene questo indirizzo esatto è fittizio, i suoi elementi principali sono autentici e serve a dimostrare la discrepanza tra geografie postali e amministrative. La città postale di Sidcup non rientra nella contea amministrativa del Kent ma nel distretto londinese di Bexley. Il distretto postale DA15 si riferisce a Dartford, che in realtà si trova nel Kent. Halfway Street rientra principalmente nel distretto londinese di Bexley, ma si estende per un breve tratto nel distretto londinese di Greenwich. Dovrebbe quindi essere chiaro che nessuno degli elementi dell’indirizzo postale dovrebbe essere utilizzato direttamente come base per la referenziazione geografica. L’indirizzo completo e strutturato o il codice postale dell’unità devono essere confrontati con una directory attendibile per fornire i codici geografici corrispondenti a un livello di risoluzione appropriato.
Ove possibile, i ricercatori dovrebbero cercare di registrare, archiviare e manipolare informazioni sull’indirizzo in un formato strutturato, anche se non è possibile produrre un indirizzo completamente conforme agli standard. Dividere gli indirizzi in campi separati e richiedere che ciascuno degli elementi principali sia chiaramente delimitato aumenterà sempre l’utilità delle informazioni sull’indirizzo e faciliterà la corrispondenza. La corrispondenza delle stringhe di testo degli indirizzi è complessa e vi sono molte cause di potenziale confusione, tra cui varianti ortografiche, più lingue e abbreviazioni varianti. Questi sono molto ridotti quando le informazioni sono chiaramente strutturate. I ricercatori che devono intraprendere la corrispondenza di elenchi di indirizzi su larga scala dovrebbero considerare l’utilizzo di software o servizi di corrispondenza di indirizzi commerciali.