Üdvözöljük a ReStore-ban
Számos forrásból származó adatokat, beleértve az adminisztratív nyilvántartásokat és a felméréseket, egyre inkább a teljes címadatokkal együtt rögzítik. Az előző évtizedekben sok ilyen adatkészlet csak irányítószámot vagy helynevet tartalmazott. A címadatok nagy jelentőséggel bírnak a földrajzi hivatkozások szempontjából, de meg kell érteni a címek potenciálisan összetett szerkezetét a feltérképezés vagy adatkapcsolat lehetséges előnyeinek maximalizálása érdekében.
Címek a gyakorlatban
Fontos felismerni, hogy a legtöbb postacímben rögzített helyinformációk semmilyen közvetlen módon nem egyenlőek a legtöbb társadalomtudományi adatkészlethez csatolt földrajzi hivatkozásokkal. Ezt néhány példával szemléltethetjük.
1. cím példa:
Cím | Címelemek |
Acacia sugárút 39 | Ingatlanszám és utcacím |
Silhurst | Település |
SH15 6BP | Egység irányítószáma |
Ebben nagyon Egyszerű példa: az érvényes postacím elkészítéséhez minden szükséges elem szerepel. Ide tartoznak az ingatlan-azonosító (ebben az esetben házszám, bár más körülmények között ez lehet a ház neve), az átjáró (utca) neve, a postaváros és az irányítószám. Ezek az elemek teljesen elegendőek mindennapi célokra, például levelek kézbesítésére vagy a cím meglátogatására. Ezen elemek közül azonban valószínűleg kevesen kapcsolódnak egyértelműen a legtöbb társadalomtudományi adathoz használt földrajzi egységekhez és kódokhoz. A „39” házszám pontosan egy ingatlanra vonatkozhat, amely a tanulmány egysége. Ha azonban a kutatót valóban érdeklik a háztartások, az egyének vagy a vállalkozások, akkor fontos felismerni, hogy a 39-es szám nem biztos, hogy elegendő az érdeklődésre számot tartó egységek egyértelmű azonosításához. Az „Akác sugárút” nem egyenlő közvetlenül egyetlen statisztikai egységgel sem – sőt, egy hosszú utca gyakran sok különböző földrajzi területet fog átvágni különböző kódokkal és rendelkezésre álló statisztikai adatokkal. A „Silhurst” postai város földrajzi egység, amelyet postai kézbesítés céljából határoztak meg, és valószínűtlen, hogy pontosan megfeleljen bármely népszámlálási osztálynak, szuper kimeneti területnek, helyi önkormányzati körzetnek vagy más szokásos földrajzi területnek. Az „SH15 6BP” irányítószám önmagában nem tartalmaz statisztikai területet, de a legtöbb hivatalos földrajzi egységhez szabványos könyvtárak használatával társítható. Valószínű, hogy a cím teljes egészében sikeresen illeszthető egy vagy több bejegyzéshez a főbb nemzeti címlistákban. Hasonlóképpen lehetséges, hogy különféle okok miatt nem sikerül egyedi módon egyeznie – például ha az Acacia Avenue 39. szám alatt található ingatlannak egynél több felosztása van, vagy ha egynél több Acacia Avenue található Silhurstban. Az egységes irányítószám által nyújtott további bizonyosság, amely általában körülbelül 15 címre vonatkozik, megmagyarázza az irányítószám helymeghatározásként való hasznosságát.
2. cím példa:
Cím | Címelemek |
Geo-Refer Enterprises Inc. | Cégnév |
B lakás | Tulajdonfelosztás |
Acacia sugárút 39 | Ingatlanszám és utcacím |
North End | Helység címe |
Silhurst | Postai város |
Loamshire | megye |
SH15 6BP | Egység irányítószáma |
Ebben a példában négy további elem került hozzáadásra az 1. cím példához, amelyek a címstruktúra további aspektusait mutatják be. Úgy tűnik, hogy a Geo-Refer Enterprises Inc. cégnév. Ez valószínűleg fontos néhány kutató számára, de formailag nem része a megszólításnak. Ez sok különböző vállalkozás bejegyzett címe lehet, és a cégnevek gyakran változnak, miközben maga az ingatlan ugyanaz marad. A “B lakás” azt sugallja, hogy az “Acacia Avenue 39” ingatlan fel van osztva. Néhány lakcímet üzleti címként is használnak, és nagyon nehéz lehet ezeket a különféle címeket analitikai célokra elkülöníteni. Hasonlóképpen nehéz megerõsíteni, hogy a “Flat B, Acacia Avenue 39” feljegyzés valóban megfelel-e ugyanazon címnek, mint az “Acacia Avenue 39” rekordja. Ebben a példában egy “North End” helységnév szerepel.A helység a Royal Mail postacím elengedhetetlen része, ha a “Silhurst” postavárosban több “Acacia Avenue” van. A település nem mutat erősebb kapcsolatot az adminisztratív vagy statisztikai földrajzokkal, mint a postaváros. A megye neve gyakran szerepel a postai címekben, de nem követelmény, és nem garantálható, hogy a megye ugyanazzal a névvel fog megfelelni a közigazgatási megyének.
3. Cím:
Cím | Címelemek |
501a Félút utca | Ingatlanszám és utcacím |
Sidcup | Postai város |
Kent | megye |
DA15 7XZ | Egység irányítószáma |
Bár ez a pontos cím fiktív, fő elemei valódiak, és a postai és közigazgatási földrajzi helyzetek közötti eltérések bemutatására szolgálnak. Sidcup postaváros nem Kent közigazgatási megyébe, hanem Bexley londoni kerületébe tartozik. A DA15 postai körzet Dartfordhoz kapcsolódik, amely valójában Kentben van. A Halfway Street főként a Bexley-i londoni kerületbe esik, de kis távolságot behatol a Greenwich-i londoni kerületbe. Ezért egyértelműnek kell lennie, hogy a postai címek egyik elemét sem szabad közvetlenül felhasználni a földrajzi hivatkozások alapjául. Vagy a teljes, strukturált címet, vagy az egység irányítószámát össze kell egyeztetni egy megbízható könyvtárral annak érdekében, hogy megfelelő földrajzi kódokat biztosítsunk a megfelelő felbontású felbontással.
A kutatóknak lehetőség szerint törekedniük kell rögzítésére, tárolására és manipulálására. címadatok strukturált formátumban, még akkor is, ha egy teljesen szabványnak megfelelő címet nem lehet előállítani. A címek külön mezőkre bontása és az egyes fő elemek egyértelmű elhatárolásának előírása mindig növeli a címadatok hasznosságát és segíti az egyeztetést. A címsorok szöveges karakterlánc-egyeztetése összetett, és a lehetséges összetévesztésnek számos oka van, beleértve a helyesírási változatokat, a több nyelvet és a variáns rövidítéseket. Ezek jelentősen csökkennek, ha az információ egyértelműen strukturált. Azoknak a kutatóknak, akiknek nagyszabású címlista-egyeztetésre van szükségük, fontolóra kell venniük a kereskedelmi cím-illesztési szoftverek vagy szolgáltatások használatát.