Adatok elfordítása az SQL-ben
Itt kezdődik? Ez a lecke egy teljes hosszúságú oktatóanyag része az SQL használatának az adatelemzéshez. Nézze meg az elejét.
Ebben a leckében lefedjük:
- Sorok oszlopokba forgatása
- Oszlopok sorokba forgatása
- Mi következik?
Sorok oszlopokba forgatása
Ez a lecke megtanulja, hogyan vegye elemzésre formázott adatokat, és fordítsa el bemutatásra vagy diagramokra . Fogunk egy ilyen kinézetű adatkészletet:
És így alakítjuk:
Ebben a példában a College Football játékosainak ugyanazt az adatkészletét használjuk, amelyet a CASE leckében használtak. Az adatokat közvetlenül itt tekintheti meg.
Kezdjük azzal, hogy összesítjük az adatokat, hogy az egyes konferenciákon az egyes évek játékosainak száma látható legyen, hasonlóan a belső csatlakozási lecke első példájához:
Nézze meg ezt módban.
Az adatok átalakításához a fenti lekérdezést allekérdezéssé kell tennünk. Hasznos lehet az allekérdezés létrehozása és az összes oszlop kijelölése, mielőtt átalakításokat kezdene. A lekérdezés ilyen inkrementális lépésekkel történő újbóli futtatása megkönnyíti a hibakeresést, ha a lekérdezés nem fut. Vegye figyelembe, hogy a ORDER BY
záradékot kiküszöbölheti az allekérdezésből, mivel “újrarendezzük” az eredmények a külső lekérdezésben.
Feltéve, hogy a terv szerint működik (az eredményeknek pontosan ugyanúgy kell kinézniük, mint az első lekérdezésnek), itt az ideje, hogy az eredményeket több évre külön oszlopokra bontsa. a SELECT
utasításban létrehoz egy oszlopot, ezért minden évre külön oszlopot kell létrehoznia:
Technikailag most elérte a célt: ez az oktatóanyag. De ez még mindig javítható egy kicsit. Észre fogja venni, hogy a fenti lekérdezés olyan listát állít elő, amelyet a Conference betűrendben rendez. Lehetséges, hogy ésszerűbb egy “összes játékos” oszlop hozzáadása és sorrend (ez a legkisebbtől a legkisebbig):
És kész! Nézze meg ezt módban.
Oszlopok elforgatása sorokhoz
Sok olyan adat, amelyet az interneten megtudhat, fogyasztásra van formázva, nem elemzésre. Vegyük például ezt a táblázatot, amely a földrengések számát mutatja világszerte 2000 és 2012 között:
Ebben a formátumban kihívást jelent megválaszolni a “mi “a földrengés átlagos mértéke?” Sokkal könnyebb lenne, ha az adatokat 3 oszlopban jelenítenék meg: “nagyságrend”, “év” és “földrengések száma”. Így alakíthatja át az adatokat erre az űrlapra:
Először ellenőrizze ezeket az adatokat a Mode:
Megjegyzés: oszlopban a nevek “év_” -vel kezdődnek, mert a módhoz az oszlopnevek betűkkel kezdődnek.
Az első lépés, hogy létrehozzon egy táblázatot, amely az eredeti tábla összes oszlopát sorba sorolja egy új táblázatban. . Kivéve, ha rengeteg oszlop van átalakítandó, a legegyszerűbb módszer egyszerűen csak egy allekérdezésben felsorolni őket:
Ha ezt megkapta , összekapcsolhatja a worldwide_earthquakes
táblázattal egy kibontott nézet létrehozásához:
Vegye figyelembe, hogy a worldwide_earthquakes
-t 13-szor replikálják. Az utolsó tennivaló ezt kijavítani egy CASE
utasítással, amely az worldwide_earthquakes
táblázat megfelelő oszlopából veszi ki az adatokat a year
oszlop:
Tekintse meg a végterméket Mode-ban.
Gratulálok az Advanced SQL oktatóanyag befejezéséhez! Most, hogy kezelted az SQL-t, a következő lépés az elemzési folyamat csiszolása.
Éppen erre a célra hoztuk létre az SQL Analytics Training részt. A valós helyzeteket utánzó hamis adatkészletek segítségével megközelítheti ezt a szakaszt, mint a munkahelyi képzést. Nézze meg!