SQL에서 데이터 피벗
여기서 시작 하시겠습니까? 이 강의는 데이터 분석을위한 SQL 사용에 대한 전체 길이 자습서의 일부입니다. 시작 부분을 확인하세요.
이 강의에서는 다음 내용을 다룹니다.
- 행을 열로 회전
- 열을 행으로 회전
- 다음 단계는 무엇입니까?
행을 열로 피벗
이 강의에서는 분석을 위해 형식이 지정된 데이터를 가져와 프레젠테이션 또는 차트로 피벗하는 방법을 설명합니다. . 다음과 같은 데이터 세트를 가져옵니다.
그리고 다음과 같이 만듭니다.
이 예에서는 CASE 강의에서 사용한 것과 동일한 대학 미식 축구 선수 데이터 세트를 사용합니다. 여기에서 직접 데이터를 볼 수 있습니다.
내부 조인 강의의 첫 번째 예와 유사하게 데이터를 집계하여 각 회의에서 매년 플레이어 수를 표시해 보겠습니다.
모드에서보기.
데이터를 변환하려면 위의 쿼리를 하위 쿼리에 넣어야합니다. 변환을 시작하기 전에 하위 쿼리를 만들고 모든 열을 선택하는 것이 유용 할 수 있습니다. 이와 같이 증분 단계에서 쿼리를 다시 실행하면 쿼리가 실행되지 않는 경우 디버그하기가 더 쉬워집니다. 순서를 변경하므로 하위 쿼리에서 ORDER BY
절을 제거 할 수 있습니다. 외부 쿼리의 결과입니다.
계획대로 작동한다고 가정하면 (결과는 첫 번째 쿼리와 정확히 동일해야 함) 결과를 여러 해 동안 여러 열로 나눌 때입니다. 각 항목 SELECT
문에서 열을 생성하므로 “매년에 대해 별도의 열을 생성해야합니다.
기술적으로 이제 목표를 달성했습니다. 그러나 이것은 여전히 조금 더 나아질 수 있습니다. 위의 쿼리가 Conference에서 알파벳순으로 정렬 된 목록을 생성한다는 것을 알 수 있습니다. “총 플레이어”열을 추가하고 그 순서로 정렬하는 것이 더 합리적 일 수 있습니다 (가장 큰 것에서 가장 작은 것) :
끝났습니다! 모드에서보기
열 회전 행으로
인터넷에서 찾을 수있는 많은 데이터는 분석이 아닌 소비를위한 형식입니다. 예를 들어 2000 년부터 2012 년까지 전 세계 지진 수를 보여주는 다음 표를 보겠습니다.
이 형식에서는 “무엇을 “지진의 평균 규모는?” 데이터를 “크기”, “연도”, “지진 수”의 3 개 열로 표시하면 훨씬 쉬울 것입니다. 데이터를 해당 형식으로 변환하는 방법은 다음과 같습니다.
먼저 모드에서이 데이터를 확인하세요.
참고 : 열 Mode에서는 문자로 시작하는 열 이름이 필요하기 때문에 이름은 “year_”로 시작합니다.
여기서 가장 먼저해야 할 일은 원래 테이블의 모든 열을 새 테이블의 행으로 나열하는 테이블을 만드는 것입니다. . 변환 할 열이 많지 않은 경우 가장 쉬운 방법은 하위 쿼리에 나열하는 것입니다.
, worldwide_earthquakes
테이블과 교차 결합하여 확장 된보기를 만들 수 있습니다.
worldwide_earthquakes
는 13 번 복제됩니다. 마지막으로해야 할 일은 CASE
문을 사용하여 worldwide_earthquakes
테이블의 올바른 열에서 데이터를 가져 오는 것입니다. year
열 :
모드에서 최종 제품보기
고급 SQL 자습서를 마쳤습니다. 이제 SQL을 다루었으니 다음 단계는 분석 프로세스를 연마하는 것입니다.
우리는 바로 그 목적을 위해 SQL Analytics 교육 섹션을 구축했습니다. 실제 상황을 모방하는 가짜 데이터 세트를 사용하면 실무 교육과 같이이 섹션에 접근 할 수 있습니다. 확인해보세요!