방학을 맞은 한가한 원덬... 총선 결과를 보고 앨범별 인기도와 100위 안에 들지 못 한 기타 곡을 알고 싶었다..
그렇게 평소 잘 쓰지도 않는 엑셀을 킨 문돌이 원덬의 별 거 없는 여정이 시작된다..
처음엔 엑셀 테이블로 정리만 해보려 했으나, 내용을 한 눈에 파악하고자 차트를 만들기 시작했는데, 어느새 보고서 컨셉이 추가되어있었다..
통계와 데이터 분석에 대해 1도 모르는 덬이 본인 맘대로 정리한 차트니까 오로지 재미로만 봐주길 바람!!!
참고용 1차 투표 결과 링크
https://theqoo.net/2322020711
그렇게 구색 맞춰 제작한 표지로 시작ㅎ
가장 먼저 앨범별 합산치, 평균치를 정리함! 득표수와 등수, 두 가지 기준으로 나눠서 봄. 좌측 종합 그래프 둘은 평균값 순으로 나열되어있음. 오른쪽 차트에서는 왼→오 순서대로 앨범별 수록곡 득표 총합 순위를 볼 수 이씀. 보면 최다 득표 앨범은 1 of 1으로, 2등인 미컨유와 400표 이상 차이로 혼자 2,000표를 넘게 얻음ㄷㄷ
합산치를 볼 때만 해도 당연히 최다 득표 앨범이자 10위권에 3곡이 랭크된 원옵원이 제일 인기 앨범이 아닐까 했음. 정리 결과, 평균 득표수 기준 2위로 누너예 앨범을 이기지 못할 건 예상 가능했으나, 평균 등수가 5위로 생각보다 낮았음. 8곡 중에 3곡이 10위 안에 있는데 평균 순위 5위일 수가?
언젠가 들은 적 있는 것 같은 산술평균의 오류를 떠올리며 중앙값도 함께 구해 봄. 종합 그래프를 보면 평균과 중앙값이 눈에 띄게 차이 나는 앨범 몇몇을 발견할 수 있음. 이에 대한 건 차후 알아보기로 하고,
먼저 제일 알고 싶었던 수록곡 앨범별 종합 순위부터 파악해봄. 평균 득표수와 평균 등수의 순위를 비교해보니 약간의 차이는 있었지만, 대체로 상위권은 특정 앨범들이 고정적으로 추려지기 시작했음! 이를 한 눈에 파악하기 위해 평균 등수와 평균 득표수의 산포도도 추가로 만들었더니, 순위가 좀 더 뚜렷하게..정도가 아니고 누너예의 압도적인 선두가 단박에 드러남..ㅎㄷㄷ 차트를 조금 더 직관적으로 표시하고자 1위를 뒤쫓는 상위권, 촘촘히 포진한 중위권, 이어지는 중하위권, (상위권과 마찬가지로) 라인업이 고정된 하위권으로 영역을 나누었음.
득표수 지표가 등수 지표에 비해 극단값의 영향을 많이 받는 것 같았지만, 그런 수치의 곡 또한 해당 앨범의 일부임으로 득표수 기준 순위를 마냥 외면할 수 없었음. 그래서 종합 순위는 득표수와 등수 순위를 모두 고려해, 앨범별 두 지표 순위의 평균을 오름차순으로 산정함(간-단). 이게 합당한 방식인지는 불행히도 원덬이 알지 못하나, 어찌 됐건 이런 과정을 거쳐 깔끔한 종합 순위를 얻을 수 있었음! 그리고 살펴보니 결과 또한 대체로 납득 가능했음ㅇㅇ 인상 깊었던 결과를 꼽자면 무엇보다 무려 2위를 차지한 동콜미의 미친 기세ㄷㄷ 아틀란과 돈콜미의 약진을 보며 작년 유입 많다던 게 다시금 정말 실감났다고나 할까.
결론적인 수록곡의 앨범별 종합 순위는 위 페이지를 참고하면 되고, 이제 앞서 유발된 궁금점을 해소하기 위해 다시 평균과 중앙값 차이에 집중하기 시작했음. 다소 간단하게(?) 산정된 앨범 종합 순위에 일말의 신뢰를 가하려는 노력과도 같다고 볼 수 있다.. 결국 평균의 오류 여부를 잡아내기 위해 확인해야 했던 건 앨범별 곡의 분포였는데. 이걸 모조리 확인하기에는.. 본인의 열정이 부족했으므로 1차로 평균과 중앙값 차이가 크게 나는 앨범들을 의심, 2차로 앨범별 표준편차를 구해 체크할 리스트를 추렸다. 실제 득표수 지표를 기준으로 비교해보니(우측) 두 그래프의 양상도 비슷하고 상위로 나타난 앨범 목록도 같았다ㅇㅇ 다만 등수 지표는 그렇게 상관성이 뚜렷하지 않아서 등수 기준 표준편차만 참고하기로 결정함.
최종적으로 분포를 살펴 볼 앨범으로 선정된 건 득표수&등수 기준 표준편차 상위 목록에서 공통으로 발견된 세 앨범, 로미오, 오드, 원옵원. (득표수 기준 상위권인 누너예와 미컨유의 경우 등수 기준일 때는 표준편차 값이 상당히 낮았다) 근데 이렇게 추리고 보니 결국 중요했던 건, 본인에겐 이른바 '집중화 경향치의 적절성'을 판단할 통계적 능력과 지식이 없었다는 것... 분포 그거 본다고 제대로 된 해석이 가능한 게 아니었던 것... 그래도 편차 큰 앨범과 작은 앨범 비교해보면 눈으로 보이는 게 있겠지 싶어 비교에 들어감.
분석은 어쨌든 할 줄 모르고 최대한 눈에 보이는 차이를 표현하려 애썼는데. 첫 번째로 원옵원과 돈콜미는, 두 앨범 다 높은 합산 득표수와 높은 종합 순위를 지니고 있지만 곡의 편차는 상당히 다른 경우다. 두 번째 로미오와 누너예는 곡 수가 많지 않지만 편차는 다른 경우다. 편차가 큰 앨범의 경우 값의 분포가 양극단으로 편중되는 경향을 발견할 수 있음. 방사형 그래프 또한 한 쪽으로 치우친 모습으로 나타남. 반면 편차가 크지 않은 경우 마치 중심으로부터 뻗어나가는 모습처럼 보이는 건 기분탓이 아닐 거라고.. 생각.. 아마도..
세번째 오드와 미컨유는 중앙값의 위치가 비슷하지만 편차는 비교적 다른 경우. 평균과 중앙값의 차이는 비슷하지만 그래프의 모양은 확실히 차이가 존재함. 오드의 히스토그램은 비교적 넓게 분포된 모양새고, 방사형 그래프는 특정 영역으로 쏠려 있음. 미컨유 앨범 역시 방사형 그래프를 보면 약간의 쏠림 현상이 나타나지만, 중심에서 퍼져 나가는 도형의 양상을 찾아볼 수 있다는 점에서 오드 앨범의 그래프와 다르다.
더해 뭐 하나라도 더 정리해보자 싶어 요약한 앨범별 최고/최저 득표곡. 이 표도 찬찬히 뜯어보면 재미있는 요소들 많이 발견하지 않을까! 최저 득표곡에 오른 내 픽들 보며 눈물만.. 개인적으로 사계한 리믹스를 이겨내지 못한 포오네,,가 눈에 가장 걸림,,
마지막으로 1차 총선 결과글 볼 때 부터 궁금했던 101위, 도합 190표의 '기타' 목록..! 근데 후보곡 목록을 캡처해놓은 게 없어서 확실한지는 모르겠음..
본인이 정리했을 때 한국 음반 수록곡 중에 후보 대상이 총 113곡이었고(누너예 붐트랙 제외o), 100위 안에 이름 올리지 못한 13곡을 추린 게 이 기타 목록임. 감안해서 봐줘!
여기까지.. 이상 쓸 데 없이 긴 여정은 막을 내리겟고요.. 원덬의 뻘짓을 재미있게 봐준 덬이 하나라도 있기를ㅎㅎㅋㅋ 데이터 제공자 총대덬과 참여덬들에게도 감사 인사를 전하며 이만 끗~~~!