저런 헛소리가 자꾸 돌면서 통계적으로 맞는거다, 너가 통계학을 부정하냐 이런 글이 더쿠말고도 자꾸 여기저기서 보여서
순전히 통계적으로만 얘기를 하겠음
일단 "청도 병원에서 대구 교회보다 사망자 숫자가 많기 때문에 청도 병원이 먼저 발병했다"는 주장이 성립하려면 다음과 같은 가정이 필요함
(1) 청도 병원의 환자들과 대구 교회의 환자들 (혹은 그 환자들 중 일부)가 서로 동질한 집단이다 (건강 상태 측면이나 발병에 영향을 끼치는 측면에서 동질하다는 가정)
→ 즉, 통계학에서 동일한 모집단에서 나왔다는 가정임
(2) 발병 속도는 동질한 집단에서 동일하다
→ 즉, 동질한 집단에서 발병했을 경우 발병속도가 같기 때문에 사망이 먼저 많이 나온 곳은 그만큼 사망으로 진행되기 위해서 더 많은 시간이 필요했을 것이기 때문에 먼저 걸렸을 가능성이 높다
→ 통계학에서 동일한 모집단 가설을 가정했을 경우 위는 집단의 분산(병의 발현 양상을 수치화 했을때)도 동일함을 의미하게 됨.
이렇게 2가지 가정을 깔아야지만
청도 병원에서는 사망자가 더 많고 대구 교회에서는 사망자가 무척 적게 나오기 때문에
청도 병원이 먼저 발병했고, 대구 교회가 뒤이어 발병했다는 논리가 성립함.
근데 이렇게 말하는 사람들이 "통계적으로 맞다"는 헛소리를 하는데, 통계적으로 하면 오히려 이 가정이 잘못되었다는 결론밖에 안 나옴.
우선 대구 교회쪽 발병 중에서 가장 빠른 발병 사례는 2월 7일임
반면 청도 교회쪽 발병 중에서 가장 빠른 발병 사례는 2월 11일임.
이건 추론이 아니라 팩트임
그렇다면
대구 교회는 2월 7일에 가장 빠른 발병 사례가 나왔는데 사망자가 적고
청도 교회는 2월 11일에 가장 빠른 발병 사례가 나왔는데 사망자가 많이 나왔다는 얘기가 되기 때문에
통계적으로도 두 모집단이 동질하다는 결론이 나올 수가 없음.
왜?
두 집단을 나타내는 두 지표가 기본적으로 다르기 때문에 (2월 7일 최초 발병 - 사망자 적음 vs 2월 11일 최초 발병 - 사망자 많음)
통계적으로는 이럴경우 두 집단이 동질하다는 가설이 잘못되었고, 오히려 두 집단이 다른 성질의 집단이었을 가능성을 채택함. (1번 가정이 거짓으로 드러남)
→ 쉬운 말로 현 상황에 대입해서 설명하면, 청도 병원의 환자와 대구 교회의 환자의 건강상태가 달랐을 수 밖에 없다는 결론에 도달하게 됨
두 집단을 대표하는 대표값이 서로 일치하지 않을 경우 동질한 집단(모집단)임을 가정할 수 없음
억지로 두 집단이 동질하다고 우겨넣을 경우 그럼 무슨 일이 생길까
두 집단이 동질하다고 가정을 하고 데이터를 설명하려면
대구의 경우 2월 7일 최초 발병인데 사망자가 적은 경우, 여기서는 질병의 진척 속도가 느리고
반면 청도의 경우 2월 11일 최초 발병인데 사망자가 많기 때문에 여기서는 질병 진척 속도가 다르다는 것 외에는 설명이 불가능함
청도가 먼저 발생했냐 아니냐 까지 가지 않더라도 이미 순수히 2가지 지표를 설명하기 위해서는 질병 진척 속도가 다르다는 가설을 제기해야 됨 (2번 가정이 거짓으로 드러남)
→ 쉬운 말로 다시 설명하면, 청도 병원에서는 병이 더 빠른 속도로 진척되었다는 결론에 도달할 수 밖에 없음
동질한 집단임을 억지로 가정하고 나머지 지표를 설명하기 위해서는 또다른 요인 (위의 도표의 경우 분산)이 달랐다는 결론에 도달할 수밖에 없음.
즉
어떤 쪽으로든 끼워맞추려고 해도
청도 병원에서 대구 교회보다 사망자 숫자가 단순히 많았다는 것만으로는 청도 병원이 먼저 발병했다는 설명에 도달할 수 없고
오히려 앞서 세운 이 주장의 가정을 반박하게 되는 결론만 도출됨
사망자 숫자가 많으니 청도 병원이 먼저 발병했다는 주장은 현재 나와있는 데이터(발병 시기)에 기반한 통계학적 분석이 아니라
오히려 야매 산수적 분석임.
만일 사망자 숫자가 많으니 청도 병원이 먼저 발생했다는 주장이 참이 되려면
최초 발병 시기도 청도가 빠르거나 혹은 청도 병원의 병 진척 속도가 비정상적이었다는 가정외에는 불가능함 (최초 발병은 느리나 그 이후 사망까지 이르는 속도는 빠르다)
한줄 요약: 단순히 사망자 숫자가 많다고 다른 발병 시기 등을 무시하고 청도 병원이 먼저 발병했다는 건 맞지 않음. 그리고 그거 통계학도 아님.