벌거벗은 통계학

가끔 인터넷에서 통계자료를 보다 보면 이렇게 통계치가 나올 수 있나? 라고 생각할 때가 있다.

특히나 주관적인 것을 통계낸 걸 볼 때 나의 생각과 사뭇 다를 때 특히나 그렇게 느낀다.

이 책의 후반부에서도 언급되는데 통계는 사회현상을 설명하는데 엄청난 도구가 되는가 하면 잘못 쓰면 독이 되기도 한다.

그래서 위험한 도구라고 설명하기도 하는데 리스크 있는 투자를 좋아하는 나로써 동질감을 느껴서인지 나는 통계를 좋아한다.

통계를 좋아하는 사람으로 이 책에 눈이 갔고, 그래서 이번에는 통계학 책을 읽어 보기로 하고 이 책을 사게 되었다.


먼저 책을 다 읽어 본 소감으로는 정말 좋은 책이다. 내용적으로 정말정말 좋다.

특히나 처음부터 후반부가지 난이도 분배(?)가 잘 되어있다. 통계학을 아예 모르는 사람에게 추천해도 될 정도로 쉽게 풀어져 있다. 뒤에 인상 깊었던 부분을 쓴 것을 보면 알겠지만 어려운 내용이라고 하는 것도 생각을 필요로 할 뿐 전공지식을 필요로 하는 것은 아니기 때문에 부담이 없이 읽을 수 있다.

그리고 또 전공지식이 어느 정도 있는 나로써 책이 마음에 들었던 점으로는 직관성을 가지게 만들어 준다는 점이다.

사실 어느정도 수준까지는 암기로도 통계학을 배울 수 있다고 생각하는 무언가 분석하거나 통계를 낼 때는 직관도 필요하다고 생각하기 때문에 책이 내용이 마음에 들었다.


마지막으로 인상 깊었던 부분이 여러 부분 있었지만 몇 가지만 뽑아서 소개해주고 싶다.


임금격차 중 직업의 생산성 차이로 인한 임금격차는 얼마나 되고, 실제로 존재한다면 성차별에 의한 임금격차는

얼마나 될까?(중략)시카고 대학 비즈니스스쿨에서 MBA를 받은 남녀 2500명 표본을 대상으로 임금 변화 궤적을

조사한 세명의 경제학자가 쓴 논문을 살펴보자. 남녀 졸업자들의 졸업 후 초본은 남성이 13만 달러,

여성 11만 5000달러로 매우 비슷했다. 그러나 10년 후에는 남녀간 임금 격차가 크게 벌어졌다.

취업 후 여성들에게 무슨 일이 있었던 걸까?


이 후 내용은 논문에 관한 내용으로 요약하자면 남녀 임금 격차는 성차별에 의해 설명되지 않는다.

성별에 대한 소득격차는 설명변수가 분석에 추가되면서 사라졌다.

주요한 통제변수(설명변수)를 회귀방정식에 포함시키자 설명되지 않는 남녀간 소득격차는 급격히 떨어졌다.

결론적으로 성별에 따른 소득 격차가 크고 경력에 따라 격차가 증가하는 현상에 대한 주 원인은 MBA 재학 중 받은 교육의 차이, 커리어 단절, 주당 근무 시간차이의 세 가지로 분석되었고, MBA 졸업 후 동기간 남녀 임금차이는 대부분 이 세 가지 결정 요인에 의한 것으로 설명할 수 있다고 나와있다.


찰스 윌런. 벌거벗은 통계학. p. 349


상관관계와 인과관계는 다르다.

회귀 분석은 두 변수간의 상관관계만을 말해준다. 전에도 말했듯이 통계만 가지고는 한 변수의 변화가 다른 변수의 변화를 초래 했다고 증명할 수 없다. 실제로 회귀분석을 잘못하면 서로 아무 관계도 없는 두 변수 간에 통계적으로 유의한 밀접한 연관관계가 나타 날 수 있다.

역인과관계.

A와 B 사이에 통계적 상관관계가 존재한다고 해서 A가 B의 원인이 되는 것은 아니다. 실제로 B가 A의 원인일 가능성도 매우 높다. 책의 다음 내용을 요약하면 책에서는 골프 레슨의 예를 들어 보여준다. 평균 타수(낮을 수록 좋음)와 골프 실력을 비교해 봤을 때 250달러까지는 평균타수와 골프 실력이 음의 상관관계를 가지다가 그 다음부터는 양의 상관관계를 가진다. 이 것을 책에서는 골프를 못 쳐서 골프 레슨비를 더 많이 쓸 수 있는 가능성으로 설명한다.


위의 책. pp. 368-369


이 것 뿐만 아니라 흥미로운 내용이 많으니 책을 읽어보길 추천하고, 이 책을 추천해준 Tolany님에게 이 글을 바친다.


+ Recent posts