책의 표지와 제목이 눈에 들어와서 읽었다. 책 뒷면 겉표지에 ‘복잡한 수학 공식 없는 유쾌한 통계 수업’이라고 적혀 있다. 그대로의 책인 듯. 수학 공식이 없는게 아니라, 복잡한 수학공식이 없었다.... 수학 공식은 아주 약간 있었지만, 부담스럽지는 않은 정도. 확실히 유쾌하긴하다. 번역자께서 ‘유쾌한 말투로’ 번역하기 위해 공을 많이 들인 티가 난다.
작가 유리 브람은 책의 서두에서 이 책을 쓴 목적 3가지를 밝힌다.
1] 복잡한 통계 기법들을 배우지 않고도 통계학자처럼 생각하는 방식을 가르쳐주기 위해
2] 통계학 수업 듣는 사람들이 통계학을 새롭게 바라보게 하기 위해
3] 책을 읽는 독자가 통계학자처럼 섹시한 매력을 갖게 하기 위해(진지하다고 말함)
이 목적을 달성하기 위해(?) 100쪽 약간 넘는 분량 동안 통계적 개념 3가지를 다룬다. 선택 편향, 내생성, 베이즈 정리를 통해 통계적 사고를 단련시키고자 하는 마음이 느껴진다. 개념은 간단히 소개하고, 정말 수 많은 여러 사례들을 예시로 보여주며 이야기를 풀어간다. 한 사례 두 사례 볼 때마다 훈련받는 느낌이었다... 이런 사례는 이렇게 그릴 수 있다, 저런 사례는 이렇게 모형화 할 수 있다, 잔뜩 보여준 후에 ‘너도 할 수 있겠지?’ 묻는 느낌이랄까.
많은 사례들을 접하고, 생각해보고 나니 ‘아, 통계학의 개념들이 일상과 분리되고, 논문이나 보고서에만 동원되는 것이 아니라, 실생활에도 어렵지 않게 적용될 수 있구나.’라는 생각이 들었다. 좋은 책을 만들고 나눠준 작가와 번역자께 감사드린다.
나도 실력을 키워서, 일상의 경험을 해석해보고, 다른 사람들과 나눠보는 경험을 갖고 싶다.
인상 깊었던 구절들
p11
이 책에서는 다른 사람들이 무능하다고 생각하는 당신의 상사가 어떻게 스스로를 과대평가하고 있는지에 대해 선택 편향으로 설명하고, 베이즈의 정리를 이용해 당신의 애인이 바람피우고 있을 확률을 계산해볼 겁니다. 또한 왜 마커 저커버그와 같은 사람들이 예시로 이용되어서는 안 되는지도 설명할 겁니다.
p16
당신이 가게 앞에서 복숭아를 보며 고민하는 모습을 본 가게 주인이 복숭아 두 개를 주며 살펴보라고 했다면 어떨까요? 이 경우에는 주어진 복숭아가 전체 복숭아를 잘 나타낸다고 믿기는 어렵겠죠. 가게 주인이 당신을 다시 보지 않을 거라고 생각해 약삭빠르게 가장 좋은 복숭아를 주고 확인하게 하여 나머지 복숭아가 상당히 상태가 안 좋은 것을 속일 수도 있습니다. 통계학에서는 이러한 문제를 선택편향selection bias라고 부르는데, 비무작위 표본을 마치 무작위 표본인 것처럼 생각하고 사용할 때 발생하는 오류를 뜻합니다.
p32
하지만 언제나 응답하지 않는 사람들은 존재하고 매우 비무작위적 방식으로 일어납니다. 이것은 단순한 학문적 문제가 아닙니다. 미국 연방 정부는 인구조사의 숫자에 기초해 주 정부를 포함한 지방 정부의 사회복지 지원금을 결정합니다. 만약 도시의 저소득층 거주 지역의 주민들이 인구 조사에서 빠진다면, 그 지역은 받아야 할 지원금보다 적은 금액을 받게 되는 것이죠.
p46
생물학에서 내생성적인 것은 그들이 연구하고 있는 유기체나 조직 또는 세포 내에서 발생하는 것을 뜻하고, 외생성적인 것은 그 밖에서 발생하는 것을 뜻합니다. 이러한 개념은 사회과학에도 (그리고 일상생활에도) 적용되는데, 다만 생물학에서처럼 세포나 조직, 유기체와 같이 명확한 대상을 갖지는 않지요. 사회과학에서의 내생성과 외생성 논쟁은 여러 모형들로 다루어지는데, 실제 삶은 일상적이고 내포된 수많은 모형들로 이루어져 있죠.
p47
실제 삶에서 관심 있는 어떤 결과를 보면, 우리는 어떻게 그런 결과가 일어났을지 생각하며 머릿속에서 모형을 만들어보게 됩니다. 근본적으로 우리가 답해야 하는 질문들은 ‘그 결과를 얻기 위해 어떤 요소들이 투입되었는가?’와 ‘각 요소가 서로에게 어떤 영향을 미치는가?’입니다.p49스티븐 호킹Stephen Hawking이 [시간의 역사A Brief History of Time]를 집필하던 중 (그나저나 삶을 송두리째 바꿀 수 있는 책이니 읽어보세요) 누군가 그에게 공식을 하나씩 더 넣을 때마다 독자의 수가 절반으로 줄어들 것이라 말했다더군요.
p57
대학생들은 자신이 듣고 싶은 수업을 골라서 들을 수 있고, 그 수업의 난이도에 따라 A를 받는 난이도가 결정되지요. 그러니 더 쉬운 수업을 고른 사람들이 더 높은 점수를 받을 수 있는 겁니다. 대학교 1,2학년 시절 나는 누구도(회사나 대학원들) 이런 어처구니없는 평균 학점에 크게 의미를 두지 않을 것이라 생각하고 점수에 대해 크게 신경을 쓰지 않았습니다. 누구도 이러한 내생성 문제에서 완전히 자유롭지는 않다는 것을 생각하지 못했죠.
p74
1940년대의 공중 보건 전문가들은 소아마비와 아이스크림 섭취 간의 상관관계를 발견하고 소아마비를 예방하기 위해 아이스크림 섭취를 줄이도록 권고했습니다. 뭔가 이상하다고 느꼈겠지만 소아마비는 여름에 더 많이 발병하고 아이스크림 섭취도 여름에 증가하지만, 둘 사이에는 아무런 인과관계가 존재하지 않는다는 것이 이후에 밝혀졌습니다.
'취업공부 > 통계학' 카테고리의 다른 글
[박스오피스 경제학] 막걸리로 파전 예측 (0) | 2019.09.03 |
---|---|
[박스오피스 경제학] 텍스트마이닝으로 만들어진 '태티서' (0) | 2019.09.03 |
[박스오피스 경제학] 빅데이터와 상관관계 (0) | 2019.09.03 |
[박스오피스 경제학] 영화 논문 (0) | 2019.09.03 |
[MS 본사 데이터 과학자가 알려주는 헬로 데이터 과학] 실천마인드 (0) | 2019.09.03 |