여행을 가서 4인실 게스트 하우스에 숙박하기로 했다. 방에 들어가자 주변에 마스크를 하고 콜록이는 사람이 보인다. 독감에 걸렸다고 의심된다. 괜히 저 사람과 접촉에 의해 감기가 옮지 않을까하는 조심스런 마음이 생겨 옆방으로 도망간다. 그런데도 불안하다. 옆 방의 청결상태가 있던 방과 비슷하기 떄문이다.

 

문득 궁금증이 든다. 내가 조금 전 만난 독감에 걸린 사람이 아프게 된 원인이 과연 독감을 가진 다른 사람과 만나서 였을까? 아니면 원래 있던 방의 청결상태 떄문이었을까? 만약 원인이 전자라면, 나는 옳은 판단을 한 것이고, 후자라면, 더 깨끗한 방이나 다른 숙박시설로 옮기지 않는 한 별 의미가 없을 것이다. 진짜 원인은 무엇이었을까?

 

19세기 말. “왜 질병이 생기는가?”라는 질문이 서양 의학의 중요한 관심사였다고 한다. 질병을 일으키는 어떤 인자가 있어 그 인자를 가진 사람과 접촉하면 병이 퍼진다고 주장한 감염설과 오염된 생활환경 떄문에 질병이 생긴다고 주장한 장기설이 대립했다.

 

이 대립의 배경엔 18세기 말 산업혁명으로 인한 급격한 사회 환경의 변화가 있었다. 농민들이 도시로 몰리고 노동자와 빈민이 되면서 열악한 생활환경에 놓이게 되었다. 이미 1800년 전후부터 미국과 유럽 각국에서 시행한 통계조사 데이터가 있었다. 19세기 말 장기설이 질병을 설명하는 유력한 이론으로 떠오르게 되었다. 사회개혁 운동가들은 상하수도 시설이나 주거공간의 환경을 개선할 것을 강력히 주장했다.

 

감염설보다는 장기설을 적극 옹호한 사람 중 하나는 나이팅게일이었다. 그녀는 야전병원의 데이터를 가지고 당대의 통계전문가들과 교류했다. 결국 사망원인에 따른 사망자 수를 그래프에 보기 좋게 표현하여 왕실과 의회를 설득했다. 야전병원의 환경개선으로 사망률이 현저하게 낮아지게 되었다. 사회에서는 이 아이디어를 활용하여 체계적인 간호학교가 세웠고 군대와 민간병원의 환경도 개선하기 시작했다.

 

독감으로 이야기를 시작했지만 사실 최근 유행하는 질병 중 감염병이 주요 사망원인이 되지는 않는다고 한다. 심장병이나 암과 같은 만성질병이 사망원인으로 꼽히며 그 원인은 흡연, 식습관, 운동부족 등이다. 이제 장기설은 이제 힘을 잃고 있는 것처럼 보일지도 모른다.

 

그러나, 흡연, 식습관, 운동부족 등이 비정규직 노동자들에게 더 자주 발생하는 것처럼 보인다는 건강불평등에 관한 연구가 있다. 어찌보면 19세기의 사회구조와 여전히 비슷하다고 느껴진다. 말라리아의 원인은 모두 규명되었지만 세계보건기구의 발표를 보면, 매년 수백만명의 사람이 말라리아로 목숨을 잃는다고 한다. 현미경 앞에 앉아 바이러스만 찾는 것이 건강불평등 문제를 해결하는 비책은 아닌 것처럼 보인다.

블로그 이미지

Student9725

나에 대해 알아가는 시간들

,

개강 직후 몇 가지 학기 중 독서목표를 세웠습니다. 바로 공강을 시간을 틈틈이 활용하여 최소 2주에 한권의 책을 접하는 것입니다. 마침 존경하는 조원경 작가님이 [디지털혁명 4.0]이라는 책을 내셨고, 긍정적인 평들이 페이스북 타임라인에 자주 보였습니다. 이 책을 사려고 했더니 주말에 근처 서점 여러군데에서 모두 절판 상태였고, 당장 읽을 다른 책이 필요했습니다. 대신 이왕이면 조원경 선생님의 다른 책을 살펴보기로 했습니다.

 

고등학생 시절, 대학생이 되면 반드시 알아야겠다고 생각하는 지식 몇 가지가 있었습니다. 빅뱅이론, 상대성이론, 진화론. 그리고 노벨상은 받은 사람들은 누구인지였습니다. 다른 여러 가지 이론들은 잘 모르지만 조금이나마 접해봤지만, 노벨상은 양도 방대하고 내용도 어렵기에 접근 자체를 포기했습니다.

 

우연히 만나게 된 이 책, [식탁위의 경제학자들]은 어린 시절을 떠올리게 해주었습니다. 이 책에는 노벨 경제학상을 받은 여러 경제학자들의 철학이 담겨있습니다. 무엇보다 어려운 경제이야기를 쉬운 언어로 풀어주어 노벨상 중에서도 어려운 분야인 경제학을 보다 쉽게 바라볼 수 있도록 도와줍니다. 뿐만 아니라 나온지 수십년이 지나 지루할 수도 있는 여러 이론들을 현재의 관점에서 재해석하고 다시 적용하는 전개방식에서는 정말 박수가 나왔습니다.

 

1993년 노벨 경제학상을 수상한 더글러스 노스의 제도경제학의 생소함 또는 2014년 노벨경제학상을 수상한 장 티롤의 양면시장이론의 딱딱함을 바로 만나게 하는 대신 재미있는 질문을 던집니다.

 

“왜 산업혁명은 중국이 아니라 영국에서 일어났을까” 
“페이스북을 사용할 때, 왜 사용료를 내지 않을까”
라고 말이죠.

 

경제학은 사회문제를 경제의 구조적인 문제로 바라보고, 바람직한 모델을 세워 해결하려고 합니다. 어떤 모델을 왜 그렇게 바라볼 수밖에 없었는지 이해하고, 대체 이 모델이 세워질 당시에는 어떤 문제들을 보고 이러한 모델이 세워졌는지, 모델을 세울 당시의 생각이 지금의 문제들이 적용될 수 있는지 생각해보는 일은 정말 의미 있는 일 같습니다. 그렇기에 어려워서 이러한 학문을 접해볼 기회를 포기한 저에게, 쉽게 쓰여진 이야기라 더 크게 다가온 듯 합니다.

 

이 책의 큰 줄기 5개는 삶과 경제의 영혼, 우리가 직면한 도전, 경제와 윤리, 국가 만들기, 기술과 혁신이라는 이름을 가지고 있습니다. 5개의 큰 줄기를 따라가다 보면 22명의 노벨경제학상 수상자들이 저마다의 꽃을 피우고 있죠. 이 책을 접하게 되면 경제학 전공자가 아니더라도, 한번쯤 아름답지만은 않지만, 각각의 개성이 있는 22개의 꽃을 구경하는 재미를 느낄 수 있을 것입니다.

 

에필로그 중

식탁에 앉아 상념에 빠져든다. 언제부턴가 많은 사람들은 무기력해진 세계경제를 바라보며 우리가 죽은 경제학자의 노예가 된 것이 아닌가 하는 회의감을 토로한다. 성장을 해도 고용이 늘지 않고 금리를 마이너스로 내려도 물가가 오르지 않는 상황에서 그들의 이야기는 어느정도 일리있게 들린다.

(...중략...)

섬 저 멀리에서 깜빡이는 불빛들이 보인다. 어둠을 밝히는 불빛들은 저마다 소중한 의미를 담고 있는 듯 속삭이며 말을 건다, 날이 밝으면 사라질 운명이지만 서로가 서로에게 다가가고자 안간힘을 쓰는 듯하다. 우리는 저 불빛처럼 더불어 잘사는 세상을 위해 먼저 손을 내밀 용기를 가지고 있는지 조용히 내 자신에게 물어 본다. 우리가 정말 서로를 사랑하고 있을까? 그런 사랑하는 마음을 되새기며 어둠을 가르고 찬란한 태양이 떠오르길 기다리고 있다.
블로그 이미지

Student9725

나에 대해 알아가는 시간들

,

저는 통계가 거짓말이라는 주장을 굉장히 싫어합니다. 마치 일부의 용례를 가지고 전체를 호도하는 듯한 느낌을 받아서 그렇습니다. 이 책은 몇 년 전에 접했지만, 제목에서 이미 부정적 감정이 있었기에 펴보지도 않고 pass했습니다.

 

몇 개월이 지난 후, 이 책에 대해 흥미로운 소개를 하는 책을 만났습니다. 명저 [벌거벗은 통계학]의 저자 찰스 윌런은 마지막 부분에 있는 감사의 글에서 이 책, [새빨간 거짓말, 통계]를 언급합니다. 그는 이 책이 1950년대에 나온 고전이고 100만부이상 팔렸으며 자신에게 큰 영감을 주었다고 말합니다.

 

명저의 저자에게 큰 영감을 줄 수 있는 책은 어떤 책이었을까? 얼마나 더 명작이길래? 라는 궁금증을 가지고 읽게 되었습니다.

 

이 책은 많은 연구와 보고서, 또 일상생활까지 스며든 잘못된 통계적 방법의 사용이 어떤 것들이 있는지, 재미있는 예시들을 들어가며 지적합니다. 크게 10개의 파트로 나누어 통계학의 중요개념들을 복잡한 수학적 수식들과 어려운 개념을 숫자가 아니라 말로 설명합니다. 재밌는 이야기가 많아 이 책은 조금 자세하게 다루고 싶어 글이 길어질 듯 합니다.

 

1. 언제나 의심스러운 여론조사

 

31쪽에 재밌는 예시가 나옵니다. 배경은 2차 세계대전 중의 미국. 국립여론조사기관에서 미국 남부의 한 도시에 사는 흑인 500명을 인터뷰합니다. 조사과정에서 두 조사단을 꾸렸는데, 한 쪽 조사단은 백인들로만, 다른 조사단은 흑인들로만 구성했습니다.

 

조사지에는 이런 질문이 있었습니다.


“일본군이 미국을 점령한다면, 흑인에 대한 차별은 지금보다 더 하겠는가 덜하겠는가”

 

흑인 조사단의 조사결과, 이 질문에 대해 차별이 더 심해질 것이라고 대답한 흑인의 수는 응답자 수의 25%였습니다. 반면, 백인 조사단이 조사했을 때는 45%나 되었습니다.

 

다른 사례를 보겠습니다. 

 

1936년 미국의 Literary Digest사에서 루즈벨트와 랜든 간 대선 관련하여 설문조사를 했습니다. 회수된 설문지의 분석결과 랜든이 57% 루즈벨트가 43%의 결과로 루즈벨트가 질 것이라고 나왔습니다. 반면, 실제 대선에서는 루즈벨트가 63.5%의 압도적인 표를 얻어 당선됩니다. (출처 – 성내경 저, ‘표본조사방법론’)

 

위의 결과들은 보면, 여론조사 결과는 상당히 보수적으로 왜곡되어 나옵니다. 왜 그럴까요?

작가는 여론조사가 속임수에 의해 조작된 것이 아니라, 표본 자체가 한 방향으로 기울어져 버리는 경향이 있다고 합니다. Literary Digest가 조사한 표본은 사실 원래 측정하려던 모집단보다 더 부유하고, 교육수준이 높고, 예의바른 사람들이었습니다.

 


2. 평균은 하나가 아니다

 

2장의 내용은 조금만 통계학을 사람들이라면 기술통계학(descriptive)에서 질리도록 들어봤을 수 있습니다. 평균, 중위수, 최빈값에 관한 이야깁니다. 통계학 교과서에서도 단골소재죠.

 

핵심을 간단히 표현하면 ‘어느 경우에 무엇을 대푯값으로 사용하는 게 좋고, 언제 평균이 문제가 되는가’ 정도가 되겠습니다.

 

어느 원시 부족 남자들의 평균 신장이 150cm라는 말을 들으면 꽤 정확한 그림이 그려집니다. 평균과 중위수, 최빈값 간의 차이가 거의 없기 때문이죠. 그렇게 되는 이유는 키나 몸무게. 가슴둘레 등의 자료들이 정규분포라 불리는 곡선에 가까운 예쁜 종모양으로 나타나기 때문이죠.

 

그런데 연간소득분포에서는 어떨까요. 대부분 대략 2억원을 넘지 않는 소득을 올렸을 것이고, 전체의 95%이상의 세대가 올린 소득은 1억원 이하일지도 모르겠습니다. 이것을 곡선으로 그려보면 왼쪽으로 쏠린 모양이 나타날 껍니다. 마치 계단을 따라 급하게 올라갔다가 꼭대기에서 서서히 내려가는 어린아이들의 미끄럼틀과 비슷하죠. 이 때 산술평균과 중앙값은 크게 차이나게 됩니다. 따라서 작년 소득의 산술평균과 올해의 중위소득을 비교하는 것은 의미가 없게 됩니다.

 

아까 원시부족의 평균키 150cm를 언급했었습니다. 아프리카 사람들의 작업복을 만드는 회사는 이것보다는 더 많이 고민 할 텐데요. 무엇이 더 필요할까요? (나중에!)

블로그 이미지

Student9725

나에 대해 알아가는 시간들

,

1학기 내내 수강한 강의(통계학)의 핵심은 '선형회귀분석'이었다.

선형회귀분석이란 여러 변수 간의 관계를 선형으로 보겠다는 관점을 가지고 있다.

선형이란 일차함수 식으로 표현 가능한 단순한 형태를 말한다.

ex> 온도가 오르면 온도계의 눈금이 비례해서 오른다.

 

학기를 마칠 무렵, 개인적으로 공대에서 측정한 실제 연구 데이터를 받아 분석을 수행해 보았다.

분석 과정에서 생각지 못한 여러가지 문제점들이 발생했고, 실력이 부족함을 꺠달았다.

또한 선형 모형으로 보기 힘든 현상을 선형으로 잘못 생각할 수도 있음을 인지했다.

 

사실 선형이 아닌 것을 선형으로 잘못 보았던 것은 이번 분석뿐만이 아니었다.

며칠 전 부모님과 통화를 했었다.

부모님이 자영업을 하시며 약간의 몸일을 하시는데 나이가 어느정도 드셔서, 알바생을 쓰는 것이 좋을텐데 최저시급의 인상으로 인해 부담스럽다는 것이었다.

 

사실 대학생인 나의 입장에서는 최저시급을 인상하는 것이 나에게 정말 큰 힘이 되고, 전체적으로도 청년층이 돈이 많아지면 구매력이 높아지므로 지역경제에도 도움이 되지 않을까라고 생각했다. 최저시급이 올라가면 사람들의 경제 사정에 도움이 되겠거니라고 단순하게 선형적으로 생각한 것이다.

 

<틀리지 않는 법>은 어설픈 수학적, 통계적 모델을 경계하고 제대로 학습하는 법을 말한다.

 

이 책의 첫 장의 주제는 선형성을 경계하는 법이다.

제목이 조금 변태스러운데 '덜 스웨덴스럽게'다. 
이게 무슨말인가.

 

몇 년전 미국에선 건강 보험 개혁법, 통칭 오바마 케어에 대한 논의가 뜨거웠다. 자유주의 성향인 카토 연구소의 한 연구원은 블로그에 '오바마는 왜 미국을 더 스웨덴스럽게 만들려고 애쓰는가? 스웨덴 사람들마저 덜 스웨덴스러워지려고 애쓰는 마당에?' 라는 제목의 글을 올렸다.

 

이 사람의 기본적인 생각은 복지가 늘리는 것이 (사회주의적 성향이 늘어나는 것이) 국가의 번영에 더 안좋다는 것이다.

그렇다면 복지국가인 스웨덴사람들은 복지를 줄이려고 애쓰는 반면 왜 오바마는 미국의 복지를 강화하려고 애를 썻을까? 오바마는 바보인가?

 

현실에서는 < 큰 정부는 무조건 나쁘고 작은 정부는 무조건 좋다>보다 복잡한 상황이 펼쳐진다. 경제학에서 많은 곡선들은 두번째 그림처럼 생겼기 떄문이다.

 

이처럼 현상을 곧바로 선형 모델로 생각하는 것은 위험할 수 있다.

 

블로그 이미지

Student9725

나에 대해 알아가는 시간들

,

표본을 뽑아서 표본에 대해서만 조사를 함으로써 전체를 판단하는 것도 국의 간을 맞추는 것과 비슷하다. 우리는 모집단(솥 전체의 간)을 알기 위해 표본(국자의 간)을 뽑아서, 모집단을 추측하게 된다. 여기서 국의 간을 정확하게 알기 위해서는 모집단과 표본이 서로 달라서는 안 된다. 그래서 우리는 국자로 국을 휙휙 휘저어 줌으로써 모집단과 표본 간에 차이가 없도록 하는 것이다. 우리는 표본을 선정하고, 여기에서 수집된 자료만을 분석한다. 하지만, 우리가 수집 및 분석 과정에서 파악하고자 하는 것은 모집단이지, 표본 자체만은 아니라는 것을 잊지 말아야 한다.

블로그 이미지

Student9725

나에 대해 알아가는 시간들

,

나누어 보는 방법에 익숙해져서 ‘통계적 사고’의 능력이 증대되기를 바란다. 통계적 사고란 기본적으로 대상을 나누어서 구분해 보는 것이라고 필자는 생각한다. 다시 말해 본질적으로 대상이 가지고 있는 ‘다양성’을 염두해 두고, 자료를 나누어서 다양성이 발생하는 모양을 파악하여 대상을 이해하는 것이 통계적 사고의 기본 개념이다. 여기에 더해 다양성을 설명할 수 있는 적절한 구분자를 찾아주면 좀 더 대상을 잘 이해할 수 있다. 이런 사고를 통해 독자들은 통계자료를 근거로 하는 주장들의 타당성을 평가할 수 있는 능력이 생길 수 있을 것이다.

블로그 이미지

Student9725

나에 대해 알아가는 시간들

,

10년 전. 수능을 볼 때, 과학탐구 4과목 중 물리1, 물리2를 선택했습니다.

물리1은 공부했지만 결과는 좋지 않았고, 물리2는 시험장에서 거의 찍었습니다.

어려워 보이는 물리 과목을 2개나 선택한 것은 제 스스로와 다른 사람에게, 뭔가 있어 보이고 싶어서였습니다.

 

6년 전. 다른 관점으로 물리학을 만났습니다. 군대에서 만난 EBS 다큐프라임 ‘빛의 물리학’에 감명을 받았고, 이후 다른 여러 교양 물리학 책을 읽었습니다. 그 결과, 제가 살아가고 있는 이 세계에 대한 이해가 깊어졌다고 생각했습니다.

수능장에서 만났던 물리학을 벗어나서, 물리학을 잘 이해하게 되었다고 생각했죠.

착각이었죠. 이 책은 물리학이 그렇게 사용하는 물건이 아니라고 말합니다.

 

 

융합은 방법론의 나열이 아니라, 해결해야 하는 문제가 놓인 테이블 주변에 전문가들이 모인 형상에 가깝다. ‘세상물정’이라는 질문이 놓여 있는 테이블엔 물리학자도 앉을 수 있다. ‘세상물정’에 대해 공통적으로 던지는 질문의 귀중함에 주목한다면, 분과학문 사이의 경계를 따져 묻는 일은 부질없다.

- 책의 추천사 중 일부

 

물리학도, 결국은 우리 자신과 우리가 살아가는 사회를 설명하고, 더 잘 이해하기 위한 도구라고 소개합니다. 그리고 그 과정에서 작가 김범준 교수님은 ‘통계물리학’을 사용합니다. 통계물리학이란, 한 개 또는 두 개의 입자가 아니라, 그 입자가 이루고 있는 집단에 관심을 가지는 학문이라고 합니다. 입자가 100개 있는 상태를 설명해보고 싶을 떄, 하나의 입자를 설명하여 단순히 100개를 합하는 것보다는 100개 입자의 집단 하나를 통계학을 사용하여 새롭게 설명하는 것이 더 좋다는 점을 주목한 것이라고 하네요.

 

책에서 가장 마음에 든 것은 그래프들이었습니다. 한 챕터를 담당할 만큼 몇 페이지짜리 글을 한 두 개의 그래프로 잘 요약해낸 부분이 신기했습니다. 최근 프로그램을 사용하여 시각적으로 이리저리 표현하는 연습을 하는 중인데, 그래프 하나하나를 어떤 색으로 또는 어떤 형태로, 어떤 마음으로 표현하면 좋을지, 그것을 보는 다른 사람에게는 그것이 어떻게 전달될지 다시 생각해보게 되었습니다.

 

저와 관계없는 딱딱한 학문으로 남을 수도 있었던 물리학을 새로운 방식으로 보여준 작가님께 감사드립니다.

 


가장 인상 깊었던 구절

p.224

 모든 예술 작품은 결국 관계맺음의 문제. 작품을 구성하는 요소들 사이의 관계맺음, 그렇게 관계 맺어져 하나의 전체가 된 작품과 그 작품을 보는 사람 사이의 관계맺음. 인상파 화가들의 성공의 절반은 그림을 보는 우리가 만들었다. 이런 방식의 관계맺음에서 결국 예술가가 하는 일이란 작품과 감상자의 관계맺음의 구체적인 내용을 제공하는 것이 아니라, 관계맺음의 플랫폼, 즉 ‘감상자가 참여해 뛰어 놀 수 있는 마당’을 제공하는 것이 아닐까. 그 플랫폼 위에서 구체적으로 무엇이 보여지고 무엇을 볼지는 우리가 작품 앞에 마주서기 전에는 결정되지 않는다.
블로그 이미지

Student9725

나에 대해 알아가는 시간들

,

모든 대학을 평준화하면 문제가 해결될까. 이렇게 되면 오로지 더 좋은 대학원에 가기 위한 준비 단계로 끔찍한 대학 4년을 보내거나, 아니면 소위 스펙을 쌓고 학점을 잘 받으려고 지금보다 더 엄청난 고통을 겪을 것이다. 한국의 교육 문제는 교육만의 문제가 아니다. 사회의 분배구조 문제와 밀접하게 관련돼 있어 양자를 분리해서 해결할 수 없다.

 

p.58 발췌

블로그 이미지

Student9725

나에 대해 알아가는 시간들

,

지역감정은 투표권을 행사하는 평범한 사람을 위한 것이 아니라, 그 투표에 의해 선출되기를 바란 정치인을 위해 조장된 것이다. 대동소이한 사람을 임의의 기준에 따라 두 집단으로 나눈 뒤 집단 내부 결속을 강화하면서 다른 집단과의 소통을 단절하면, 시간이 지나면서 한 집단은 다른 집단에 비해 우월하다는 믿음과 상대 집단에 대한 적대감을 자발적으로 발전시키게 된다는 연구결과가 여럿 있다. 국민 통합을 방해하는 자들은 평범한 우리가 아니다. 보이지도 않는 미세한 차이를 과장해 우리를 또 다른 우리와 구별하도록 유도하고 이를 이용해 손쉽게 선거에서 선출되기를 바랐던(그리고 여전히 바라는) ‘그들’이다.

 

블로그 이미지

Student9725

나에 대해 알아가는 시간들

,

당신이 어떤 분석을 했는데 p 값이 0.06이 나왔다면, 당신은 마땅히 그 결과가 통계적 유의성이 없다고 결론 내려야 한다. 하지만 몇 년 동안 해온 작업을 서류함에 처박아 버린다는 것은 엄청난 정신력이 필요한 일이다. 그러고 보면 한 피험자의 수치가 약간 이상해 보이지 않는가? 어쩌면 그것이 예욋값일 수도 있으니, 스프레드시트에서 그 줄을 날려 보자. 참, 연령을 통제했던가? 바깥 날씨를 통제했던가? 연령과 바깥 날씨를 둘 다 통제했던가? 이렇게 통계적 시험을 조정하고 삭제할 재량을 스스로에게 부여하면, 종종 0.06을 0.04로 낮출 수 있다. 펜실베니아 대학 교수로서 반복 가능성 연구의 선구자인 유리 시몬손은 이런 관행을 [p해킹]이라고 부른다.

 

과학자들은 남들이 듣지 않는 곳에서는 이런 관행을 가리켜 <데이터를 고문해서 자백 받아 내기>라고 부른다

. 그 결과의 신뢰도는 완력으로 끌어낸 자백의 신뢰도 정도밖에 되지 않는다.

블로그 이미지

Student9725

나에 대해 알아가는 시간들

,