ETRI/삼성전자 출신, AI 전공 컴퓨터 공학과 교수님께 들은 이야기

 

1. 툴이 아니라 문제다.

 

툴이 중요한 것 같지만 사실은 문제가 더 중요하다.

툴은 점점 더 새로워 지며, 더 빠른속도로 혁신이 일어날 것이다.

문제와 문제를 합쳐서 새로운 문제를 만드는 게 핵심이다.

 

2. 공부와 요리

 

공부하는 것은 요리와 같다.

남들이 하는 레시피를 보고 요리를 익히기 시작하면 잘 할 수 있을 것처럼 보이지만, 응용 부분에서 막히게 된다.

요리를 제대로 공부하는 방법은 요리에 어떤 영양소가 있고 우리 몸에 어떤 영향을 주는지부터 이해하는 것이다.

 

3. 이론과 툴

 

이론적인 부분에 대한 이해가 있으면 툴을 공부할 때 더 편하다.

머신러닝에 대해 더 잘 알수록, 파이썬, 쥬피터 등을 공부하기에 용이하다.

 

4. 수학을 보는 관점

 

수학 공식이 중요한 것 같지만 공식 밑바닥에 있는 원리는 수학적인 표현말고도 표현이 가능하다.

수학 표현보다 원리가 중요하다.

원리를 수식없이 모르는 사람에게 잘 설명할 수 있으면 그게 더 고수라고 생각한다.

블로그 이미지

Student9725

나에 대해 알아가는 시간들

,

실천 마인드의 첫 번쨰 요소는 편견과 이해관계로 오염되지 않은 마음으로 데이터가 알려주는 결론에 귀를 기울이는 것이다. 우선 데이터를 바탕으로 내린 결론을 있는 그대로 받아들이는 것부터가 쉬운 일이 아니다. 보통 데이터 수집 및 분석은 문제에 대한 특정한 관점에서 가설을 세우는 것에서 시작한다. 가설은 데이터 분석에 초점을 부여하여 시간을 절약할 수 있게 해주지만, 자신이 기대하지(또는 원하지) 않는 결과가 나왔을 때에는 이를 받아들이는 것을 힘들게 한다. 따라서 관점을 갖되, 관점이 편견으로 작용하는 것을 경계하는 태도가 필요하다.

 

p57 발췌

블로그 이미지

Student9725

나에 대해 알아가는 시간들

,

책의 표지와 제목이 눈에 들어와서 읽었다. 책 뒷면 겉표지에 ‘복잡한 수학 공식 없는 유쾌한 통계 수업’이라고 적혀 있다. 그대로의 책인 듯. 수학 공식이 없는게 아니라, 복잡한 수학공식이 없었다.... 수학 공식은 아주 약간 있었지만, 부담스럽지는 않은 정도. 확실히 유쾌하긴하다. 번역자께서 ‘유쾌한 말투로’ 번역하기 위해 공을 많이 들인 티가 난다.

 

작가 유리 브람은 책의 서두에서 이 책을 쓴 목적 3가지를 밝힌다. 
1] 복잡한 통계 기법들을 배우지 않고도 통계학자처럼 생각하는 방식을 가르쳐주기 위해
2] 통계학 수업 듣는 사람들이 통계학을 새롭게 바라보게 하기 위해
3] 책을 읽는 독자가 통계학자처럼 섹시한 매력을 갖게 하기 위해(진지하다고 말함)

 

이 목적을 달성하기 위해(?) 100쪽 약간 넘는 분량 동안 통계적 개념 3가지를 다룬다. 선택 편향, 내생성, 베이즈 정리를 통해 통계적 사고를 단련시키고자 하는 마음이 느껴진다. 개념은 간단히 소개하고, 정말 수 많은 여러 사례들을 예시로 보여주며 이야기를 풀어간다. 한 사례 두 사례 볼 때마다 훈련받는 느낌이었다... 이런 사례는 이렇게 그릴 수 있다, 저런 사례는 이렇게 모형화 할 수 있다, 잔뜩 보여준 후에 ‘너도 할 수 있겠지?’ 묻는 느낌이랄까.

 

많은 사례들을 접하고, 생각해보고 나니 ‘아, 통계학의 개념들이 일상과 분리되고, 논문이나 보고서에만 동원되는 것이 아니라, 실생활에도 어렵지 않게 적용될 수 있구나.’라는 생각이 들었다. 좋은 책을 만들고 나눠준 작가와 번역자께 감사드린다.

 

나도 실력을 키워서, 일상의 경험을 해석해보고, 다른 사람들과 나눠보는 경험을 갖고 싶다.

 

 

인상 깊었던 구절들

 

p11
 이 책에서는 다른 사람들이 무능하다고 생각하는 당신의 상사가 어떻게 스스로를 과대평가하고 있는지에 대해 선택 편향으로 설명하고, 베이즈의 정리를 이용해 당신의 애인이 바람피우고 있을 확률을 계산해볼 겁니다. 또한 왜 마커 저커버그와 같은 사람들이 예시로 이용되어서는 안 되는지도 설명할 겁니다.


p16
 당신이 가게 앞에서 복숭아를 보며 고민하는 모습을 본 가게 주인이 복숭아 두 개를 주며 살펴보라고 했다면 어떨까요? 이 경우에는 주어진 복숭아가 전체 복숭아를 잘 나타낸다고 믿기는 어렵겠죠. 가게 주인이 당신을 다시 보지 않을 거라고 생각해 약삭빠르게 가장 좋은 복숭아를 주고 확인하게 하여 나머지 복숭아가 상당히 상태가 안 좋은 것을 속일 수도 있습니다. 통계학에서는 이러한 문제를 선택편향selection bias라고 부르는데, 비무작위 표본을 마치 무작위 표본인 것처럼 생각하고 사용할 때 발생하는 오류를 뜻합니다.

p32
 하지만 언제나 응답하지 않는 사람들은 존재하고 매우 비무작위적 방식으로 일어납니다. 이것은 단순한 학문적 문제가 아닙니다. 미국 연방 정부는 인구조사의 숫자에 기초해 주 정부를 포함한 지방 정부의 사회복지 지원금을 결정합니다. 만약 도시의 저소득층 거주 지역의 주민들이 인구 조사에서 빠진다면, 그 지역은 받아야 할 지원금보다 적은 금액을 받게 되는 것이죠.

p46
생물학에서 내생성적인 것은 그들이 연구하고 있는 유기체나 조직 또는 세포 내에서 발생하는 것을 뜻하고, 외생성적인 것은 그 밖에서 발생하는 것을 뜻합니다. 이러한 개념은 사회과학에도 (그리고 일상생활에도) 적용되는데, 다만 생물학에서처럼 세포나 조직, 유기체와 같이 명확한 대상을 갖지는 않지요. 사회과학에서의 내생성과 외생성 논쟁은 여러 모형들로 다루어지는데, 실제 삶은 일상적이고 내포된 수많은 모형들로 이루어져 있죠.

p47
실제 삶에서 관심 있는 어떤 결과를 보면, 우리는 어떻게 그런 결과가 일어났을지 생각하며 머릿속에서 모형을 만들어보게 됩니다. 근본적으로 우리가 답해야 하는 질문들은 ‘그 결과를 얻기 위해 어떤 요소들이 투입되었는가?’와 ‘각 요소가 서로에게 어떤 영향을 미치는가?’입니다.p49스티븐 호킹Stephen Hawking이 [시간의 역사A Brief History of Time]를 집필하던 중 (그나저나 삶을 송두리째 바꿀 수 있는 책이니 읽어보세요) 누군가 그에게 공식을 하나씩 더 넣을 때마다 독자의 수가 절반으로 줄어들 것이라 말했다더군요.

p57
대학생들은 자신이 듣고 싶은 수업을 골라서 들을 수 있고, 그 수업의 난이도에 따라 A를 받는 난이도가 결정되지요. 그러니 더 쉬운 수업을 고른 사람들이 더 높은 점수를 받을 수 있는 겁니다. 대학교 1,2학년 시절 나는 누구도(회사나 대학원들) 이런 어처구니없는 평균 학점에 크게 의미를 두지 않을 것이라 생각하고 점수에 대해 크게 신경을 쓰지 않았습니다. 누구도 이러한 내생성 문제에서 완전히 자유롭지는 않다는 것을 생각하지 못했죠.

p74
1940년대의 공중 보건 전문가들은 소아마비와 아이스크림 섭취 간의 상관관계를 발견하고 소아마비를 예방하기 위해 아이스크림 섭취를 줄이도록 권고했습니다. 뭔가 이상하다고 느꼈겠지만 소아마비는 여름에 더 많이 발병하고 아이스크림 섭취도 여름에 증가하지만, 둘 사이에는 아무런 인과관계가 존재하지 않는다는 것이 이후에 밝혀졌습니다.

 

블로그 이미지

Student9725

나에 대해 알아가는 시간들

,