<김성호의 논술의 핵심> "논술고사 문제들은 자료, 데이터, 변수 사이의 상관관계를 논리적으로 해석하길 요구"
<김성호의 논술의 핵심> "논술고사 문제들은 자료, 데이터, 변수 사이의 상관관계를 논리적으로 해석하길 요구"
  • 대학저널
  • 승인 2016.09.29 14:50
  • 댓글 0
이 기사를 공유합니다

[논술의 핵심] 통합교과형 논술 완전 정복 - 서강대학교편

똑똑한 닭의 비애

각종 애니메이션들에는 인간처럼 생각을 하고 감정을 느끼는 동물들이 등장하지? 라따뚜이, 앵그리 버드, 쿵푸 팬더, 라이온 킹, 인어공주, 이웃집의 토토로 등. 막상 열거하니 참 많기도 하네. 대개 따뜻한 감성과 정의감을 지닌 주인공 동물들이 'and they lived happily ever after' 하는 식으로 끝나는데, 아쉽게도 여기서 소개하는 닭의 운명은 순탄치가 않네. 

이름이 알려지지 않은 어떤 닭이 있었다. 어느 순간에 이 닭은 인간처럼 초보적인 사유를 할 수 있게 되었던 거야. 매일의 경험이 쌓여나가자 시간의 순서에 따라 일어나는 사건과 사건의 연관성을 포착하고 나름의 법칙까지도 만들어 내게 되었지. 닭 주인이 뜰에 나타나면 모이가 생긴다는 사실을 날마다 체험하면서 마침내, 이 똑똑한 닭은 주인이 뜰을 지나가는 것과 그릇에 든 모이 사이에는 인과관계가 있다는 결론을 내리게 됐다는 거지. 한 동안은 자신의 추론에 만족하면서 주인이 나타나면 재빨리 달려와서 모이를 쪼아 먹었더랬지. 그러던 어느날 비극이 닥쳐온 거야. 주인이 뜰에 나타나서 이 닭의 목을 비틀었단 말이지. 아마도 주인은 통통하게 살이 찐 이 닭을 요리할 때가 되었다고 생각한 모양이야. 

20세기 영국의 경험주의 철학자 버트런드 러셀이 소개한 이야긴데, 그는 우리가 어쩌면 사건과 사건의 연속성에서 너무 쉽게 인과관계를 단정하는 것은 아닌지 의심해 볼 필요가 있다는 생각에서 이런 섬뜩한 예를 든 거야. 동물복지를 걱정하는 이들이 많아진 시대가 되니 이젠 이 불쌍한 닭의 슬픈 운명에 마음이 가서 러셀의 충고는 귀에 들어오지 않는 이들도 많지 않을까 싶네.

상관관계와 인과관계
잠시 슬픔을 접어두고 이 이야기에서 말하고자 하는 바에 주목해 보자. 두 사건, 두 현상, 두  변수 사이에 반복적으로 나타나는 어떤 연관성이 있을 때 우리는 둘 사이에 상관관계가 있다고 말해. 만약 둘의 관계에서 하나가 원인 또 하나가 그에 따른 결과일 때, 이 둘의 관계를 인과관계라고 하지. 인과관계를 맺는 두 사건, 현상, 변수는 반드시 어떤 연관성을 가지니 인과관계는 상관관계의 부분집합이라고 생각하면 된다. 이 상관관계와 인과관계라는 개념은 매우 중요하니 이번 기회에 잘 정리해 보자. 근대 학문은 분석 대상들에서 이런 상관관계를 발견하고 이것이 인과관계를 맺는지 찾는단 말이야. 그러니 많은 논술 문제에 이런 용어가 등장하는 것도 당연하겠지. 때로는 이 상관관계와 인과관계 자체를 중심에 둔 딱딱한 문제들도 있다. 예를 찾아보려 데이터베이스를 검색했더니 어마어마하네. 예를 들면 이런 식이다.

1. 제시문에 등장하는 상관관계 혹은 인과관계 개념 사례

다양한 인종적 배경을 가진 사람들이 함께 일하는 기업에서 다수 인종과 소수 인종 사이의 갈등을 완화하기 위해 어떤 환경을 조성하는 것이 더 효과적일까? 이 질문에 답하기 위해 한 연구자가 다양한 인종의 직원을 고용하고 있는 100개 기업을 대상으로 조직 문화와 조직 내 인종 갈등 사이의 상관관계를 살펴보는 연구를 실시하였다. 다양한 지표를 활용하여 이들 기업이 인종적 차이를 드러내는 활동을 어느 정도 수행하고 있는지, 또한 이들 기업이 인종적 차이를 드러내지 않기 위한 활동을 어느 정도 수행하고 있는지 별도로 측정하였다. 아울러 기업별 인종 간 갈등 양상을 파악하기 위해 지난 5년간 인종 간 차이에서 비롯된 갈등 사례 건수를 보여주는 자료를 살펴보았다. 여기서 연구자가 분석한 것은 인종 간 차이를 드러내는 문화와 인종 간 차이를 드러내지 않는 문화가 조직 내 인종 갈등 발생 건수와 어떤 상관관계를 갖고 있는가 하는 문제였다. 분석 결과는 다음과 같다.(이하 생략) (2015 연세대 논술고사)

윌리엄 라보프는 뉴욕 사람들 중 모음 뒤의 [r] 발음을 제대로 하는 사람이 있는가 하면 하지 않는 사람도 있다는 현상에 주목하고, 뉴욕 시민들의 [r] 음과 사회계층 간에는 상관관계가 있을 것이라 가정하여 이를 밝히기 위해 창의적 연구를 설계하였다. 사람들의 사회경제적 계층을 객관화된 방법으로 관찰하기 위하여 백화점을 실험 장소로 선정하였는데, 사람들이 자신의 사회경제적 지위에 어울리는 백화점을 찾을 것이고, 그들을 대하는 직원들이 고객의 계층에 걸맞은 언어를 구사할 것이기 때문에 고객의 언어를 반영할 것이라고 전제하였다.(이하 생략) (2016학년도 한국외국어대 논술고사)

기본소득(basic income, basic income guarantee, citizen's income)은 가계(자산) 조사, 기여금, 노동 요구 등이 없이, 모든 사회 구성원에게 충분한 소득을 보장하는 제도이며, 무조건성, 보편성, 개별성을 그 핵심적 특징으로 한다. 기본소득은 개인의 자산이나 소득에 상관없이 무조건적으로 지급되어 심사 절차가 없기 때문에 복지국가들에서 낭비되는 사회복지 관리비용을 절감할 수 있다. 기본소득은 자본주의 체제에서 노동과 소득 간의 상관관계를 해체한다.(2014 경희대 논술고사)

과학자들은 상관관계를 인과관계와 동일시하지 않도록 훈련받는다. 단순히 X와 Y의 상관관계만을 토대로 그 어떠한 결론도 내려서는 안 된다고 생각한다. 대신 둘 사이를 연결시키는 근본적인 원리를 이해하려고 한다. 그리고 일단 모델이 형성되면 조금 더 확신을 갖고 데이터 군(群)들을 연결시킬 수 있게 된다. 그들에게 모델 없는 데이터는 무의미한 잡음일 뿐이다.

그러나 페타바이트 시대에 엄청난 데이터 앞에서는 '가설→모델→실험'과 같은 과학적인 접근은 구시대의 것이 된다. 페타바이트는 우리로 하여금 상관관계로도 충분하다고 말할 수 있게 해주며 우리는 더 이상 모델을 찾지 않아도 된다. 어떤 결과가 나올 것인가에 대한 가설 없이도 데이터 분석이 가능하다. 시시각각으로 빨라지고 커지고 있는 컴퓨터 클러스터(cluster)에 데이터를 입력시키면 과학이 지금까지 발견하지 못한 패턴을 통계 알고리듬(algorithm)이 발견해낸다.(2011 연세대 논술고사)

2. 논제 해설에 등장하는 상관관계 혹은 인과관계 개념 사례
논술고사 문제들이 자료, 데이터, 변수 사이의 상관관계를 논리적으로 해석하길 요구한다는 것은 각 학교에서 밝히는 해설자료들에서 쉽게 찾아볼 수 있다. 각종 논제 해설자료에서 출제자들은 다음과 같이 말한다.

"모차르트의 재능과 그 아버지의 교육열에 대한 제시문 (다)의 내용은 전기, 교육학, 음악 교과서 등에서 자주 접한 내용이다. 그러나 지문에서는 단순한 재능과 교육으로만 분석하지 않고, 심리적, 가정적, 사회적 요인들과 천부적 재능의 상관관계로 기술하고 있어서 단순하게 지문을 해석한 학생들은 답안 작성에 있어서 어려움이 있었을 것으로 보인다."(2016 연세대)

"통계값 사이의 상관관계를 통하여 사회 현상의 원인과 결과를 밝힐 수 있고, 이러한 상관관계가 다른 사례(지역)에서 발견된다면 상관관계가 일반법칙이라는 점을 증명할 수 있다. → 복지 수당과 실제 생활비의 차이가 존재한다면 복지 수당 수혜자들이 정부를 속일 것이라고 추론하고, 또한 다른 유사한 사례를 통하여 상관관계의 규칙성(일반성)을 증명할 수 있다는 주장은 타당하다."(2016 성균관대 논술가이드북)

"한국외국어대학교 2015학년도 수시모집 논술전형 논술고사 Part 1에서는 "도덕과 거리"를 핵심 논제로 하여 1개의 국문 <자료>와 1개의 영문 <자료>로 [문제]를 구성했다. [문제]는 국문 및 영문 <자료>의 요지를 정확하게 파악하는 능력, 두 <자료>의 상관관계를 적절하게 읽어 <자료 2>에 제시된 입장에 근거하여 <자료 1>의 견해를 비판할 수 있는지의 여부를 평가할 목적으로 구성되었다."

"먼저 표를 만들어 두 지문에서 핵심어, 요지 등을 추출하고 이들 사이의 상관관계를 고민한 뒤, 비교 기준을 정하고 표를 채운 뒤 한 편의 글을 완성하는 방법이다."(2016 건국대 논술 가이드북)
"논술고사의 주제 : 가족 형태의 변화 추이와 이혼율 변화 추이의 상관관계"(2016 동국대)

"이 두 그림간의 관계에 대해 상관관계적 측면에서 그 관계를 이야기 할 수 있음. 그러나 이를 하나가 다른 하나를 완전히 설명하는 인과관계로 이야기하는 경우에는 바람직하지 못한 해석임."(2013 숭실대)

3. 문제 자체가 이 관계에 대한 이해를 묻는 사례
상관관계와 인과관계 개념 자체가 문제의 재료가 되는 경우도 있다. 아래의 문제가 그렇다.

문제 : 아래 <보기>의 상관관계인과관계 개념을 참고하여 [다] 글의 도표 1과 도표 2에 제시된 변수들의 관계를 비교 분석하시오. (501-600자)

<보  기>
두 변수 사이에 한쪽이 증가하면 다른 쪽도 증가(감소)하는 경향이 있을 때, 이 두 변수 사이에 양(음)의 상관관계가 있다고 말한다. 그런데 X가 증가할 때 Y가 증가(또는 감소)하는 상관관계를 보인다고 해서 X를 Y의 원인으로 단정 지어서는 안 된다. X가 Y의 원인일 수도 있고, Y가 X의 원인일 수도 있으며, 어떤 다른 요인이 X와 Y 둘 다의 원인일 수도 있기 때문이다. 상관관계만으로는 추워서 눈이 오는 것인지, 눈이 와서 추운 것인지, 혹은 그 두 가지가 우연히 함께 일어나는 것인지 알 수 없다. (2010학년도 건국대 모의논술고사)

상관관계와 인과관계 정리
이제 이 두 개념을 이용하는 다양한 맥락을 살펴보았으니 이제 효과적 대처방안을 마련해야겠지? 당연히 이 개념들 자체를 정확히 이해하는 것으로부터 출발해야겠지. 그러고 나서 이 둘을 분별하는 게 중요한 과제라 하겠다. 지루하지 않도록 이 둘의 관계를 간단히 도해하면 이렇다.

두 변수 사이에 어떤 연관성이 있을 때 이 둘은 '상관관계가 있다'라고 한다. 그러한 관계들 중 극히 일부의 경우에 한해 인과관계(즉, 하나가 원인이 되어 다른 하나의 결과를 만들어내는)가 성립한다는 것이지. 수학에선, '상관관계(Correlation)란 한 변수가 증가하거나 감소함에 따라 다른 변수가 같은 방향이나 반대 방향으로 증감할 때 두 변수의 관계를 말한다'고 정의한다. 두 변수가 같이 증가하거나 감소하면 양(+)의 상관관계, 두 변수가 반대 방향으로 움직이면 음(-)의 상관관계에 있다고 한다.

인과관계(Causality)란 두 개의 사실이 원인과 결과의 관계에 있을 때를 말한다. 경제학을 포함한 많은 사회과학 분야에서 사회 현상의 인과관계를 규명하기 위해 노력하고, 규명된 관계를 바탕으로 더 나은 사회를 위한 제안을 한다. 요즘은 컴퓨터 발달에 힘입어 인과관계 규명에 데이터를 많이 활용하는데 문제는 데이터 분석에서 밝힐 수 있는 것은 상관관계뿐이라는 것이다.

물론 누군가 '소득이 높으면 행복하다'고 추측한다면 우선 소득과 행복 수준이 양의 상관관계에 있는지 검증해야 하는 것은 맞다. 인과관계에 있는 변수들에 상관관계가 없을 리가 없기 때문이다. 하지만 양의 상관관계를 확인했다고 해서 소득이 높으면 행복하다고 주장할 수 있는 것은 아니다. 

상관관계만으로 인과관계를 유추하는 게 올바르지 않은 예를 살펴보자. 예컨대 인구 10만명당 경찰 수가 많을수록 범죄 건수가 많은 통계가 나온 적이 있다. 이러한 상관관계에서 '경찰이 많으면 범죄가 더 많이 발생한다'고 유추하거나, 더 나아가 '범죄를 줄이려면 경찰 수를 줄여야 한다'고 주장한다면 잘못일 것이다. 오히려 범죄율이 높아서 더 많은 경찰이 그 지역에 배치됐을 것이라고 추측하는 것이 타당하다.

상관관계가 인과관계와 무관한 경우도 종종 있다. 예를 들어 연간 맥주 소비량과 영아 사망률 추이를 보면 음의 상관관계가 나타난다. 하지만 '맥주를 많이 마시면 영아 사망률이 감소한다'거나, '영아 사망률이 감소하면 맥주 소비가 증가한다'고 유추하는 것 모두 타당하지 않다. 이 경우에는 두 가지 현상을 동시에 설명할 수 있는 제3의 원인, 가령 1인당 국민소득의 증가 같은 것을 탐구해야 한다.

그림 2에 소개한 예처럼, 아이스크림 판매율과 살인범죄율이 양의 상관관계를 보인다고 해서 아이스크림 판매고가 높아진 것이 과연 살인범죄율을 높인 것일까? 그렇다면 사실 살인범죄율을 극도로 낮추는 것도 쉬워지긴 하겠다만(아이스크림 제조와 판매를 금하면 될 테니까) 불행히도 이 둘 사이엔 아무런 인과관계도 존재하지 않는다. 연간 평균기온보다 크게 기온이 올라간 결과 아이스크림 판매고도 높아진 것이고, 사람들의 불쾌지수도 높아지고 외부 활동이나 심야 활동 시간이 늘어나게 된 것이 여름철 강력 범죄율이 높아진 배경이란 말이지.

상관성은 단순히 두 요인 사이에 관련이 있음을 나타낼 뿐(이 두 요인을 X와 Y라고 부르기로 하자), 거기서 관계의 방향성까지 파악할 수는 없다. 위의 사례들에선 두 개의 요인 X와 Y가 모두 제3의 요인 Z에 의해 발생한 것일 수도 있기 때문이다. 

섣부른 인과관계 단정의 위험성을 보여주는 러시아 민담을 하나 소개한다. 제정 러시아 당시 시골 지방에서 지독한 전염병이 창궐했다. 민심이 흉흉해지니 당연히 차르 정부는 의사들을 파견했겠지. 당연히 전염병이 극심한 지역일수록 많은 의사들이 파견되었지. 아뿔사 그런데 이 지역 농민들이 무언가를 알아챈 거야. 흰 가운을 입은 의사들이 많은 곳일수록 사람들이 많이 죽는다는 걸 말야. 그래서 전염병으로 죽는 걸 면하기 위해, 그들은 모든 의사들을 죽여버렸다는 거지. 자 이곳의 농민들은 그럼 무사했을까? 물론 아니겠지. 이 농민들이 보여준 판단의 착오를 이른바 '역인과관계(Reverse causation)의 오류'라고 한다. 

인과관계 추론이 중요한 이유는 어떤 문제를 해결하기 위해서는 원인을 알아야 하는 경우가 많기 때문이다. 하지만 복잡한 사회에서 인과관계가 분명한 경우는 흔치 않다. 데이터를 통해 상관관계를 확인하는 것이 도움이 되지만 오히려 엉뚱한 인과관계를 유추할 위험도 없지 않다. 중요한 것은 데이터로 뒷받침되는 것처럼 보이는 인과관계에 대한 다른 사람들의 주장에 쉽게 휘둘리지 않는 것이다. 데이터가 넘쳐나는 시대, 조심하고 분별하는 판단력 역시 더욱 필요한 것이다.

이 달의 미션 
이 주제와 관련된 문제로 연습해 보자. 서강대학교 2016학년도 경제/경영학부 기출문제다. 서강대 논술고사는 시험시간 100분에 문항 수는 2개이고, 각각의 답안 분량은 대략 800~1,000자다. 이 달의 논제는 2개의 논제 중 위에서 소개한 개념들과 관련 있는 논제1을 다룬다. 제한시간을 50분 내외에 완성할 수 있으면 되겠다. 문제와 제시문을 찬찬히 읽고 개요를 간단히 작성한 다음, 분량을 통제하면서 완성해 보자.

우리가 던져야 될 진짜 질문은 다음과 같다. 높은 부채가 낮은 경제성장을 가져오기 때문에 정부가 부채를 줄여야 하는가? 아니면 낮은 경제성장이 부채 부담을 증가시킨 원인인가? 만약 관찰된 상관관계가 후자의 이유를 반영한다면 이 연구결과가 정부정책에 주는 시사점은 매우 작을 것이다.
- 벹시 스티븐슨·저스틴 울퍼스, 『블룸버그』, 2013. 4. 28

상관관계와 인과관계를 다룬 앞의 글을 세심하게 읽고 이해한 학생들이라면 새삼스럽게 해설할 필요가 없을 정도로 쉽게 답이 보였으리라 생각한다. 많은 논술고사 자료를 소개하면서 말했듯이 이 개념들은 학문 탐구 과정에서 꼭 알아두어야 하는 중요한 것이다. 비단 이 문제에서만 다루는 것이 아니니 이 기회를 빌어 상관관계, 인과관계 개념의 모든 것을 완전히 정리할 수 있기를 바란다. 아래의 예시답안이 아마도 예상과 다르지 않았길 바란다(^^).

예시 답안

제시문 [가]에서는 피자를 먹는 것이 암 발생 위험을 낮춘다고 주장하고 있는데, 제시문 [나], [다], [라]는 [가]의 주장과 달리 피자 섭취와 암 발생 간에 인과관계가 존재하지 않을 수 있는 이유들을 제시한다.

제시문 [나]는 온실가스 배출량이 증가하면서 기온이 상승하고 있다고 해서, 온실가스 배출이 지구 온난화를 야기한다고 결론 내릴 수는 없으며, 지구 온난화는 복잡한 자연 현상의 결과라고 설명한다. [나]의 관점에서 [가]는 단순히 높은 상관관계를 보이는 두 현상을 직접적인 원인과 결과로 상정하는 오류를 범하고 있다. 즉 피자를 먹는 빈도가 암의 발생률을 결정하는 것이 아니며, 예를 들어 피자의 인기가 높은 시기에 의학의 발달로 인해 암 발생이 감소하였을 수도 있다는 것이다.

제시문 [다]는 제 3의 변수의 존재 가능성에 대해 이야기하고 있다. 담배를 많이 피우는 학생이 낮은 성적을 얻는다는 조사 결과에는 담배와 성적 외에도 성격 등의 변인이 개입했을 수 있다. 성격은 성적에도, 담배를 피우는 정도에도 영향을 줄 수 있기 때문에 흡연이 성적불량의 직접적인 원인이 아닐 수도 있다. 마찬가지로 [가]에서 암의 발생과 식습관에 동시에 영향을 미치는 제 3의 요소가 존재할 수 있다는 것이다. 예를 들어 운동을 좋아하는 사람이 피자도 좋아하고, 암에 걸릴 확률도 낮을 수 있는 것이다.

한편 제시문 [라]는 원인과 결과의 반전 가능성에 대해 설명하고 있다. 그래프에서 나타난 정부 부채와 GDP성장률 간의 음의 상관관계에 기초하여 정부 부채가 높으면 경제성장률이 낮아진다고 결론을 내릴 수도 있지만, 반대로 경제성장률이 낮아서 부채가 높아졌다는 결론을 내릴 수도 있다는 것이다. 즉 [가]에서도 피자를 먹어서 암이 예방된 것이 아니라, 암 발생 확률이 낮은 건강한 사람이 피자를 많이 먹었을 수도 있다는 것이다. 위와 같은 [나], [다], [라]의 논거에 기초하여 볼 때, 암 발생 위험을 낮추기 위해 피자를 먹겠다는 결정은 타당하지 않을 수 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.