초 가공 정보 시대: 수치적 해석에서 편익 분석, 그리고 악마화까지
두 농부가 새벽부터 각자의 밭을 갈고 있었다. 정오 무렵, 그들은 허리를 피고 숨을 고르며 자신의 밭을 바라보았다. 둘 다 같은 크기의 밭을 절반씩 갈았지만 반응은 극과 극이었다. 한 사람은 아직도 일거리가 반이나 남았다며 한탄하다가 포기했고, 다른 한 사람은 이제 반 밖에 안 남았다며 순식간에 마무리하였다.
이 이야기가 전달하는 것은 무엇일까? 일반적으로는 긍정적인 사고방식을 권장하는 이야기로 보이지만 한편으로는, 동일한 것을 보고도 보는 사람에 따라 다르게 해석할 수 있다는 이야기가 담겨 있다. 하물며, 직접 보지도 않고 말을 건너 들은 사람들은 어떨까? 한탄하던 농부의 이야기만 들으면 밭이 크게 느껴지고, 반대쪽은 밭이 작게 느껴지지 않을까? 이렇듯, 우리 삶의 사건들은 이야기로 전달되며 실재와 멀어진다. 그러다 보면, 서로 다른 실재를 보는 상태에서 논의가 이뤄지고 오해가 생길 수 있다. 그렇다면 우선 어떤 문제를 평가하기 전에, 실재를 바라봐야 하지 않을까?
숫자는 어떤 대상을 설명하는 객관적인 방법 중 하나다. 주관적인 해석과 서술은 서술자의 관점에 의한 과장이나 축소 및 왜곡이 일어나지만, 숫자는 그 수치를 명시함으로써 이런 문제를 최소화할 수 있다. 하지만 숫자를 보는 건 지겹고 따분한 작업이다. 우리 삶과 밀접한 경제 정책, 일자리, 출산율, 환경 등의 문제들은 농부의 밭처럼 단순하지 않고 복합적인 수치들이 뒤섞여 있다.
반면 오늘날에 사람들은 과거보다 더 많은 정보를 더 빠르게 소비하며, 날 것의 수치보다는 한 눈에 파악할 수 있도록 요약된 정보를 선호하는 것 같다. (3줄 요약이라는 신조어가 이런 현상을 가장 잘 보여주는 거 아닐까) 현대의 정보 소비는 해석이나 주관적 분석보다 한 단계 더 요약된 정보를 선호한다. 껄끄러운 근거나 수치 분석을 잘라내며 더 빠르게 소비 가능해진다. 대신, 뒷받침 근거로서 일반적이고 단순한 원인을 제시하거나, 감정에 호소하고 상대를 악마화 하며 권위에 기대는 비논리적 전략에 의존한다. 수치적 해석이 사랑받던 시대는 없었을 거라 생각하지만 현대 사회는 해석에 기반하여 시민 간에 논의와 타협을 이루는 시대로 보이지도 않는다. (나 같이 어리석은 시민이 모르는 영역에서 열심히 노력하는 분에게 실례되는 말일지도 모르지만, 내가 보기에 정치인과 언론은 시민 단체보다도 커뮤니티와 유튜브의 눈치를 더 보는 것 같다) 우리 시대는 한 차례 더 가공된 초 가공 정보의 시대이며, 수치적 해석과 분석 대신 천사와 악마의 대립으로 세상을 이해하거나 모든 게 헛되다는 냉소주의의 시대이다. 상대의 관점 및 맥락을 이해하기 보단 편향적인 그룹 속에서 상대가 바보 같고 부패했으며 멍청하다는 이야기가 맴돈다. 공공의제 없는 공공 논쟁, 실재 없는 상호 비판, 상대를 악마화 하는 논쟁이 더 큰 목소리를 가지는 시대다.
수치와 반박가능한 분석으로 돌아가야 한다.
초 가공 정보 시대에서 시민 간의 상호 이해와 합리적 논의를 회복하기 위해서는 서로가 소통할 수 있는 관계를 회복할 수 있어야 한다. 이를 위해서는 서로가 동의할 만한 공통적인 논의 토대가 필요할 것이다. 나는 그것이 수치와 최소한의 분석이라고 생각한다. (순수한 수치는 전문가가 아닌 이상, 그 의미를 제대로 해석할 수 없다. 예컨대, 1인당 GDP나 영유아 사망률을 보며 그 수치가 무엇을 의미하는지는 그 분야에 많은 시간을 투자한 사람이 아니라면 그것이 큰 지 작은 지, 어떤 인과관계가 있는지 판단하기 어렵다. 특히 나 같은 비전문가는 어떤 현상을 상관관계가 있어 보이는 다른 현상과 인과관계로 단정짓는 오류를 자주 범하곤 한다. 하지만 전문가를 빙자한 권위적 주장을 막기 위해서 최소한의 분석이란, 수치가 해석으로 도약하는 과정을 드러냄으로써 반박가능성에 관대해야 한다) 이 책은 수치적 논의 및 최소한의 분석을 위한 안내서이다. 논제에 대해 수치적인 지표를 설정하고 양자를 비교하는 분석으로서 해석을 도출한다.
수치는 그 자체로 무엇을 말하지 못한다: 비교 분석의 필요성
수치는 인간에게 익숙한 인식 방식이 아니다. 자연어에서는 대개 대상을 서술어(크다, 작다, 빠르다, 느리다, 적합하다)로서 묘사하지, 수치적으로 묘사하지 않는다. 더구나 통계의 특성 상, 수치의 규모가 일상적인 범주를 넘어간다면? 몇 십 킬로그램이 아니라 몇 백 톤 단위의 수치를 다룰 때 그 규모를 직감할 수 있을까? 하물며, 익숙한 부피나 크기가 아니라 에너지 단위(줄, J)처럼 일상적으로 사용하지 않는 단위를 어떻게 가늠할 수 있을까?
수치는 그 자체로 객관적이지만, 의미 있는 명제를 도출하진 않으므로 수치를 해석하기 위한 작업이 필요하다. 이를 위해서는 수치 간 비교 작업이 필요하다. 예컨대, 나이지리아의 1년 에너지 소비량이 35기가 줄이라는 것 자체는 그것이 얼마나 작은 지 혹은 큰 지 가늠하기 어렵다. 하지만, 일본과 프랑스가 155 기가 줄에 달한다는 걸 알면, 양 측의 에너지 사용량 차이가 5배에 달한다는 것으로, 에너지 소비 격차가 얼마나 큰 지 가늠할 수 있다. 비교를 통해 각 수치를 해석할 때는 그 차이의 정도가 유의미한 지 고려해야 한다. 그렇지 않으면 아주 미세한 수준의 차이를 과장하거나 유의미한 차이를 무시하는 오류를 범할 수 있다. 이를 위해서는 여러 표본 집단 간의 비교가 필요하다. 예컨대, 책 내용 중에서는 행복 지수에 관한 각 나라의 점수에 대해 다룬다. 유엔 지속가능개발에서 매년 발간하는 세계 행복 보고서에 따르면, 1위에서 19위까지는 주로 북유럽과 아이슬란드, 스위스 등 안정된 유럽 국가들이 오는 반면 미국은 20위에 머무르는데, 언론에서는 이런 통계를 바탕으로 행복이 돈이 전부가 아니며, 소득 불균형, 정치 안정, 사회 치안 등의 복합적 요인이 중요하다는 근거로 사용하곤 한다. 하지만, 1위와 미국의 점수 차이가 1점도 나지 않다는 점은 자주 간과된다. 1등과 최하위 150등의 차이도 6점이니, 0.9~0.8점도 무의미하다고 하긴 어려우나, 행복 지수의 계산 방식 자체가 본인의 자유, 사회적 안정, 관용에 대한 주관적인 인식 수준을 담고 있으므로 상당한 불확실성이 있기 때문에, 작은 점수의 차이로 비교군 간에 극명한 행복 차이가 있다고 단정짓기는 어렵다. 이처럼 수치적 해석은 차이의 의미가 어느정도 인지 고려하는 작업에 따라 그 의미가 크게 달라질 수 있다.
어떤 것을 비교할 것인가: 지표 선정의 문제
비교 란, 계량 가능한 지표를 선정하여 질적으로 다른 두 개체를 동일 선상에서 비교한다. 이는 필연적으로 다루지 못한 질적 차이를 만든다. 예컨대, 마트에서 파는 공장식 생산 식빵과 빵집에서 파는 식빵 간에 탄수화물 및 단백질 차이는 유의미하지 않을 수 있다. 하지만, 그것이 양 비교군을 동일 취급하기에는 부적합한, 질적인 차이가 존재할 수 있다. 질적 차이가 심하면 논제의 근거로서 설득력이 떨어진다. 따라서, 복수의 상호 보완적인 지표를 선정해야 한다. 이 지표는 공공 의제의 관계자들이 동의할만한 합리적인 근거가 있어야 한다. 중간 정리를 하자면, 지표 선정과 수치, 비교 분석 및 해석의 논의 구조는 이런 식이다.
- 비수치적 논의: 이 수치는 A다(좋다. 나쁘다. 합리적이다. 야만적이다) => 이 명제는 가치적 평가이므로 참, 거짓을 명백히 주장하거나 반론할 수 없다.
- 수치 비교적 방식: 비교 가능한 지표 X를 선정하여 수치를 집계한다. 수치를 토대로, 표본 간의 차이를 구한다. 그리고 이 차이 값은 다른 표본 비교 값과 비교를 통해 얼마나 큰 지 혹은 작은 지 가늠한다. 이를 통해 수치에 대한 해석을 도출한다.
=> 지표 X가 양 표본을 충분히 대표할 수 있는지 반박하거나, 비교 분석의 과정, 혹은 해석에 대해 참 거짓의 반박 가능성을 열어둔다.
지표의 선정은 선정 측의 주관적 관점이 가미될 수밖에 없다. 따라서, 소통 가능한 논의를 위해서는 지표 선정의 근거를 명시하여 반론의 여지를 열어 두어야 한다. 예컨대 좋은 삶이란 무엇인가에 대해 지표를 선정한다면, 전통적인 경제학은 삶의 질에 영향을 주는 주요 요인으로 생산력을 지표 삼으며 GDP나 가처분 소득을 고려한다. 하지만, 이런 지표만으로 삶의 질을 평가할 수 없다는 입장은 유엔개발계획의 인간개발지수를 사용한다. 이 지수는 1인당 GDP에 교육과 기대 수명을 추가한다. 저자는 인간개발지수가 경제력 중심의 기존 GDP 평가보다 삶의 복합적인 측면을 담아내기 유용하지만 의료 및 사회 인프라 접근성을 평가할 수 없다며 유아 사망률을 보완적인 지표로 추가한다. 유아 사망률은 한 사람이 의료 인프라의 접근성. 종합적으로 건강한 영양 공급 가능성을 알 수 있기 때문이다. 하지만, 이런 선정은 입장에 따라 반박할 수도 있다. 예컨대, 미국의 높은 유아 사망율을 높은 이민률로 인해 사회 인프라 이용에 대한 정보 접근성 부족으로 해석할 수도 있기 때문이다. 그래서 저자는 다시 이를, 미국과 서유럽은 비슷하게 높은 이민률에도 불구. 유아 사망률 차이가 크다는 점으로 반박한다.
이처럼 지표는 공공의제의 논의 및 연구자들이 보편적으로 동의할 수 있는 공통분모로 축소할수록 안정적이지만 아쉬운 해석이 된다. 반면, 많은 보완적 지표나 가산점 산정 방식을 고려할수록 이견이 엇갈리고 비교는 어려워진다. 주제 선정 자체가 추상적일수록 지표 선정은 더욱 어려워진다. 삶의 질이나 행복은 객관적인 수치로 측정하기 어려운, 응답자의 주관적 판단이 가미될 수밖에 없기 때문이다. 객관적인 수치로서 소득, 범죄율, 기대수명, 교육 수준도 가중치에 대해 의견이 갈릴 것이다.
계량화의 불확정성
지표 선정에 이견이 없더라도 수치를 산정하는 것은 어려울 수 있다. 어떤 지표는 측정 범위가 불명확하다. 예컨대, 실업률을 측정할 때 실업자는 어디까지 인가? 당장에 직업을 잃은 사람들은 물론 포함되겠지만 몇 개월 간, 혹은 몇 년간 공부 중인 취업 준비생도 실업자로 볼 것인가? 생활비를 위해 파트 타임 근무나 단기 알바를 하는 사람은 취업자로 볼 것인가?
집계 범위에 따라서 때로는 예상치도 못한 실업률이 나오기도 한다. 예컨대, 2024년의 한경 뉴스에서는 한 해 경제 활동에 대한 통계 조사 결과 ‘그냥 쉬었다’ 라는 응답이 237만 명인데, 실업률은 역대 최저 수준인 2.9%이 나온 모순에 대해 다루었다. 이 경우, 실업률에서 장기 취업 준비생과 파트 타임 및 단기 알바 근로자들이 제외되며 발생한 현상이었다.
(관련 뉴스 https://www.hankyung.com/article/2024071549751)
계량화 과정에서 주관적 인식이 들어가는 경우도 있다. 유엔 지속가능개발의 세계 행복 보고서는 매 년 각국 국민들이 느끼는 행복을 점수로 매겨서 발표하는데, 이 점수는 응답자가 느끼는 문화적 관용, 정치적 자유, 사회적 안정성 등이 반영된다. 따라서 완전히 객관적인 점수라 하기에는 불완전하다. 통계 조사 자체가 온전히 데이터를 수집하지 못할 수도 있다. 질병의 치사율에 대한 통계는 감염자 대비 사망자의 비율로 이뤄지는데, 사망자는 사망 여부로 명확히 집계가 되지만 감염자는 병원에서의 공식적인 감염진단자 외에도 무증상자, 병원에 오지 않은 사람들까지 고려하여야 한다.
수치로부터 어떻게 해석을 도출하는가: 상관관계와 인과관계
사건이 일어나면 사람들은 그 원인에 관심을 둔다. 그것은 상식에 의한 연역적 추론일 수도 있고 각자의 가치관을 반영하기도 한다. 많은 설명들이 어떤 원인이 앞서 존재했다는 것 만으로 사건이 발생했고 두 사건 간에 인과 관계가 있다고 말하지만 과연 그럴까? 어쩌면 인과 관계와 상관 관계를 헷갈린 것일 수도 있다.
상관 관계 란, 두 요인 간에 한 쪽이 상승하면 다른 쪽도 함께 변하는 관계를 의미한다. 통상적으로 이러한 공변성은 두 요인 간에 어떤 관계가 있다는 근거, 나아가 원인과 결과라는 근거로 사용되곤 한다. 하지만, 공변성만으로는 인과 관계가 성립할 수 없다. 아래 같은 경우 때문이다.
- 우연의 일치인 경우
- 제3의 원인에 의해 둘 다 영향을 받은 결과인 경우
- 서로가 서로의 원인인 동시에 결과인 경우
- 원인과 결과의 관계가 반대인 경우
따라서, 인과 관계를 증명하기 위해서는 다른 변인들을 배제하는 실험이나 여러 통계 자료 간의 비교를 통해 점진적으로 결론의 근거를 쌓아야 한다.
사회 현상의 인과관계를 증명하기 위해 책에서는 주로 두 가지 통계적 방식으로 서술한다. 하나는 동일한 결과를 야기한 표본 집단에서 원인이 될만한 요소를 비교하는 것이다. 다른 하나는 행복에 영향을 줄만한 요소가 유사한 국가들 간에 행복도 점수를 비교하는 것이다. 이런 분석은 통념에 위배되는 것들이 적지 않다. 통념상, 행복을 향상시키는 주 요인은 소득, 교육 수준, 사회적 안정성, 안정적 정치 시스템으로 알려져 있지만, 유엔 지속가능개발의 세계 행복 보고서를 살펴보면, 살인과 강도 및 범죄, 마약, 치안 문제가 극심한 멕시코가 프랑스보다 높은 행복 점수가 나오거나, 대부분의 개발도상국은 하위권에 포진함에도 몇몇은 일본이나 이탈리아보다 높은 행복도 점수를 받는 경우가 있다.
통계는 때때로 통념의 지나친 일반화로 인해 고려되지 못하던 부분을 보완하기도 한다. 실업률은 삶의 질과 긍정적 상관관계가 있다고 여겨진다. 하지만, 체코처럼 실업률이 낮아도 행복도나 자살율이 높은 경우가 존재하는 반면, 스페인처럼 실업률이 높아도 사회 치안과 행복도가 비례하여 떨어지지는 않는 케이스도 있다. 생각해보면, 취직을 하더라도 입에 풀칠 하기 위해 꿈과 미래를 포기하는 경우도 있을 것이고, 실업 상태라도 미래를 위해 즐거운 마음으로 공부하는 경우도 있을 것이다. 이처럼 세상은 나의 상식이나 가치관, 관념으로 살펴보지 못하는 다양한 맥락들이 존재한다. 속단하는 것은 마음은 편할지라도 실재와는 멀어지기 십상이다.
수치로 보는 혁신의 한계: 화석 연료의 대체 불가능성, 효율성의 한계
책에서 수치로 다루는 공공의제 중 통념과 가장 위배되는 것을 고르라면, 혁신, 특히 에너지와 산업 분야에서의 혁신일 것이다. 나에게 혁신은 긍정적 이미지로만 기억되는 편이어서 그것이 실재로 어느 정도의 위치에 있는지는 잘 알지 못했다. 하지만, 수치로 보는 혁신은 내 상식과 달랐다.
오늘날 최첨단 3차 산업들이 빠르게 떠오르고 제조업의 비중이 점차 줄어들고 있다는 건 흔히 알려진 사실이다. 통계적으로 제조업이 세계 경제에서 차지하는 비중은 점차 줄어들고, 페이스북 등의 IT 기업이 토요타 등의 전통 제조업 기업에 비해 주식 가격은 훨씬 더 커지고 있다. 하지만, 토요타가 페이스북에 비해 9배 가량 더 많은 일자리를 배출한다는 점은 잘 알려져 있지 않다.
현대 문명에 대한 저널리즘의 관심은 빠르게 발전하는 산업에 관심이 많지만, 아직 현대 문명은 화석 에너지, 화학 비료, 철강에 의존하고 있고 이들을 대체하기 어렵다. 특히 신재생 에너지의 발전은 그 이미지에 비해 근본적인 한계를 단기간에 극복하기는 어려워 보인다. 혁신적인 에너지는 기존의 화석 에너지를 대체하여 이들의 문제를 근절한 미래로 데려다 줄 것처럼 보였지만 그렇지 않았다. 무역에서 주요 운송 장비인 대형 화물선은 아직 디젤 연료만큼 효율적인 에너지를 찾지 못했다. 비록 전기 배터리를 이용한 화물선 연구가 진행 중이고 실제 운행 실험을 한 경력도 있지만, 이 실험에서 운송한 화물과 이동 거리는 실제 화물선의 그것과 비교하기 민망한 수준이다.
태양열 에너지나 풍력 발전은 차세대 에너지로 언급되지만 계절에 따라 발전량의 변동이 너무 커서 막대한 공공 전력을 안정적으로 감당하기에는 한계가 있다. 이들이 발전하더라도 건설 과정에 들어가는 막대한 철강과 운송 비용은 아직 화석 에너지에 의존해야만 한다. 혁신은 이미지에 비해 그 수치는 그렇게 혁신적이지 못했다.
결론
공공의제를 논하면서 상식에 많은 의존을 했었고, 무언가를 신중하게 조사하여 결론을 내린 적은 드물었다. 미디어와 커뮤니티에서 보이는 공공 논의는 각자가 서로 다른 의견을 말할 때 의견 차이에 대해 의문을 가지고 분석하기 보단 각자 의견에 부합하는 목소리로 편향되는 것 같았다. 하지만, 상식이라는 것이 어린 과거 시절 교과서를 통해 배우거나 관습적으로 믿어왔던 것들, 주관적 가치관이 가미된 것이라는 점을 고려하면 이런 편향과 의존이 실재와 괴리된 논의를 만들어 나와 다른 목소리를 이해하지 못하게 만든 것 아닐까?
다른 목소리 간에 합의를 위해서는 친숙한 이미지나 수식어를 보류하고 상대의 의견과 충돌하는 지점을 찾아야 한다. 그 지점으로서 수치 분석은 상호가 동의할 수 있는 중요한 부분이다. 이 글에서는 통계적 분석 흐름에 관심을 두고 이야기했지만 책 내용 대부분은 광범위한 공공문제를 쉽게 다루는 덕분에 지루하지 않았다. 그러니 통계에 대한 부담감 대신, 세계를 수치로서 보는 이야기 자체를 가볍게 즐기는 것 만으로도 가치가 있는 책이고, 간간히 통념을 흔드는 재미있는 사실을 접할 수도 있다.
'책, 서평, 요약 > 사회과학' 카테고리의 다른 글
<현대사회학> 앤서니 기든스 #9(세계화와 사회변동) (0) | 2023.01.31 |
---|---|
<현대사회학> 앤서니 기든스 #8(현대사회학 이론) (0) | 2023.01.11 |
<현대사회학> 앤서니 기든스 #7(기능주의, 갈등이론, 상징적 상호작용이론) (0) | 2023.01.11 |
<현대사회학> 앤서니 기든스 #6(사회학 이론의 배경, 뒤르켐, 마르크스, 막스 베버) (0) | 2023.01.11 |
<현대사회학> 앤서니 기든스 #5(사회학의 연구조사방법) (0) | 2023.01.10 |