8월 20일자 이코노미스트 기사를 소개합니다. 링크 머신러닝의 발전으로 인해 데이터를 이용한 보다 정확한 예측이 가능해진 지금, 여러 분야에 데이터 기반 예측이 활약 하고 있는데요. 행정, 사법 영역 등도 예외가 아니라고 하네요. 기사에서 데이터 기반 분석과 예측을 토대로 시행되고 있는 정책 몇 가지를 소개하고 있습니다.
시카고 보건국은 피검사 결과에서 납 수치가 높은 아동의 가정을 찾아가 납 페인트를 세척해주는 일을 하고 있습니다. 또, 마이크로소프트는 인도의 안드라프라데쉬 주정부와 함께 날씨 데이터 등 복합적인 배경지식을 통해 종자별로 파종하기 가장 알맞은 시기를 예측해서 생산량을 높이고 있습니다.
그러나 기사는 데이터 기반 예측이 항상 이렇게 똑 떨어지는 결과만 줄 수는 없다고 합니다. 사안에 따라 몹시 달라질 수 있습니다. 예를 들어 현재 많은 미국의 판사들이 참고하고 있는 위험 평가(risk assessment)는 소프트웨어가 해당 개인의 재범율을 계산해서 보여주는 방식인데, 얼마 전 미국의 탐사보도 전문 매체인 프로퍼블리카(ProPublica)에서 플로리다주의 브로워드 카운티의 데이터를 조사한 결과 이 평가가 흑인을 백인보다 두 배 더 재범 가능성으로 지적한다는 것을 발견, 보도기사를 냈습니다. 데이터를 분석한다는 것은 이제까지 인간이 누적해온 결과를 바탕으로 한다는 것과 같아서, 여태 인간들이 편견을 가지고 행해온 일상이 아웃풋으로 그대로 드러난다는 사실을 보여줍니다.
이렇기 때문에 데이터 기반 예측을 어떤 기준으로 하고 있는지, 알고리즘이 어떤 원리로 움직이는지 ‘투명성’이 굉장히 중요한 이슈입니다. 그러나 해당 알고리즘이나 기술을 개발하고 있는 영리 회사들은 이를 원천기술이라며 공개하기 대단히 꺼리는 상황입니다. 기사는 정부가 머신러닝 데이터 기반 예측을 점점 더 정책 반영에 받아들이고 있음에 따라 새로운 기술과 인간의 지혜를 어떻게 조화시키는지가 관건이라는 말로 끝을 맺습니다.
기술의 발전이 사회를 움직이는 중요한 결정에도 영향을 미치는 시대입니다. 이럴 때일 수록 투명성에 대한 논의도 함께 이루어져야 파워가 쏠리는 것을 막고 올바른 민주주의를 이룰 수 있지 않을까요?
코멘트를 달아주세요!