뉴스

빅데이터 시대, 누구나 알아야 할 데이터 리터러시
글쓴이 관리자 작성일 2018-02-14 11:02 조회수 1,578
원본사진보기

데이터 리터러시는 데이터를 목적에 맞게 활용하는 데이터 해석 능력을 말합니다. 여기서 이야기하는 데이터의 범위는 고도의 처리 기술을 요하는 빅데이터뿐만 아니라, 단순 수치나 통계자료도 포함합니다. 따라서 데이터 리터러시는 데이터와 관련된 일을 하는 전문 영역의 사람들에게만 필요한 것이 아니라 데이터 활용이 증가하고 있는 이 시대 우리 모두에게 요구되는 역량이라고 할 수 있습니다.

‘데이터 리터러시 하위 역량,’ 동아비즈니스리뷰, 228호 (2017.07)

데이터 리터러시는 데이터를 기술적으로 다루는 것에서부터 데이터에 숨겨진 의미 있는 인사이트를 도출해 내는 등 데이터 활용 과정 전반에 필요로 하는 역량을 의미합니다. 이를 크게 5가지로 나눠 이야기할 수 있습니다. ① 데이터 수집 역량은 필요한 데이터를 빠른 시간 내에 검색, 선별해 확보할 수 있는 능력입니다. ② 데이터 관리 역량은 데이터를 분석이 가능한 형태로 구조화, 정제하는 것을 말합니다. ③ 데이터 가공 및 분석 역량은 데이터를 목적에 맞는 분석 방법을 사용해 의미 있는 결과를 도출하는 능력이며, ④ 데이터 시각화 역량은 데이터를 다른 사람이 이해할 수 있도록 그래프, 차트 등의 시각화 형태로 표현하는 것입니다. ⑤ 데이터 기획 역량은 전반적인 데이터 간의 관계를 이해하고 데이터 활용을 위한 계획을 세우는 능력입니다.

이 중 데이터 수집, 관리, 분석 등 기술적인 역량이 요구되는 부분에 대해서는 이미 많은 분들이 인지하고 계시리라 생각됩니다. 반면, 데이터 기획과 같이 데이터 활용 계획을 세우고 의미를 발굴해 낼 줄 아는 역량에 대해서는 다소 이해가 부족하지 않나 싶습니다. 데이터 활용에 있어서도 어떤 툴을 얼마나 잘 다루느냐의 문제보다도 데이터로 문제를 바라보고, 데이터에서 의미 맥락을 발견할 줄 아는 관점과 능력이 중요함을 강조하고 싶습니다. 

2. 일상생활 속 데이터 리터러시


그렇다면 우리는 어디에서 데이터 리터러시를 경험할 수 있을까요? 데이터 리터러시 역량을 기르고 발휘할 수 있는 경우는 언제일까요? 데이터 리터러시의 여러 하위 역량 중에서도 ‘데이터에서 의미를 읽어내는’ 역량에 대해서 이야기해보고자 합니다. 

(1) 통계 데이터를 접할 때 필요한 통계 리터러시


우리는 일상에서 통계 자료가 인용된 뉴스 기사나 보고서를 통해 데이터를 자주 접합니다. 수치를 근거로 말하면 보다 객관적이고 신뢰를 줄 수 있어 데이터는 자주 인용됩니다. 다만 이 과정에서 우리가 유의해야 할 점은 데이터 해석시 데이터의 측정 배경, 방법, 기준 등을 고려해야 한다는 것입니다. 우리가 접하고 있는 통계 데이터는 그 자체로 사실을 의미하는 것이 아니라, 어떤 현상을 반영하고 이해할 수 있도록 도와주는 자료일 뿐이기 때문입니다.

‘데이터 리터러시 하위 역량,’ 동아비즈니스리뷰, 228호 (2017.07)

단편적인 예로 우리나라 실업률을 이야기할 수 있습니다. 이것은 정부의 실업률 발표에 대해 '현실적이지 않다'는 사람들의 의견이 제기되는 것과도 연관이 있습니다. 통계청이 밝힌 2017년 12월 기준 우리나라의 실업률은 3.3%이지만 고용보조지표 3(체감 실업률과 가장 가까운 지표)는 10.9%입니다. 이렇게 두 지표의 수치가 3배 정도 차이나는 이유는 지표별 측정 기준이 다르기 때문입니다.

정부에서 공표하는 실업률은 경제활동 인구 중 실업자의 비율로 측정합니다. 여기서 실업자는 ‘조사대상 주간에 수입 있는 일을 하지 않았고, 지난 4주간 일자리를 찾아 적극적으로 구직활동을 하였던 사람'입니다. 즉, 수입이 있거나 구직 활동을 안 하면 실업률 계산에서 제외됩니다. 예를 들어 보겠습니다. 취업 준비생이 용돈벌이로 아르바이트를 해 수입이 있을 경우 취업자(시간 관련 추가 취업 가능자)로 분류됩니다. 또한 고시생과 같이 취업을 위해 공부를 하는 사람은 구직활동을 포기한 사람으로 간주되어 비경제활동인구(잠재 경제활동인구)로 집계됩니다.

반면, 체감 실업률이라고 알려져 있는 고용보조지표 3은 위와 같은 실업률의 측정 한계를 보완합니다. 고용보조지표 3은 경제활동인구와 잠재 경제활동 인구 중에서 실업자, 시간 관련 추가 취업 가능자, 잠재 경제활동인구 (위 이미지상 주황색 음영된 부분)의 비율로 계산합니다.



우리는 데이터에서 의미를 찾아내기 이전에 그 지표에 한계가 있는 것은 아닌지, 자신이 그 개념을 정확히 이해하고 있는지 생각해봐야 합니다. 숫자로 된 데이터가 제시됐다고 해서 무조건 신뢰할 만한 자료라고 생각하지 않아야 하며, 데이터도 비판적으로 바라볼 줄 알아야 합니다. (이를 통계 데이터에 대한 이해가 필요하다는 맥락에서 통계 리터러시라고 이야기하기도 합니다.) 비판적인 관점으로 지표를 정확히 이해할 때 데이터에서 유의미한 인사이트를 정확히 도출해 낼 수 있습니다. 

(2) 시각화 자료를 볼 때 필요한 시각화 리터러시


데이터 시각화는 방대한 양의 데이터를 한눈에 보고 데이터의 의미를 이해하는데 효과적인 방법입니다. 많은 분들이 데이터 분석 결과를 다른 사람에게 효과적으로 전달하기 위해 시각화 자료를 제작합니다. 이때 작성자는 자신의 의도에 따라 시각화 유형을 선택하고 활용합니다. 의도에 따라 데이터 시각화 자료를 만들 수 있다는 것을 장점으로 볼 수 있는데, 이 경우에도 비판적으로 시각화 자료를 볼 줄 알아야 합니다. 그 이유는 동일한 데이터라도 어떻게 시각화하느냐에 따라서 사람들이 다르게 받아들일 수 있기 때문입니다.


JTBC 뉴스룸 사례로 자세히 알아보도록 하겠습니다. JTBC 뉴스룸은 김영란법 국회 통과와 대선 후보 지지도의 데이터를 시각화하는 과정에서 오류를 범했는데요. 김영란법 국회 통과에 대한 반응을 시각화한 도넛 차트에서 도넛 조각별 수치와 조각의 크기를 상이하게 보도했습니다. 왼쪽의 도넛 차트를 보면 3가지 응답에 대한 수치는 상이하지만 모두 비슷한 크기로 표현된 것을 알 수 있습니다. 오른쪽에 있는 도넛 차트와 비교해 보았을 때 ‘잘못했다’의 비율이 과장된 것을 확인할 수 있습니다. 이와 유사하게 대선 후보 지지도의 막대그래프에서도 수치와 막대의 길이가 상이한 것을 확인할 수 있습니다. 문재인 후보의 지지도를 나타내는 막대에 비해 안희정 후보의 막대가 길게 시각화돼 두 후보 간의 지지도가 큰 차이가 없는 것으로 보입니다.

데이터를 시각화하는 것은 분명 시각적으로 데이터의 의미를 명확히 전달한다는 차원에서 장점을 가지고 있지만, 어떤 형태로 시각화하느냐에 따라서 정보 전달 효과에는 차이가 있을 수 있습니다. 위 사례처럼 데이터의 의미가 왜곡돼 전달될 경우 오해의 소지를 만들 수 있고, 특히 데이터가 의사결정의 수단으로 활용됐다면 잘못된 의사결정에 따른 피해를 보게 됩니다. (이런 이유로 JTBC 뉴스룸의 손석희 앵커는 그래프 오류를 정정하고 “치명적 실수”라며 사과했습니다.) 따라서 우리는 시각화 자료를 바탕으로 데이터를 읽을 때에도 비판적으로 볼 줄 알아야 합니다. (이를 위해 시각화 자료에 의해 데이터가 왜곡되는 9가지 사례와 같이 시각적 리터러시를 배울 수 있는 글이 도움이 되리라 생각합니다.) 

o o o o o o


빅데이터 시대에 데이터 활용 가능성이 커지면서 데이터 리터러시는 누구에게나 필요한 역량으로 자리 잡고 있습니다. 데이터 리터러시는 좁은 의미에서 개인이 통계적 수치를 비판적으로 읽는 역량이며, 넓은 의미로는 정부, 기업 차원에서 데이터를 활용해 효과적으로 문제를 해결하는 역량이기도 합니다. 최근 이에 대한 관심이 늘어나면서 데이터 리터러시 교육도 등장하고 있습니다. 미국 일간지 <뉴욕타임스>는 ‘그래프는 무엇을 말하고 있을까?(What’s Going On In This Graph?)란 이름으로 학생들이 그래프를 읽고 숨겨진 인사이트를 스스로 발견할 수 있도록 도와주는 교육 콘텐츠를 발행하고 있습니다. 저희 뉴스젤리도 ‘데이터 기반의 문제 해결 워크숍’ 교육을 진행하고 있지요!

데이터 리터러시에 대한 이번 글을 읽으시면서 여러분은 어떤 생각을 하셨나요? 이 개념에 대해 익숙했던 분들도 이번 기회를 통해 데이터 리터러시가 기본 역량으로 요구되는 시대적 배경과 이를 실질적으로 경험하는 것에 대해 고민해 볼 수 있는 기회가 됐으면 좋겠습니다.

파일 0000021544_004_20180211102414547.png(36.7K)


[NES 2018] 지능형 위협 범람, 사이버보안 ‘AI’로 패러다임 바뀐다
[NES 2018] 지능형 위협 범람, 사이버보안 ‘AI’로 패러다임 바…
[디지털데일리 최민지기자] 지능형 위협이 범람하고 있다. 고도화된 공격을 넘어 사이버범죄자들은 인공지능 등을 접목한 새로운 공격 양상을 사용할 것으로 예고되고 있다. 창과 방패의 싸움에서 보안도 새로운 신무기인 인공지능을 장착해 공격자들에게 맞설 태세에 돌입하고 있다. 보안의 패러다임 변화가 시작된 것이다. 찰스 림 프로스트앤설리번공 보안 전문 애널리스트가 안랩과 공유한 올해 보안 동향을 살펴보면, 공격자들은 인공지능을 이용해 자격 증명 도용이나 비밀번호 탈취와 같은 기존 공격을 더욱 효과적으로 …

2018-04-11

"멀티 벤더부터 DR까지"··· 최신 클라우드 트랜드 6가지
포레스터 리서치에 따르면, 글로벌 퍼블릭 클라우드 시장은 지난해 1,460억 달러에서 올 해는 1,780억 달러로 성장할 전망이다. 기업의 퍼블릭 클라우드 도입률 역시 최초로 50%를 넘어설 것으로 보인다. 이처럼 많은 대기업이 컴퓨트 리소스를 덜어내고 전략적 디지털 이니셔티브에 초점을 맞추는 상황에서, 저울이 한 쪽으로 기울게 되는 것은 어쩔 수 없는 결과로 보인다. 오늘날 기업의 클라우드 도입에서 찾을 수 있는 주요 트렌드를 정리했다.멀티 클라우드의 부상AWS가 전부인줄 알던 시대는 갔다. 이제 CIO는 위험을 분산하…

2018-04-11

IBM 기고 | 하이브리드 클라우드 시대의 올바른 매니지드 서비스
IBM 기고 | 하이브리드 클라우드 시대의 올바른 매니지드 서…
클라우드를 조금씩 사용하던 단계에서 나아가, 지금 기업들은 IT 구축부터 클라우드를 고려하거나 더 다양한 업무를 클라우드 환경으로 이전하려 하고 있다. 또한 기업들은 전통적인 시스템과 새로운 클라우드 시스템을 함께 사용하는 하이브리드 모델을 구성하면서 비용 절감 및 생산성 향상뿐 아니라 디지털 변혁에 박차를 가하고 있다. 더욱이 인지 컴퓨팅, 블록체인, IoT 등을 비롯한 신기술을 적용하여 시장에서 경쟁우위를 차지하려 하고 있다. 하이브리드 클라우드는 전통적인 IT환경과 클라우드를 함께 사용하는 구성모델…

2018-03-28

클라우드 성공, '매니지드 서비스'가 좌우
클라우드 성공, '매니지드 서비스'가 좌우
IT 환경 대세로 자리 잡은 클라우드 서비스의 도입 속도가 빨라지고 성장세도 가파르다. 가트너에 따르면 AWS와 애저, 구글 등이 기업에 인프라 서비스(IaaS)와 플랫폼 서비스(PaaS) 형태로 제공하는 퍼블릭 클라우드 시장이 2022년 90조원을 넘을 전망이다. 클라우드 매니지드 서비스 시장 성장성도 높다. 클라우드 매니지드 서비스는 클라우드 사업자의 제품 컨설팅과 운영 및 관리 서비스를 말한다. 이 서비스를 제공하는 기업이 '클라우드 매니지드 서비스 공급자(Managed Service Provider·MSP)'다.올해까지 세계 퍼블릭 클라우드 76%가 MSP로…

2018-03-28

'클라우드+강력한 제어권'··· '베어메탈 클라우드'가 뜬다
'클라우드+강력한 제어권'··· '베어메탈 클라우드'가 뜬다
이때 대안으로 살펴볼 수 있는 것이 바로 베어메탈(bare-metal) 서비스다. 아직은 시장 규모가 크지 않지만 빠르게 성장하고 있다. 베어메탈은 그 이름에서 알 수 있듯 소프트웨어 없이 CPU와 메모리, 스토리지 만으로 구성된다. 사용자가 운영체제부터 그 위에 올라가는 모든 소프트웨어를 선택할 수 있다. 이는 전용 CPU와 하드웨어에 대한 완벽한 제어, 별도로 제작한 운영체제를 실행하는 자유를 누릴 수 있음을 의미한다.마켓 앤 마켓(Markets and Markets)의 2016년 보고서를 보면, 베어메탈 클라우드 시장은 2016년 8억 7180만 달러에서 2021…

2018-03-14

'클라우드의 역설'.. IT인프라 산업에 새생명
'클라우드의 역설'.. IT인프라 산업에 새생명
[아시아경제 황준호 기자] 클라우드가 IT인프라의 대세로 떠오르면서 고사 위기에 처했던 미국 IT 하드웨어 업체들 다시 지켜볼 필요가 있다는 전망이 제기됐다. 올해 두 자리 수 성장이 예상된다는 전망이다.미국 투자은행인 모건 스탠리는 클라우드 산업의 성장으로 인해 IT하드웨어 업체들이 제 2의 생명을 얻게 됐다는 내용의 리포트를 최근 내놨다.지난 3년간 미국 투자자들에게 IT하드웨어업체들은 달가운 투자 대상이 아니었다. 클라우드 컴퓨팅이 급부상하면서 IT시스템을 갖추거나 데이터 센터를 구축하지 않는 기업들이 …

2018-03-08

프라이빗 블록체인과 스마트컨트랙트 주목하는 이유
프라이빗 블록체인과 스마트컨트랙트 주목하는 이유
[테크M=황치규기자] 마이크로소프트나 IBM같은 기업용 솔루션 회사들이 엔터프라이즈 시장을 겨냥해 클라우드 기반 프라이빗 블록체인을 강조하는 것과 관련해 퍼블릭 블록체인 진영에선 이를 불편해 하는 분위기도 엿보인다.  블록체인의 핵심이라 할 수 있는 채굴은 불특정 다수의 노드의 참여를 기반으로 이뤄지는데, 프라이빗 블록체인은 참여하는 노드를 특정 기업과 기업 간 연합체가 통제할 수 있도록 하고 있다. 채굴을 특정 기업들이 책임지는 만큼, 프라이빗 블록체인에선 암호화폐를 꼭 필요로 하지 않는다. 컴…

2018-03-08

'스팀잇'이 보여준 암호화폐와 블록체인의 가치
'스팀잇'이 보여준 암호화폐와 블록체인의 가치
암호화폐와 블록체인으로 무엇을 할 수 있나?[오마이뉴스 글:이호인, 편집:김시연]우리나라에서, 아니 전 세계에서, 암호화폐와 블록체인을 바라보는 시각은, 4차 산업을 이끌 혁명적 기술이라는 쪽과, 튤립 버블보다 더한 폰지 사기이자 도박이라는 쪽으로 극명하게 나뉜다.그러나 암호화폐가 폰지 사기라고 주장하는 사람들조차 블록체인 기술은 육성해야 한다고 이야기한다. 그렇다면 일부에서 주장하는 것처럼 암호화폐와 블록체인은 분리해서 육성이 가능할까? 답은 "경우에 따라 다르다"이다.암호화폐와 분…

2018-02-22

빅데이터 시대, 누구나 알아야 할 데이터 리터러시
빅데이터 시대, 누구나 알아야 할 데이터 리터러시
데이터 리터러시는 데이터를 목적에 맞게 활용하는 데이터 해석 능력을 말합니다. 여기서 이야기하는 데이터의 범위는 고도의 처리 기술을 요하는 빅데이터뿐만 아니라, 단순 수치나 통계자료도 포함합니다. 따라서 데이터 리터러시는 데이터와 관련된 일을 하는 전문 영역의 사람들에게만 필요한 것이 아니라 데이터 활용이 증가하고 있는 이 시대 우리 모두에게 요구되는 역량이라고 할 수 있습니다.‘데이터 리터러시 하위 역량,’ 동아비즈니스리뷰, 228호 (2017.07)데이터 리터러시는 데이터를 기술적으로 다루는 것에서부터 …

2018-02-14

4차 산업혁명, 빅데이터란 무엇인가?
4차 산업혁명, 빅데이터란 무엇인가?
지금 우리 앞에 전개되고 있는 4차 산업혁명의 흐름을 되돌릴 수 없다. 이 혁명이 어디를 향해 갈지, 그 과정에서 우리 삶이 어떻게 바뀔지 궁금하다. 그러나 이런 흐름을 남의 일처럼 지켜볼 수만은 없다. 우리는 새로운 기술을 용기 있게 수용함으로써 경제적 번영과 우리들의 행복을 위하여 할 일이 무엇인가를 알 필요가 있다. 이번 집중기획은 4차 산업혁명의 주요 기술들을 중심으로 일반 시민들의 이해를 돕고자 마련되었다. 따라서 구체적인 내용을 알고 싶은 독자들께서는 별도의 참고서적을 참고하기 바란다.<편집자 …

2018-02-12

 1 2 3 4 5 6 7 8 9 10