‘스몰 데이터’와 능동적 해석자

‘스몰 데이터’가 새삼 주목받고 있다. ‘빅데이터’가 칭송되다못해 무한 효용의 수단으로까지 승격된 현실에선 다소 뜨악하다는 느낌마저 든다. 허나 ‘스몰 데이터’는 결코 예사롭지 않은 테크니컬 아젠다이다. 선택과 집중의 노력으로 만능의 효용을 과시하는 빅데이터 신화에 도전한다는 점에서 예사롭지 않다. 세상의 온갖 서사와 정보를 한데 버무리기보단, 꼭 유용하고 의미가 있는 키워드 대상을 모델로 추출하는게 효율적이라는 판단이다. 듣고 보면 수긍이 가는 대목이다.

데이터 마이닝의 대상이 되는 세상의 재료는 무한에 가깝도록 복잡하다. 그 많은 데이터 소스들을 구조화 또는 비구조화하고, 예측과 분석의 효용을 높이는 시스템을 구축해온 것이 지금까지의 빅데이터 세계였다. 이에 비해 ‘스몰 데이터’는 선택적으로 압축된 세계를 기획한다고 할까. 데이터량이 비록 적긴 하지만, 인과나 용도가 있는 정보를 선별, 검증한 데이터 모델이다.

그렇다면 새삼 왜 ‘스몰 데이터’일까. 그 이유는 여러 가지가 있겠지만 우선 분산의 가치다. 이는 ‘엣지화’와도 직결된다. 데이터 마이닝이나 분석은 이제 데이터 센터나 클라우드 환경의 외부, 즉 엣지에 적합한 형태로 진화하고 있다. 굳이 변방과 ‘중심’, 곧 데이터 웨어하우스를 오가느라 지체되는 것을 피하기 위해서다. 무릇 데이터는 십중팔구 순간의 현장(엣지)에서 일어난다. 그 정확한 의미 체계를 해석하며 가장 유용하게 소비하기 위해선 데이터가 생성된 도메인에서 성숙시키는게 바람직하다. 그래야 사용자가 손쉽게 발굴하고 활용할 수 있게 되는 것이다. 곧 ‘분산의 효용’이라고 하겠다.

이 즈음 분산화와 엣지 개념의 데이터 패브릭 내지 데이터 매시 개념이 부쩍 오르내리는 것도 그 때문이다. 데이터 패브릭은 말 그대로 데이터를 조각으로 쪼개어 섭취하는 것이다. 곧 분산 네트워크 환경에서 원활하게 데이터에 접근하고 공유하기 위해 여러 메타데이터로 조각낸 개념이다. 데이터 패브릭은 그야말로 스마트한 민첩성이 미덕이다. 데이터 통합과 데이터 시각화, 데이터 관리 기술을 두루 아우르며, 필요한 데이터를 신속하게 찾아내어 의미체계로 전환하여 사용할 수 있다.

또 하나, ‘스몰 데이터’의 중요한 함의가 있다. 즉 공정한 빅데이터로 인간과 세상을 공정히 재단한다는 허구적 명제를 교정하는 것이다. 오늘날 빅데이터와 알고리즘은 우주와 세상의 셋톱박스로 칭송받고 있는 현실이다. 그것을 바탕으로 만들어진 매트릭스에 매몰되어 인간세상의 복잡한 방정식을 왜곡하곤 한다. 사람들의 머릿 속에 존재하는 일종의 비뚤어진 정신예측 모형이랄까. 그런 오류 투성이의 알고리즘을 사전에 방지하기 위해서도 데이터를 패브릭으로 미분화하고, 그 하나하나의 정밀한 키워드를 취사선택할 필요가 있다.

‘스몰 데이터’는 또 잘만 활용하면 디지털 시대의 인간소외를 완화하는 수단도 될 수 있다. 흔히 4차산업혁명의 과정에서 대중은 데이터 제공자에만 머무를 공산이 크다. 그런 기성의 관념을 깨는데도 ‘스몰 데이터’가 유용할 수 있다. 모든 참여자들이 미세한 가설을 수립하고, 수집하며, 다양한 분석 행위에 관여하게 된다. 디지털 공간이 끊임없이 토해내는 의미, 지식과 기호, 정보를 해석하고 재생산하는 주역으로 행세하는 것이다. 여기선 “전문적인 것과 비전문적인 것 사이엔 불가침의 경계가 있다”는 명제를 넘어선 ‘대중역학’ 정신이 새삼 소환된다. 곧 기술 엘리티시즘에 맞선 ‘탈(脫)엘리트’의 지평이다.

이처럼 ‘스몰 데이터’는 분산의 효용과 데이터 프로세스에 대한 적극적 참여로 의역될 수 있다. 이는 디지털 공간의 주역이 되기 위한 조건도 된다. 그래서 빅데이터 문명에서 다수 시민이 데이터교(敎)의 신민으로 묶인다면, ‘스몰 데이터’에선 대중이 공간을 재생산하는 장본인으로 승격될 수 있다. 곧 새로운 공간을 출현시키고, 새로운 의미를 해석하는, 디지털 세상의 능동적 해석자가 되는 것이다. ‘스몰 데이터’의 가치는 그래서 결코 ‘스몰’하지 않다.

박경만 주필 pkm6892@naver.com

다른기사 보기

상단영역

본문영역

‘스몰 데이터’와 능동적 해석자

기사 댓글 0

비회원 로그인