2. 빅데이터와 인공지능 : 잘 훈련된 데이터가 미래의 경쟁력이 된다
↑ 박정수 연세대 생명시스템 대학 겸임교수, 대보정보통신(NVIDIA VAD) AI 신사업TFT 장, ICT 융합 네트워크(사) 부회장 |
지난 5월, 중국의 커제 9단과 인공지능 알파고의 대국이 있었다. 결과는 알파고의 완승이었다. 이세돌 9단에 이은 인간의 두 번째 패배였다. 알파고가 오랜 기간 연구를 통해 축적된 바둑 고수들의 통찰력까지도 간파한 것이다. 연이은 바둑 고수들의 패배로 전 세계는 놀라고 있다. 그동안 바둑 분야는 인공지능이 섭렵하기 힘든 영역으로 인식되었다. 이에 사람들의 충격은 더욱 컸다. 불과 알파고가 생긴지 3년 만의 일이다. 여기서 우리는 잘 훈련된 데이터가 바둑의 고수, 중국 커제와 이세돌을 이겼다는 사실에 주목해야 한다.
어떻게 이런 일이 가능해진 걸까? 알파고 승리의 핵심은 바로 데이터를 훈련시키는 기술, 즉 '딥러닝(Deep Learning) 기술'이다. 딥러닝 기술은 인공지능 방법 중 하나다. 알파고는 딥러닝 기술을 통해 프로기사들의 기보를 포함하여 총 3천만개 이상의 바둑돌 위치 데이터를 습득했다. 이후 무수한 가상 대결을 반복함으로써 강화학습을 진행했다. 이처럼 진화된 딥러닝 기술력을 바탕으로 잘 훈련된 데이터는 인간만이 가능하다고 여겼던 영역들을 대체하고 있다.
◆ 양질의 빅데이터를 활용한 인공지능이 미래의 경쟁력이 된다.
ICT 기술과 인프라가 발달하면서 데이터는 폭발적으로 늘고 있다. 뿐만 아니라 과거에는 파일 형태로 저장할 수 없었던 비구조화된 데이터(이미지와 행동 등)도 수집이 가능해졌다. 이처럼 데이터의 규모가 증가하고 다양화됨에 따라 데이터 활용 범위는 점차 넓어지고 있다. 또한 인공지능 발전과 더불어 데이터의 중요성은 더욱 높아지고, 스스로 예측·판단이 가능한 사고 영역으로까지 활용범위가 확장되고 있다. 뿐만 아니라 인공지능 기술을 활용하여 데이터 간 독립적인 상호작용(Autopoiesis)이 가능해졌다. 따라서 기업들은 고객의 경험을 데이터화하여 고객 활동 정보화(CAR, Customer Active Repository)를 할 수 있게 되었다. 즉 데이터의 활용범위는 사용자 경험(UX, User Experience)까지 확대되었다. 이는 데이터와 인공지능이 밀접한 관계를 갖고 있다는 반증인 셈이다.
인공지능 머신러닝(기계학습)은 데이터의 특정 부분을 추출한 후 분류해 나가는 과정이다. 컴퓨터는 데이터의 특성을 반복적으로 학습하면서 데이터를 구분한다. 따라서 컴퓨터가 제대로 된 학습을 하기 위해서는 방대하면서도 양질(良質)의 데이터가 필요하다. 데이터의 양과 질에 따라 인공지능의 품질 자체가 달라지기 때문에, 고퀄리티(High quality)의 데이터를 충분히 확보하는 것이 매우 중요하다.
빅데이터를 활용한 인공지능이 미래 산업의 주요 경쟁력이 될 것은 이미 자명한 사실이다.
인간처럼 생각하고 판단할 수 있는 인공지능 기술은 제조, 의료, 예술 분야 등 모든 산업에 걸쳐 나타날 전망이다. 최근 들어 인공지능을 실제 비즈
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]