'알파고'를 개발한 구글 딥마인드가 한단계 진보된 인공지능을 내놨다. 자신이 본 장면을 바탕으로 다른 사람의 시점에서 본 장면을 상상할 수 있는 인공지능이다.
구글 딥마인드는 센서가 얻은 정보를 통해서 실제 가보지 않은 구역의 장면을 추론·상상할 수 있는 인공지능 '제너러티브 쿼리 네트워크(GQN·Generative Query Network)'를 개발했다고 밝혔다. 연구결과는 국제학술지 '사이언스' 14일자(현지시간)에 게재됐다.
딥마인드 연구진은 인공지능을 이용해 2차원으로 얻은 사진을 이용해 임의의 시점에서의 장면을 재구성할 수 있는 기술을 개발했다. 연구진은 컴퓨터를 이용해 다양한 물체와 조명이 포함된 장면을 만든 뒤 이를 통해 GQN을 훈련시켰다. GQN은 크게 두가지 네트워크가 결합돼 있다. '표상 네트워크(Representation Network)'는 샘플 이미지로부터 얻은 정보를 저장하고 기억한다. '생성 네트워크(Generation Network)'는 대표 네트워크가 얻은 정보를 토대로 또다른 각도에서 장면을 바라봤을 때 어떤 그림이 그려지는지를 추론해낸다. 딥마인드는 "GCN에 특정 공간에서 찍은 사진을 몇장 넣어주면 또다른 각도에서 공간이 어떤 형태를 띄고 있는지 추론해낼 수 있다"며 "사람의 도움 없이도 스스로 해낼 수 있다"고 설명했다.
예를 들어 육면체 공간 안에 연두색 구와 하늘색 실린더, 빨간색 삼각형 구조물을 놓은 뒤 좌우, 뒤에서 찍은 사진을 GQN에 넣는다. GQN은 이 정보를 토대로 육면체의 앞이나 위에서 사진을 찍으면 어떤 형태가 나타날지를 예측할 수 있다. 이정원 한국전자통신연구원(ETRI) SW콘텐츠연구소 선임연구원은 "장면에 나타난 물체의 색깔, 모양, 위치 정보를 분리해서 파악한 뒤 종합해서 상황을 추론하는 방식"이라며 "뇌의 시각시스템이 작동하는 방식과 유사하다"고 설명했다. 그는 "딥마인드는 인간의 도움없이 학습한 인공지능이 일반적인 상황에서도 작동하는 기술을 개발하고 있다"며 "이러한 딥마인드의 철학이 반영된 인공지능"이라고 덧붙였다.
딥마인드가 개발한 GQN은 로봇을 제어하는데 활용될 수 있다. 현재 로봇팔을 제어하기 위해서는 다양한 각도에서 찍은 사진
[원호섭 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]