NMT 방식은 최근 딥러닝 기반으로 주목 받고 있는 기술로 기존에 활용되고 있는 통계 기반 번역(SMT)에서 한 단계 진화한 방식이다. SMT 방식이 단어나 몇 개의 단어가 모인 구 단위의 학습 번역 방식인 데 비해 NMT 방식은 문장 전체의 맥락에서 그 안의 구성 요소들을 변환하면서 해석해 번역하는 방식이다. 이를 통해 문장 안에서 단어의 순서, 의미, 문맥에서의 의미 차이 등을 반영해 보다 효율적이고 정확하게 번역할 수 있다는 설명이다.
예를 들어 “나는 아침 일찍 아침 준비를 했다”라는 문장이 있을 때 단순히 통계 정보만 사용하면 ‘아침’이라는 단어가 나왔을 때 ‘in the morning’으로 번역해야 하는지 ‘breakfast’로 번역해야 하는지 구분이 쉽지 않다. 반면 문장 전체로 살펴보면 그런 의미적인 차이까지 녹아 들어있기 때문에 ‘in the morning’과 ‘breakfast’를 상황에 맞게 구분 할 수 있다는 설명이다.
네이버에 따르면 파파고는 현재 전문 번역업체, 제휴, 이용자 만족(CS) 등을 바탕으로 학습에 필요한 데이터를 보강해 정확도를 높여 한국어, 영어, 일본어, 중국어 등 4개 국어에 특화된 통역 전문 앱으로 자리매김하기 위해 노력하고 있다. 번역 품질 외에도 문자인식기술(OCR) 정확도를 높이는 작업을 진행 중이며 일본어나 중국어의 발음 기호 정보를 함께 보여주는 부분도 준비하고 있다는 설명이다.
이밖에 파파고와 별도로
[디지털뉴스국 김용영 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]