통화기록, 번역, 영어학습, 은행 업무까지… 음성인식 AI 초고속 성장세

[세계비즈=권영준 기자] 음성인식 AI 시장이 고속 성장세를 보이는 가운데, 관련 서비스들이 기술 고도화를 통해 다양한 산업군에서 활약하고 있어 눈길을 끈다.

 

수기로 기록하지 않아도 통화 내용을 메신저처럼 보여주는 AI 통화 앱부터 각국의 언어를 목소리로 입력하면 번역해주는 서비스, AI와의 반복적인 대화로 영어 회화능력 키우는 학습 앱, 번거로웠던 은행 업무를 똑똑하게 응대해주는 AI 은행원까지 일상 속에서 편리함을 제공하는 음성인식 AI서비스 사례를 소개한다.

 

■ AI 기술로 통화 녹음을 텍스트로 변환해 메신저처럼 보여주는 ‘비토(VITO)’

 

AI 스타트업 리턴제로가 개발한 눈으로 보는 통화 앱 ‘비토(VITO)’는 통화 녹음을 텍스트로 변환해 메신저처럼 보여주는 서비스다.

 

통화 종료 후 수 초 내에 상대방과 나의 목소리를 분리해 메신저처럼 보여주는 기본 기능은 물론, 원하는 내용을 쉽게 검색할 수도 있다. 통화 녹음파일을 처음부터 끝까지 듣지 않아도 원하는 부분을 클릭하면 손쉽게 부분 재생이 가능하다. 통화 내용 편집, 공유, 메모와 같은 부가 서비스도 지원해 일상 속 편리한 앱으로 주목받고 있다.

 

뿐만 아니다. 리턴제로는 지속적인 기술 고도화를 통해 지난해 9월 '통화 전 미리보기' 기능을 선보였다. 이 기능을 사용하면 연락처 저장 여부와 관계없이 전화 수신 시 상대방과의 기존 통화 내용을 미리 볼 수 있어 전화 수신 전에 통화 내용을 미리 대비할 수 있다.

 

리턴제로는 자체 개발한 통화 음성을 텍스트로 바꿔주는 STT(Speech To Text) 기술 기반 '소머즈 엔진'과 사용자의 목소리를 분석해 화자를 분리하는 '모세 엔진'을 통해 서비스를 제공하고 있다. 비토는 높은 정확도와 고품질 기능들을 선보이며 일반인부터 통화 업무가 필수인 영업직이나 변호사, 부동산 종사자, 보험설계사까지 다양한 직종의 이용자들에게 인기를 끌고 있다.

 

비토는 이용자가 늘어날수록 AI가 더 많은 데이터를 학습해 똑똑해지는 선순환 구조를 바탕으로 음성인식 기술력을 발전시키고 있다. 현재 안드로이드 폰에서 이용 가능한 비토는 올해 웹 버전과 iOS로 서비스 영역을 확대해 나갈 계획이다.

 

■ 어려운 번역 작업도 AI가 몇 초면 뚝딱! ‘구글 번역(Google Translate)’

 

구글은 2016년 11월 AI기반 신경망 기계번역(GNMT·Google Neural Machine Translation)을 적용한 번역 서비스를 도입하며 글로벌 번역시장을 선도하고 있다.

 

구글이 적용한 신경망 기술은 기존에 문장 내에서 단어·구문 단위로 번역하던 수준 (PBMT·Phrase-Based Machine Translation)에서 진화해, 인간의 언어 구사 방식과 유사한 문장 단위 번역을 가능케 했다. 이 기술은 영어뿐만 아니라 프랑스어, 독일어, 스페인어, 포르투갈어, 중국어, 일본어, 터키어 등 8개 언어에 적용됐다. 구글은 현재 총 103개 언어의 번역 서비스를 지원하고 있으며, 향후 머신러닝을 통해 더 많은 데이터를 학습한다면 더욱 정교한 품질의 번역이 가능해질 것이라고 밝혔다.

 

구글은 더 높은 인식률과 정확도를 위해 지속적인 성능 업데이트와 번역에 맞는 평가 체제를 공식화하며 서비스 안정화를 꾀하고 있다.

 

■ AI와 반복 학습으로 더욱 효과적인 스피킹 튜터 앱 ‘스픽(Speak)’

 

코로나의 여파로 재택 근무 및 비대면 업무가 활성화됨에 따라 영어를 사용하는 원격 비즈니스 또한 늘어나고 있다. 이에 회화 능력의 필요성이 더욱 높아지면서 영어 교육 분야에서 ‘AI 스피킹 튜터 앱’들이 연이어 등장하고 있다.

 

스픽이지랩스가 개발한 ‘스픽(Speak)’은 AI 기반 영어 스피킹 교육 앱 서비스로, 학습자가 원하는 때에 원하는 장소에서 혼자 공부할 수 있도록 도와 학습의 시공간적 제약을 극복했다. 학습의 자율적 측면에서 기존의 학습법이 해결하지 못했던 부분 또한 보완했다.

 

스픽은 일상생활에서 쓰이는 영어 표현들을 AI와 반복적으로 연습할 수 있어 학습자의 스피킹 횟수를 자연스럽게 늘리고, 문자 중간중간 빈 칸을 통해 해당 표현을 완성하는 미션도 주어진다. 스픽 앱은 1500개 이상의 회화 연습용 콘텐츠를 제공하고 일상 생활속에서 일어날 수 있는 다양한 상황들을 제시해 활용도가 높다는 것이 특장점이다.

 

■ 디지털 금융대전, ‘KB국민은행’에 도입된 AI 은행원

 

지난해 3월 KB국민은행은 실시간으로 양방향 소통이 가능한 AI 은행원을 국내 최초로 선보였다. 여의도 KB국민은행 본관 AI체험존에 첫 선을 보인 AI 은행원의 응답 속도 및 성능을 한층 더 개선하고 콘텐츠를 추가해 여의도 영업부, 인사이트점, 돈암동 지점으로 순차적으로 확장해 나가고 있다.

 

AI은행원은 KB국민은행이 자체 개발한 금융 특화 언어 모델 KB-STA를 통해 고객의 물음에 최적의 답을 도출한다. 현재 키오스크에 적용돼 지능형 자동화기기(STM), 현금자동인출기(ATM) 사용법과 금융상품 소개, 필요서류 안내 등 다양한 정보제공 역할을 한다. 이를 위해 AI 은행원은 800여 개의 금융 용어와 1300개의 시나리오를 학습했다.

 

KB국민은행의 AI은행원은 코로나 상황 속에서 대면 거래를 선호하는 고객에 안전한 응대가 가능하며, 고객의 체감 대기 시간 단축에도 효과가 있을 것으로 기대된다.

 

young0708@segye.com

[ⓒ 세계비즈앤스포츠월드 & segyebiz.com, 무단전재 및 재배포 금지]