요즘 알파고로 인해 인공지능이 주목받고 있다. 한동안 하드웨어 기술 발전의 한계 등으로 인해 교착상태에 빠졌던 인공지능이 클라우드 기술과 발전한 연산능력에 딥러닝이라는 알고리즘의 도움까지 얻어 새로운 도약을 하고 있다. 인간의 영역일거라 생각했던 바둑을 점령한 알파고의 모습에 사람들은 충격을 받았다.


사실 인공지능은 이미 실생활에 많이 사용되고 있다. 다만 아직은 우리가 눈치채지 못하는 영역에서 조금씩 응용되고 있을 뿐이다. 유명한 화가의 화풍을 학습하고는 사용자가 보내온 사진을 그 화풍으로 바꾼다든가, 유명한 게임을 학습시켜 인간 수준을 넘도록 끌어올리기도 한다.  



인공지능은 인간과 같은 지능을 실현하기 위한 일련의 기술이다. 자율성이 없이 인간을 도와주는 수준의 약한 인공지능도 있고 영화 터미네이터에서 보듯 자율성과 자유의지, 이해능력을 갖춘 로봇 수준의 강한 인공지능도 있다. 이 가운데 약한 인공지능이 가장 실생활에서 유용하게 사용되는 것은 언어 영역이다. 서로 말이 달라서 생기는 각국 언어장벽을 어떻게 허물 수 있을까? 통번역 업체인 시스트란의 설명으로 인공지능 기술의 원리와 발전 상황에 대해 알아보기로 하자.



인공신경망 - 생물학적 뉴런 처리과정을 소프트웨어 알고리즘으로 구현



인공지능은 인간의 언어를 보다 완벽하게 처리하기 위해서 인간의 뇌를 흉내내는 것부터 시작한다. 인간의 뇌를 이루는 뉴런은 신경을 들어온 입력을 시냅스를 통해 전달받고 처리해서 출력한다. 따라서 인공지능은 내부적으로 입력받은 값을 함수로 처리해서 출력값으로 변환하는 과정을 기본으로 한다.



이 과정에서 인간은 다소 모호한 값이나 틀린 값에도 올바른 해석을 한다. 마찬가지로 인공지능은 부분적으로 부정확한 입력 등을 계속 학습하면서 오류를 스스로 보정하며 올바른 해석을 할 수 있도록 데이터를 갖춘다. 수많은 입력 데이터가 필요하며 입력값이 풍부하게 입력될수록 똑똑해진다. 이것이 딥러닝이다.



글로벌 회사들은 이미 이런 딥러닝의 가능성에 눈을 뜨고 자사 방향에 맞춰 대응하고 있다. 페이스북은 딥러닝 교수 영입해서 팀을 짜서 개인비서 등으로 발전시킬 예정인데 여기에는 SNS 데이터를 풍부한 입력값으로 활용할 예정이다. 


구글은 딥마인드 인수해서 알파고로 발전시켰으며 무인자동차, 이미지인식, 음성인식 등에 적용중이다. 애플은 시리를 서비스하고 있으며 인공지능 스타트업 인수해서 사람 감정을 유추하는 방법까지 연구중이다.



MS는 코타나를 서비스하며 인공지능 스위프트키 인수했으며 인공지능 대화 시스템을 만들고 있다. IBM 왓슨은 이미 유명해서  많은 서비스를 진행 중인데 의료 빅데이터를 이용해 암 진단 등에 활용된다.



음성인식 - 10년의 침체기를 딥러닝 기술로 극복


대표적인 분야인 음성인식은 최근 10년 동안 정체기를 겪었다. 하드웨어 성능 개선과 연구에도 불구하고 인식률 개선에 실패했기 때문이다. 그런데 이 분야에서 딥러닝을 통해 돌파구를 마련했다. 



인간은 음성을 인식할 때 고막을 치는 소리의 파형으로 판단한다. 이것을 기계는 마이크를 통해 입력된 주파수 값으로 판단한다. 여기서 기존 음성인식은 훈련된 샘플링 데이터에 너무 가깝게 최적화되었다. 따라서 샘플값에는 아주 정확한 인식률을 보여주지만 다른 사람 음성이나 어색한 발음 등 약간만 값이 달라지면 인식에 문제를 보였다. 



딥러닝은 이것을 극복하기 위해 일부러 불완전하게 부분적으로 다른 값을 파형에 넣어가며 학습시킨다. 음성인식솔루션에는 고객 목소리 반영하기 위해 콜센터에 들어오는 음성을 반영해서 분석하는 방향으로 발전시키기도 한다. 



일반적으로 통번역 서비스는 음성인식, 기계번역, 음성합성 등 세가지로 기능을 나눌 수 있다. 소리를 정확히 인식해서 텍스트로 바꿔 인식하고 그 텍스트를 다른 언어의 텍스트로 번역하고 번역한 텍스트를 정확한 언어로 소리내주는 기능이 들어가게 된다.  삼성 스마트폰에 들어가는 S-번역기 앱에서 시스트란의 솔루션을 이용해볼 수 있다. 



또한 시스트란은 MWC 2016에 참가해 언어 처리 솔루션을 선보인 바 있다.평창 동계올림픽에서 외국인 선수와 관광객들이 불편함 없이 의사 소통할 수 있도록 영어, 중국어, 일본어 3개 언어의 자동 통번역 서비스를 제공이다. 계회다. ‘통역비서-이지토키’ 앱을 활용해 휴대전화만 있으면 언제 어디서나 외국인과의 의사소통이 가능하다. 이처럼 딥러닝 시스템으로 가능성을 확인한 인공지능 기술이 한단계 더 도약해서 새로운 성장을 앞두고 있다. 



물론 아직 해결되지 못한 점도 있다. 지하철이나 버스 등의 심한 소음이 나오는 장소에서는 정상적인 동작을 기대하기 어렵다. 또한 복잡한 장문을 통번역은 실시간으로 하기 어렵다. 다만 일상적으로 멀리 음악이 들리는 정도의 소음 상황이라면 소음조차도 딥러닝으로 학습되어 인식률이 좋아지고 있다고 한다. 앞으로의 인공지능 기술 발전을 기대해보자.