"보통 머신 러닝이라고 하면 우리는 영화 속에서 생각하는 컴퓨터나 기계가 문제를 일으키는 것을 생각합니다. 하지만 실제로는 데이터를 바탕으로 예측결과를 뽑아내는 것입니다. MS 애저 머신 러닝은 클라우드에 저장된 데이터를 이용해 정확성이 검증된 알고리즘으로 정확하게 분석해서 통합적으로 미래를 예측할 수 있습니다"


한국 마이크로소프트가 클라우드 기반 데이터 예측 분석 서비스인 마이크로소프트 애저 머신 러닝을 국내에 공식 발표했다. 이 자리에서 MS측은 서비스의 핵심을 이렇게 설명했다. 


세상에는 많은 데이터가 있다. 예를 들어 사과나무에서 사과가 떨어지는 모습을 보고 데이터를 얻을 수 있다. 같은 방식으로 사회적으로 벌어지는 일을 공식화하고 데이터화할 수 있다. 이런 것을 수없이 많이 수집하는 것을 보통 '빅데이터'라고 한다.


MS 애저 머신 러닝은 여기서 더욱 나아간다. 애저 클라우드에 이 데이터를 축적하고는 알고리즘 분석을 통해 예측 결과를 얻을 수 있다. 사과라면 떨어지는 속도, 가속도를 보면 그 데이터를 이용해서 다음에 사과가 떨어지면 몇 초에 어디까지 떨어질 지 데이터를 얻을 수 있다. 마찬가지로 사회 현상에 대해서도 충분한 데이터만 있다면 예측을 할 수 있다.


보통 일정한 시간 경과에 따른 패턴이 일정하게 계속된다면 예측이 매우 쉽다. 하지만 출렁거린다든가 규칙성이 복잡한 경우 사람이 그것을 전부 분석하는 것은 쉽지 않다. 이럴 때 기계의 힘을 빌려 분석하고 예측하게 되는데 그것이 바로 '머신 러닝'이다.





2014 브라질 월드컵에서 MS 코타나 서비스는 국가별 우승, 경기, 대전 데이터를 분석해서 월드컵 우승팀을 맞춘 예측을 해냈다. 이것은 인공지능과는 약간 다르다. 데이터 수집 가공 단계에서 데이터마이닝은 수많은 데이터 가운데 필요한 데이터를 골라내는 것이다. 빅데이터는 표본데이터가 아닌 전체 데이터 수집과 활용이다. 예측과는 좀 다르다. 인공지능은 인간과 같은 사고와 인간의 패턴을 인식하는 컴퓨팅을 말한다.


예전에는 데이터가 부족했고 그걸 분석할 컴퓨팅 파워도 부족했다. 그런데 요즘은 필요한 데이터가 축적되었고 필요한 컴퓨팅 파워도 비교적 저렴하고 쉽게 얻을 수 있게 되었다. 마이크로소프트 애저 머신 러닝(Microsoft Azure Machine Learning)은 이렇듯 막대한 양의 데이터 저장 용량과 컴퓨팅 파워 등 비용 및 복잡성 문제 때문에, 도입 장벽이 높았던 머신 러닝을 누구나 비용 효율적이고 쉽게 이용할 수 있도록 클라우드 기반으로 제공하는 서비스이다. 애저 머신 러닝에 접목된 예측 분석 기술은 머신 러닝 방식을 활용하는 가장 최신의 분석 체계이다. 고속 처리된 데이터로 모델 혹은 공식을 만들어 앞으로의 트렌드를 예측해 실제 문제에 적용할 수 있다.


요즘 화두가 되고 있는 사물인터넷(IoT)과도 밀접한 관계가 있다. 사물인터넷을 통해 수집된 정보다 클라우드에 쌓이면 이것을 이용해서 또다른 분석과 예측을 하는 것이 머신 러닝이기 때문이다. 이미 MS 서비스 안에 이런 기술이 들어있다. MS는 다양한 클라우드 장치 속에서 임베디드 윈도우 장치에 관한 일, 클라우드 기반으로 환경을 옮겨가는 일, 다량의 데이터 입력을 할 수 있는 곳, 데이터 저장, 그리고 오늘 설명하는 데이터 예측을 위한 부분을 제공한다.


개괄적인 설명이 끝나고 실제 시연이 시작됐다. 서비스를 열어서는 몇번의 클릭만으로 빠르게 분석 모델을 작성해서 시작할 수 있었으며 정확성 검증된 알고리즘을 모듈 형식으로 이용할 수 있었다. 애저 ML 스튜디오를 통해 만든 서비스는 통합적으로 미래를 예측할 수 있는 기반이 되었다.




마이크로소프트 애저 머신 러닝 서비스는 클라우드 상에서 예측 분석 모델을 수립하고 테스트하는 머신 러닝 스튜디오(Machine Learning Studio), 웹 서비스와 같이 모델을 실행할 수 있는 머신 러닝 API 서비스(Machine Learning API Service)로 구성된다. 별도 소프트웨어 및 하드웨어 설치 없이 브라우저에서 애저에 로그온해서 사용할 수 있다. 가상머신 상의 SQL 서버나 마이크로소프트 애저 HD인사이트(HDInsight)를 포함해 애저 데이터 애셋의 기존 데이터를 그대로 활용할 수 있다.


이 서비스를 실제로 활용하는 사례는 얼마나 있을까? 한국 MS에 설치된 엘리베이터를 만든 티센 크룹은 센서들이 분석한 경우를 통해 데이터를 취합한다. 그리고는 데이터를 분석해서 정비소요와 각종 고장 가능성을 예측한다. 엘리베이터가 고장 나기 전에 데이터를 보내주어 보다 효율적인 관리를 가능하게 한다. 또한 미국 카네기 멜론 대학에서는 사람의 출입 상황과 각종 계절 데이터를 통해 빌딩 냉난방 시스템을 제어한다. 피어원이란 미국 전역에 걸쳐있는 홈인테리어 기업은 키넥트를 활용해서 고객들의 매장 동선을 파악하고 각종 행동에 따라 수요예측을 한다.


또한 머신 러닝의 미래예측 기능을 이용하면 통신사의 서비스 이탈자 예측이나 의료서비스 수요자 예상, 사기 탐지까지 할 수 있다. 병원에서 진료 데이터 및 날씨, 기온 등을 종합적으로 분석해 향후 특정 질병 발생이 많아질 것이란 예상과 해당하는 어떤 치료제를 준비해야 한다는 경보가 가능하다. 


이렇듯 마이크로소프트 애저 머신 러닝은 금융, 제조, 의료, 스포츠, 엔터테인먼트 등 데이터가 발생하는 모든 업계와 모든 규모의 기업이 데이터에서 인사이트를 뽑아내고 트렌드 예측하여 비즈니스에 활용할 수 있도록 돕는다. 마케팅, 수요 예측, 의료 분야에서의 예방, 금융 부정거래 탐지, 예측적인 유지관리, 스마트 빌딩 등 다양한 용도에 접목이 가능하다. 


머신 러닝은 개인이 부담없이 무료로 이용할 수 있는 서비스로 관련 도구를 다룰 노력과 지식을 들이면 자유롭게 이용할 수 있는 서비스이다. 빅데이터와 사물인터넷의 시대, 데이터를 통해서 미래를 보고 싶은 사용자라면 반드시 한번은 눈여겨 봐야 할 것이다.