[BIG DATA] AutoML특집(2부)-기업환경에 적합한 AutoML 선택전략

 

 

지난 시간에는 AutoML1탄! AutoML이 무엇인지에 대해 살펴보았는데요.

AutoML 2탄에서는 기업환경에 적합한 AutoML 선택전략에 대해

알아보는 시간을 갖도록 하겠습니다.


 

산업 전반에 AI 기술이 도입되면서 혁신의 속도는 더욱 빨라지고 있습니다. 이에 새로운 비즈니스 가치를 찾고 경쟁 우위를 확보하기 위해 데이터를 통한 기업의 혁신과 성장은 필연이라 할 수 있습니다. 최근 1~2년 사이 데이터 관련 업종에서 많이 언급된 단어 중 하나가 머신러닝입니다. 그러나 머신러닝 전문가나 기술자를 모시는 것이 쉽지 않다고 하는데요. 이러한 고민 해결을 위해 등장한 것이 바로 ‘AutoML(AutoMated Machine Learning)’ 입니다.

 

머신러닝의 많은 단계를 자동화하도록 설계된 AutoML(Automated Machine Learning)은 데이터 분석의 효율성을 높일 수 있는 잠재력 있는 기술수단(tool)으로 데이터 과학 분야 인재 부족에 대한 솔루션을 제공할 것으로 기대됩니다.

AutoML이 발전을 거듭할수록 비전문가도 머신러닝 모델과 기법을 활용할 수 있게 되고, 특정 산업의 전문지식을 갖춘 비즈니스 전문가가 AutoML을 활용하여 데이터 과학자(data scientist)의 업무 영역 일부를 대체할 수 있습니다. 이러한 이점으로 인하여 많은 기업들이 AutoML 도입을 고려하고 있습니다.

 

 

AutoML 도입요인

국내에서 AutoML의 가장 큰 도입 요인은 현업으로의 확대입니다. 분석가 or 분석조직 대부분은 전문 분석 솔루션을 도입하였거나 분석 기술로 AutoML을 스스로 활용할 수 있습니다. 그러나 비즈니스 사용자는 분석/머신러닝에 대한 이해 없이는 응용 및 활용이 어려우며, 분석을 위한 데이터 준비의 어려움 등 여러 이유로 기회와 경험으로부터 멀어지고 있습니다. 이에 비즈니스 사용자(비전문가, 현업)도 쉽게 접근하고 활용할 수 있는 AutoML을 선택하는 것이 중요합니다.

 

AutoML과 같은 인공지능 기술발전은 데이터 사이언티스트의 생산성을 향상시킬 수 있으며,

머신러닝의 활용과 접근이 힘들었던 비즈니스 사용자(비전문가)의 접근성과 활용성을 높여 줍니다.

 

 

 

데이터 기반 의사결정 프로세스의 혁신을 위한 조력자로서 기업들은 AutoML 도입을 고려합니다. 데이터 기반의 의사결정을 위해 방대한 소스 데이터를 전처리하고, 모델링하고, 운영 환경에 적용하는 이 복잡한 프로세스를 AI와 머신러닝 기술을 통해 자동화함으로써 업무에 효율성을 높이고, 비즈니스 인사이트를 빠르게 얻어 최적의 의사결정을 할 수 있게 되었습니다. 그러나 이 혁신을 온전히 누리기 위해서는 기업 환경에 적합한 솔루션과 플랫폼을 선택해야 합니다.어떤 문제를 해결하고자 하는지, 어느 수준의 통찰력을 얻고자 하는지, 전문 인력은 보유하고 있는지 등 여러 요소들을 면밀히 살펴 선택해야 합니다.

 

 

AutoML 솔루션 현황

2013년 학술영역에서 시작된 오픈소스 기반의 AutoML은 주요 기술 트렌드로 자리를 잡으며 시장을 형성하고 있습니다. 따라서, 기존에 오픈소스 및 스타트업 위주의 개발에서 대형 벤더로 빠르게 확산이 되고 있으며 경쟁도 심화되고 있습니다.

 

특징적으로, 기존의 AutoML 업체는 DSML플랫폼으로의 진화를 목표로, DSML 업체는 AutoML 구성요소를 추가하고 강화하고 있습니다. 하지만, AutoML은 아직도 한창 개발, 발전이 되고 있기 때문 궁극적으로 이 시점에서 다른 모든 도구를 확실히 능가 할 수 있는 AutoML 도구나 강자는 없다고 판단이 됩니다.


(오픈소스) 초기 AutoML은 AutoWEKA의 사례처럼 학계에서 시작
(스타트업) 자체 AutoML 솔루션 개발 시작 (DataRobot, H2O 등)
(거대 IT기업) 최근 AutoML 솔루션은 Google(Google AutoML), Microsoft(Microsoft Azure AutoML),

 Amazon(Amazon SageMaker Autopilot)등 주요 클라우드 제공업체에서 개발.

DSML(Data Science and Machine Learning) 플랫폼 업체도 AutoML 구성요소를 추가/강화하는 추세

 

 

 

AutoML 선택전략

기업환경에 적합한 AutoML을 선택하기 위해서는 기업의 환경과 역량 정도 그리고 도입 목적에 따라 부합하는 검토 전략이 필요합니다. 특히, 비즈니스 사용자(현업)은 AutoML을 통하여 기회와 경험을 축적하면서 데이터 사이언스 및 머신러닝 영역으로 확장을 해야 되며 자동화(AutoML)를 포함하는 범용적 플랫폼 도입이 전략적이며 실용적인 대안이 될 수 있습니다.

 

 

머신러닝 오픈소스가 다양해지고 있습니다. 그러나 대부분의 오픈 소스가 키트 형태로 제공되므로 오픈 소스 파트들을 조합하여 자체 엔터프라이즈 플랫폼을 구성해야 합니다. 서로 다른 원천기술을 가진 많은 전문가들을 오용하기 힘든 일반 기업이 를 활용하기는 쉽지 않습니다. 모델관리, 투명성, 데이터 추적 등 대규모 조직에서 필요로 하는 엔터프라이즈급 기능도 부족합니다.

 

이 때문에 가트너에서는 SAS와 같은 기업에서 제공하는 ‘상용(Commercial) AI와 머신러닝’에 주목할 필요가 있다고 강조합니다. SAS는 전문가를 위한 엔터프라이즈급 기능과 일반 사용자를 위한 편의 기능을 함께 제공합니다. 또한 전문가와 일반 사용자 간의 협업을 지원하는 다양한 기능을 통해 보다 폭 넓고 깊이 있는 인사이트를 얻을 수 있습니다.

 

 

<기업환경에 적합한 AutoML 선택전략 - 서로다른 세가지 접근방안>

* Source: SAS KOREA SAS AI-Enhanced Analytics 브로슈어

 

 

 

 

지금까지 기업환경에 적합한 AutoML 선택전략에 대해 알아보았는데요.

도움이 되셨나요?

기업 조직 전체에서 데이터 기반의 의사결정을 실현하기 위한 AutoML,

다음 시간에는 AutoML 주요기능 소개 및 활용에 대해 다뤄보도록 하겠습니다.

 

 

 

 

<출처>

- SAS KOREA, SAS AI-Enhanced Analytics 브로슈어

- 정보통신정책연구원, AI TREND WATCH 2020-16호, 인공지능기술이 인재양성 정책에 주는 시사점

- IT World(2019. 8. 26), “데이터 과학자 없는 머신러닝” AutoML의 이해, https://www.itworld.co.kr/insight/129362

- 아주경제(2020. 9. 7.), [AI업계 9월 동향] ① 데이터과학자 부족 문제... “해결책 오토ML이 뜬다”,

  https://www.ajunews.com/util/sokbo_view?newsId=20200907060447319 (접속일자: 2020. 9. 22.)

- What is AutoML?(2019.12.10), https://velog.io/@doiiollo/AutoML (접속일자: 2020.11.10)

- 한국전자통신연구원(ETRI), 전자통신동향분석, 34권 제4호, 자동기계학습 기술동향(2019,8)