AutoML(Automated Machine Learning)은 ‘자동화된 머신러닝’이라고 번역할 수 있지만 보통은 AutoML이라고 많이 부릅니다. AutoML은 머신러닝을 위한 고급 모델 구축을 자동화할 수 있기 때문에 데이터 과학 전문 지식과 프로그래밍 스킬이 필요한 공정을 기계가 알아서 처리해서 누구나 쉽게 머신러닝을 활용할 수 있도록 도와주는 기술입니다.
앗! 아직 ‘머신러닝’에 대해 모르신다면? 머신러닝에 대해 애니메이션으로 설명한 영상을 먼저 시청해주세요! :)
데이터 분석 워크플로우
비즈니스에서 데이터 분석을 활용하기까지는 다양한 공정이 있습니다. 데이터 사이언티스트는 가지고 있는 데이터를 분석에 사용할 수 있는 형식으로 다듬는 데이터 전처리부터 모델 생성, 활용 등 고도의 전문성과 시간과 노력이 드는 작업을 합니다.
데이터 전처리는 시간이 걸리고 손이 많이 가는 작업이지만 이 과정에서 정확하지 않은 데이터가 발생하면 분석 결과까지 영향을 미칩니다. 모델 생성은 특징량이나 알고리즘 선택, 모델 구축, 검증 등 전문성이 요구되는 공정이 많아 데이터 사이언티스트의 경험이나 역량에 의존하는 부분이 많습니다.
이렇게 수많은 머신러닝 알고리즘 중에서 내가 하려고 하는 분석에는 어떤 것이 최적인지 선택하는 것도 중요합니다. 때문에 데이터를 활용하고 머신러닝 기술을 적용할 때는 데이터 사이언티스트의 역량이 많이 필요합니다.
AutoML로 데이터 전처리 및 모델링 자동화
하지만 모든 조직에 데이터 사이언티스트를 배치하는 것은 현실적으로 어렵습니다. 이렇게 데이터 사이언티스트의 역량이 필요한 작업을 자동화하는 것이 바로 AutoML의 기능입니다. 무엇보다도 전문 인력이 부족한 조직에서 AutoML의 기능을 활용하면 효율적인 데이터 분석을 할 수 있습니다.
다양한 산업에서 디지털 전환을 위한 데이터 전문 인력 확보에 나서면서 많은 기업들이 인력 확보에 어려움을 겪고 있습니다. 이러한 디지털 인력 부족이나 스킬 부족을 보완하는 툴로서 AutoML은 도움이 될 수 있습니다.
예측분석 및 머신러닝 플랫폼 Altair Knowledge Studio
Altair Knowledge Studio에서는 분석하고자 하는 데이터를 로드하고 AutoML의 아이콘을 드래그 앤 드롭으로 설정하면 데이터 전처리에서 모델을 자동으로 생성하고, 일부 알고리즘을 검증 및 정밀도를 비교한 후 최적의 모델을 출력합니다. 진행한 작업과 처리의 이력이 제대로 남아있기 때문에 나중에 수정할 수도 있습니다.
수천, 수만 행의 빅데이터에도 대응할 수 있어 2만 행 정도의 데이터도 무려 수십초만에 완료할 수 있습니다.
아래의 영상을 통해 날리지 스튜디오에 대한 내용을 자세히 확인해보시고, 평가판 및 데모도 신청해보세요!
* 본 포스팅은 Altair Japan의 블로그 포스트를 번역 및 활용하였습니다. [원문 바로가기]