날리지 스튜디오(Altair Knowledge Studio)란?업계 최고의 특허받은 의사 결정 트리, 전략 트리, 워크플로우 및 마법사 중심의 그래픽 사용자 인터페이스로 널리 알려진 날리지 스튜디오는 고급 데이터 마이닝 및 예측분석 워크벤치입니다. 날리지 스튜디오는 고급 예측 모델링 기능을 통해 모델 개발 및 구현에 중점을 두고 데이터 마이닝 주기의 모든 단계에 대한 포괄적인 예측 분석을 제공합니다.
왜 날리지 스튜디오인가?
비용 효율적이고 사용하기 쉬운 날리지 스튜디오는 보편성과 효율성면에서 독보적입니다. 고성능의 비주얼 환경은 직관적인 워크플로우와 마법사 중심의 그래픽 사용자 인터페이스를 제공하여 사용자가 코딩하지 않고도 효과적인 모델을 구축할 수 있게 합니다.
날리지 스튜디오는 누가 사용하는가?
날리지 스튜디오는 신용 위험, 사기, 마케팅, 영업, CRM 분석, 엔지니어링과 같은 다양한 산업과 부서의 고객이 사용합니다. 비즈니스 분석가와 계량 분석가 퀀트는 어떤 복잡한 모델도 수용할 수 있도록 고급 모델 파라미터를 세밀하게 조정하기 위해 구성 가능한 설정을 통해 보다 복잡한 기능에 액세스할 수 있습니다.
이번 버전에 새로 추가되거나 향상된 기능
• Simpson’s Paradox Detection
• 결측치 대체
• 클래스 불균형 핸들링
• Sklearn GLM
1. Simpson’s Paradox Detection 기능
대상 변수의 특정 추세가 하위 집합에선 관찰되지만 전체 데이터 집합에서는 그 반대의 추세가 관찰되는 Simpson’s Paradox를 탐지하는 데이터 프로파일링 기능이 추가되었습니다. 이를 통해 추세에 대한 잘못된 해석을 피하고, 변수간의 편향이나 인과관계에 대한 잘못된 결론을 도출하는 것을 방지할 수 있습니다.
2. Substitute Missing Values 기능
기존에는 Variable Transformation 노드내에서 helper 기능을 통해서 결측치를 처리한 새로운 컬럼을 생성했습니다. 이 기능은 노드 형태로 따로 존재하고, 원래의 변수 값을 대체하는 방법으로 동작합니다.
3. Handle Class Imbalance 기능 : 오버샘플링을 통한 클래스 불균형 핸들링
이 기능은 일부 클래스를 오버샘플링하여 왜곡된 분포를 가진 변수 클래스의 균형을 맞춥니다. 클래스 불균형 처리에 많이 사용되는 Python 라이브러리인 Imbalanced-Learn(imblearn)을 사용합니다.
4. Sklearn GLM(Generalized Linear Model)
학습데이터셋에 연결하여 새로 모델을 생성하거나 학습된 선형 회귀 모델에 연결할 수 있는 ‘SklearnGLM’이 Model탭에, 이를 검증하고 스코어링 할 수 있는 ‘SklearnGLM Validation’ 노드와 ‘SklearnGLM Scoring’ 노드가 생성되었습니다.
이를 이용하여 정규분포를 반드시 따를 필요는 없는 종속변수로 회귀모델을 구축할 수 있습니다. 관련 노드들은 머신러닝을 위한 Python 라이브러리인 scikit-learn의 선형 모델 방법을 사용하고 Python 코드로 바로 출력이 가능합니다.
– Sklearn GLM Validation
– Sklearn GLM Scoring
기타
• 회귀모델, 정규화, 딥러닝, PCA 등에 대해 Code Generation 노드에서 R코드 생성이 활성화 되었습니다.
• R버전 3.4.4 이하 버전은 더 이상 지원되지 않습니다.
• 프로그램 설치시 자동 설치 옵션을 이용하여 프로그램 기본 설정을 저장하고 사용할 수 있습니다.
제품의 새 버전에 대한 소프트웨어와 문서는 Altair Connect에서 이용하실 수 있습니다. Altair Connect 다운로드 섹션에서 Data Analytics Products를 확인하세요.
본문을 파일로 확인하고 싶으신 분들은 (여기)를 클릭해주세요.