
지식 그래프란? | 지식 그래프(Knowledge Graph)를 소개합니다.
최근 생성형 AI와 고급 데이터 분석의 급격한 성장으로 지식 그래프와 데이터 패브릭의 중요성이 부각되고 있습니다. 지식 그래프와 데이터패브릭은 왜 중요한 것일까요? 유연하고 기민하게 지식 그래프를 구축할 수 있는 방안은 무엇일까요? 이번 포스팅에서는 지식그래프와 데이터패브릭의 개념과 솔루션을 소개합니다.
IBM에 따르면 지식 그래프(시맨틱 네트워크라고도 )는 “사물, 이벤트, 상황 또는 개념과 같은 실제 실체의 네트워크를 나타내며 이들 간의 관계”를 의미합니다.
지식 그래프가 왜 중요한가요?
지식 그래프는 데이터에서 인사이트를 추출하고 이를 누구나 활용할 수 있게 돕습니다. 조직은 지식 그래프를 사용하여 데이터의 실제 의미를 파악하고 모든 사람이 데이터에 액세스하고 활용할 수 있도록 할 수 있습니다. 지식 그래프는 데이터 사일로를 제거하고 AI 애플리케이션의 정확성과 정교함을 높이는 데 핵심 역할을 합니다.
무엇보다도 지식 그래프는 더이상 전문 데이터 과학자만의 전유물이 아닙니다. 오늘날의 데이터 분석 도구는 초보자도 쉽게 지식 그래프를 구축할 수 있도록 지원해 모든 기술 수준의 사용자가 지식 그래프를 쉽게 만들 수 있게 해줍니다.
예: 제조업에서는 PhysicsAI와 결합된 직관적인 솔루션을 통해 시뮬레이션 중심 설계를 가속화합니다.
데이터에서 가장 중요한 “문맥(Context)”을 고려하라
데이터의 가치는 문맥(Context)에 따라 결정됩니다.
지식 그래프는 데이터 세트와 데이터 작업에 중요한 컨텍스트를 제공하기 때문에 중요합니다. 2019년 한 여성의 911 신고 사례는, ‘피자를 주문한다’는 말로 가정폭력을 알린 사례로, 상황의 맥락이 얼마나 중요한지를 보여줍니다.
출처: SNAC
신고자는 긴급 출동 요원에게 피자를 주문하고 싶다고 말합니다. 긴급 출동 요원은 911은 피자 배달이 아닌 긴급 전화를 위한 것이라고 설명합니다. 그러나 발신자가 긴급 출동 요원의 호소에도 불구하고 계속 피자를 달라고 요청하자 긴급 출동 요원는 발신자의 진짜 의미, 즉 어머니가 학대자로부터 즉각적인 위험에 처해 있음을 재빨리 알아차립니다.
이 통화는 인간 커뮤니케이션의 복잡성과 시간, 장소, 관계에 따라 단순한 단어의 의미가 어떻게 달라질 수 있는지를 보여줍니다. 하지만 기계와 알고리즘은 이러한 뉘앙스와 복잡성을 해독하고 감지하는 데 어려움을 겪고 있습니다. 그렇기 때문에 기계가 데이터의 의미를 더 잘 이해할 수 있도록 하는 기술과 기법을 찾는 것이 데이터 과학과 AI에서 가장 중요한 관심 분야 중 하나입니다. 바로 이 부분에서 지식 그래프가 등장합니다.
지식 그래프가 점을 연결하는 방법
이름에서 알 수 있듯이 지식 그래프는 데이터를 그래프 형태로 캡처하여 표현합니다. 이 그래프는 노드(관심 대상 개체와 그 용도), 속성 및 노드 간의 관계로 구성됩니다. 결정적으로, 지식 그래프의 구조는 서로 다른 데이터 구성 요소 간에 연결과 연결을 가능하게 하며, 그래프는 끝없이 연결된 점들의 네트워크처럼 보입니다. 이러한 멀티레이어 접근 방식은 데이터를 지식으로 변환하는 깊이와 유연성을 제공하는 동시에 문맥과 의미의 뉘앙스를 포착합니다.
지식 그래프를 사용하면 다양한 소스와 다양한 형식의 데이터를 한데 모으는 것이 간단하고 데이터의 가치를 증폭시킬 수 있습니다. 이러한 접근 방식은 서로 다른 데이터 형식 간의 정합성을 위해 데이터베이스의 의미를 희생하는 많은 데이터 관리 도구와는 대조적입니다. 지식 그래프는 또한 새로운 정보가 발생함에 따라 항상 진화하는 지식의 역동적이고 변화하는 특성을 수용합니다.
온톨로지는 여기서 또 다른 중요한 개념입니다. 넓게 보면 지식 그래프는 정의, 규칙, 관계 및 용도를 통해 도메인 지식을 정의하는 온톨로지에 데이터를 수집하고 통합합니다. 따라서 온톨로지는 다른 애플리케이션과 연계할 수 있는 공유 어휘를 제공하고 그래프의 지식을 추가 분석 및 처리에 사용할 수 있도록 합니다.
이 모든 것은 지식 그래프가 그 자체로 끝이 아니라는 사실에 이르게 합니다. 기업에서 지식 그래프는 조직의 데이터 인프라 전반에 걸쳐 확장되는 풍부하고 유연하며 기계 판독이 가능한 계층인 데이터 패브릭을 만들기 위한 수단일 뿐입니다. 이 데이터 패브릭은 다른 데이터 과학 및 AI 플랫폼에서 더 잘 활용할 수 있는 것입니다.
생성형 AI 결과를 더 정확하게!
지식 그래프는 생성형 AI의 정확도와 관련성을 높이는 데 기여합니다. 특히, 지식 그래프는 대규모 언어 모델(LLM)이 새로운 최신 정보를 활용하는 데 도움이 되며, genAI 개발의 또 다른 핵심 영역인 검색 증강 생성 (RAG)에서 활용하는 벡터 임베딩과 잘 작동합니다. 사용 사례에는 기존 LLM을 미세 조정하거나 특정 도메인 전문 지식을 사용해 새로운 모델을 훈련하는 그래프 RAG도 포함됩니다.
코딩이 필요 없는 Altair® Graph Studio™는 초보자부터 전문가까지 누구나 조직의 전체 데이터 풀에서 지식 그래프를 구축할 수 있도록 지원합니다.
Altair Graphic Studio는 초보자와 전문가 사용자 모두 조직의 전체 엔터프라이즈 데이터 풀에서 지식 그래프를 구축할 수 있습니다. Graphic Studio는 이 인프라에 시맨틱 그래프 기반 데이터 패브릭 레이어를 적용합니다. 이를 통해 사일로를 없애고 사용자와 데이터/AI 도구 모두 비즈니스 데이터의 진정한 의미를 이해할 수 있습니다.
지식 그래프: 지금 바로 영향력 만들기
911 사례는 AI가 인간의 지능처럼 더 역동적으로 작동하도록 돕는 데 수반되는 과제를 보여주는 한 가지 예일 뿐입니다. 지식 그래프는 그 여정의 핵심적인 부분으로, 데이터에 더 큰 맥락을 제공하는 데 있어 이미 점점 더 중요한 역할을 하고 있습니다. 물론 그래프 스튜디오와 같은 도구의 등장은 데이터 과학과 AI 도구 및 그 기능을 대중화하려는 또 다른 강력한 트렌드를 강조하고 있습니다.
알그래프 스튜디오는 시장을 선도하는 Altair RapidMiner 기반의 AI 플랫폼의 일부로, 지식 그래프를 쉽게 구축하고 활용할 수 있는 기능을 제공합니다. 알테어는 40여년간 전 세계 조직이 가장 시급한 과제를 해결하도록 지원해 왔습니다.Altair의 데이터 분석 및 AI 기능이 모든 조직이 가장 어렵고 흥미로운 목표를 달성하는데 어떻게 도움이 되는지 알아보세요.
