본문 바로가기
IT 기본개념

온톨로지(Ontology)

by 라이프해커 김탁구 2022. 12. 22.
반응형

1. 온톨로지(Ontology) 개요

1) 정의

특정 분야의 지식과 관련된 용어 및 용어 사이의 관계를 정의하는 일종의 사전으로 지식표현(Knowledge Representation)과 추론(Reasoning) 두 축으로 구성되며, 컴퓨터가 처리할 수 있는 형식으로 명시되어 공유와 재사용이 가능(intelligence information processing)한 틀을 제공합니다. 

2) 특징

온톨로지는 개념화(Conceptualization), 명시적 명세(Explicit specification), 정형화(Formal), 공유(Shared)의 4가지 특징을 가집니다. 개념화(Conceptualization)는 특정 영역 또는 분야의 현실 세계와 관련된 개념을 나타내는 추상 모델을 의미합니다. 명시적 명세(Explicit specification)는 개념의 타입이나 사용상의 제약 조건들이 명시적으로 정의하는 것을 말합니다. 정형화(Formal)는 온톨로지가 프로그램이 이해할 수 있어야 하며, 여러 단계의 정형화가 존재할 수 있음을 의미합니다. 공유(Shared)는 온톨로지가 합의된 지식을 나타내므로 어느 개인에게만 국한되는 것이 아니라 그룹 구성원이 모두 동의하는 개념을 말합니다. 

3) 기능

- 모호성 제거 : 개념을 명확히 정의하고 있기 때문에 검색자 및 기타 사용자들의 혼란을 제거합니다.
- 색인 기능 제공 : 정보검색을 용이하게 해 줄 뿐만 아니라 자체 데이터베이스를 검색하는 노력을 줄여줍니다.
- 정확성 향상 : 자연언어로 질의를 해도 자동으로 적절한 용어를 인식하여 검색해주므로 정확성을 높여줍니다.

 

2. 온톨로지 구성요소 및 종류

1) 구성요소

구성요소 세부설명
개념
(Concept)
현실세계에 존재하는 것에 대한 일반적으로 본질적인 인식이나 지식. 혹은 사물을 표현하는 단위 프린터
속성
(Property)
개념에 근본적으로 속하는 성질 프린터라는 개념의 가격,색깔,무게 등의 속성
관계
(Relationship)
개념들 사이의 상관관계, 개념은 주로 관계를 통해 다른 개념들과 연결 상속관계
제약조건
(Constraint)
개념들간의 관계나 속성의 값에 관한 제약 규정 컴퓨터는 반드시 1개 이상의 CPU를 자져야 함
공리
(Axiom)
추론의 기본이 되는 명제로서 증명을 할 수 없거나 증명을 요하지 않은 참으로 인정되는 문장 프린터는 복사용지를 사용한다
인스턴스
(Instance)
개체라고 하며 각 개념의 실제 예 삼성프린터 a모델은 프린터의 개체

2) 종류

(1) 도메인 기반 : 특정 도메인 또는 종합적인 도메인 기반 온톨로지
(2) 태스크 기반 : 주석 분석과 같은 특정 타스크 또는 문제 해결과 같은 보편적인 타스크를 위한 온톨로지
(3) 일반적인 기반 : 일반적이고 공통적인 개념들을 나타내는 온톨로지로 자연언어 처리에 활용되는 온톨로지로 온톨로지를 재사용하는데 유용하게 사용될 상위개념의 또는 참조적인 온톨로지

 

3. 온톨로지 언어와 구축 

1) 온톨로지 언어 및 기술방법

(1) XML/XML Schema

- XML의 역할은 다양한 정보를 일정한 형식으로 정의하고, 표준화된 방식으로 상호 교환할 수 있는 기술 기반을 제공함으로써, 컴퓨터가 처리할 수 있도록 한다는 것
- XML은 시맨틱 웹에서 요구하는 수준의 데이터와 의미, 즉 객체 형태의 데이터 구조, 데이터 구조 사이의 관계, 그리고 추론을 위한 규칙을 표현하기 위한 직접적인 방법은 없는 상태
(2) RDF/RDF Schema

- Resource Description Framework
- 객체 형태의 데이터 구조의 정의 및 데이터 구조간의 관계의 표현을 위해 XML을 기반으로 하여 제안된 언어
- RDF는 구조화된 메타데이터의 생성, 교환, 재사용 등을 가능하게 해주는 기반 구조. RDF 모델은 리소스(Resource), 특성(Property), 서술문(Statement)의 개념으로 구성
- RDF Schema는 RDF 데이터 모델에 유형을 선언할 수 있는 메커니즘을 제공
- RDF Schema는 RDF 데이터 모델로 표현된 문장의 해석을 위한 정보를 제공
(3) DAML+OIL - DARPA Agent Markup Language
- DAML은 웹 페이지에 존재하는 정보를 컴퓨터가 읽고 이해할 수 있도록 하기 위해서 XML 기술을 기반으로 고안된 의미론적 언어로서, 문맥 정의 언어(Context Definition Language)라고 정의
- DAML+OIL은 컴퓨터가 쉽게 읽을 수 있고, 쉽게 이해할 수 있도록 정보를 표시할 수 있으며, 온톨로지를 생성할 수 있음. 의미론적 웹(Web)을 만들고, 이를 프로그램이 자유롭게 사용하기 위해서는 DAML+OIL은 그 핵심 기술
(4) OWL

- Ontology web language
- 웹 온톨로지언어(이하 OWL)는 DAML+OIL에 기반한 차세대 온톨로지 구현 표준언어
- DAML+OIL을 기반으로 클래스(class)와 프로퍼티(property)의 개념 및 그들 사이의 관계가 보다 명료하게 정의되도록 정리한 온톨로지 언어

 

2) 온톨로지 구축

- 온톨로지 모델러 : DB를 참조하여 지식을 개념화, 개념화간의 계층적 구조를 위해 구분규칙을 적용
- 온톨로지 Generator : 온톨로지 모델러로부터 받은 용어에 명세화하고, 온톨로지 언어로 작성
- 온톨로지 Validator : 작성된 온톨로지의 유효성을 검사, 온톨로지 언어의 문법적인 검사

 

4. 온톨로지 기술 비교

1) 기존기술과 온톨로지 기반기술의 비교

항목 기존기술 온톨로지 기반기술
Data Modeling ER Model Ontological Model
Schema territory Syntax Semantics
Data Structure Table Graph
Data Element Tuple Triple
Storing, Managing DBMS KB (Triple Store)
Query Language SQL SparQL(F-Logic)
Processing
(Programming)
Procedure
(Java, C++)
Declarative
(Logic Programming)
Reasoning - T-Box, A-Box, Rule
Service Area Information Knowledge

2) 온톨로지와 검색서비스의 비교

구분 Ontology 기반검색 기존 검색 서비스
처리방식 내용 중심적인 처리 방식 패턴 매칭 처리 방식
추론여부 논리적인 추론 제공 논리적인 추론 거의 없음
추론 메커니즘 특정 도메인에 대한 용어별 관계 기술을 통한 추론 서비스가 가능함 광범위한 서비스로 인하여 추론을 하더라도 정확도가 떨어지므로 서비스가 불가능할. 오히려 혼란을 가중시킴

 

 

반응형

댓글