python 및 머신러닝 교육, 슬로우캠퍼스











온톨로지는 전산학과 정보 과학에서, 특정한 영역을 표현하는 데이터 모델로서 특정한 영역(Domain)에 속하는 개념과, 개념 사이의 관계를 기술하는 정형(Formal) 어휘의 집합으로 정의된다. 예를 들어 "종-속-과-목-강-문-계"로 분류되는 생물과 생물 사이의 종의 관계, 영어 단어 사이의 관계 같은 것을 정형 어휘로 기술하면 각각 온톨로지라고 할 수 있다. 정형 언어(Formal Language)로 기술된 어휘의 집합인 온톨로지는 추론(Reasoning, Inference)을 하는 데에 사용된다. 웹의 등장은 전통적인 정보검색을 비롯하여 지식관리와 일반 상거래 등 사회 전 분야의 변혁을 초래하였다. 특히 웹 정보 검색은 소장 자료를 대상으로 하는 제한된 검색에서 웹을 통해 접근할 수 있는 전자자원을 대상으로 하는 검색을 가능하게 하였다. 웹의 급속한 발달로 인해 검색 대상 범위의 확대는 보다 정교한 검색을 필요로 하게 되었으며, 지능화된 정보 검색 시스템 개발을 촉진하는 계기가 되었다. 이런 계기를 바탕으로 웹자원을 효과적으로 관리할 수 있는 정보 검색의 새로운 도구의 필요성이 대두되었다. 온톨로지는 시맨틱 웹을 구현할 수 있는 도구로써 지식개념을 의미적으로 연결할 수 있는 도구이다.

온톨로지는 자연어의 기계 번역과 인공지능 분야에서 활용되며, 최근에는 특정 분야의 인터넷 자원과 그 사이의 관계를 기술하는 온톨로지를 사용하는 시맨틱 웹과 이것에서 파생된 시맨틱 웹 서비스 등의 핵심 요소로서 주목받고 있다.

주로 인용되는 온톨로지에 대한 정의는 '어떤 관심 분야를 개념화하기 위해 명시적으로 정형화한 명세서 (An ontology is an explicit and formal specification of a conceptualisation of a domain of interest. (c.f. Tom Gruber, 1993)' 이다. 즉, 각 사물에서 공통점을 찾아내고 이를 하나의 집합 또는 범주로 나타내기 위해 의미, 지식의 쓰임새 등을 분명하고 자세하게 설명하는 것을 말한다. 또 Borst는 온톨로지를 '공유된 개념의 정형화된 명세이다. (Ontologies are defined as a formal specification of a shared conceptualization.)'라고 정의하고 있다. 앞의 정의에 '공유'의 개념이 추가되었는데, 이는 하나의 잘 정의된 개념을 각 분야에서 공통적으로 사용한다는 의미로 볼 수 있다.







택소노미와 폭소노미의 비교
 
1) taxonomy
 ‘분류하다’라는 ‘tassein’과 ‘법, 과학’이라는 ‘nomos’의 합성으로 어원은 그리스어이다. 원래는 어원 그대로 살아있는 유기체를 분류하는 과학이란 뜻이지만, 지금은 확장된 의미로서 살아있는 것 뿐만 아니라 무생물, 장소, 사건 등 모든 것을 택소노미 스키마(taxonomy schema)로 분류한 것이 택소노미다. 

특히, 택소노미 (taxonomy)는 이미 결정된 체계를 가지고 있으며, 관계형 네트워크 구조 보다는 트리형의 위계적 구조로 나타난다. 예를 들면, 포탈이나 웹 사이트에서 카테고리 구조나 사이트 맵은 텍소노미로 데이터를 조직한 것이다. 


관련 사이트



2) 폭소노미 (Folksonomy)
Folk(people)+order+nomos(law)의 합성어로 ‘사람들에 의한 분류법’이다. 실제 인터넷 유저들은 자유롭게 개별 정보(웹 페이지, 사진, 웹 링크 등)에 의미를 부여하여 카테고리로 정보들을 체계화한다. 각자 분류된 정보들은 웹에서 다른 사람들의 피드백에 의해서 수정되고 첨가된다. 이런 과정에 의해 정확하게 의미를 전달 할 수 있는 가치 있는 정보가 되는 것이다. 따라서 폭소노미는 협동적으로 이루어지고, 확장 가능한 라벨링 시스템이다. 

흔히 태그(tag)라고 불리는 라벨은 검색을 효과적으로 만든다. 왜냐하면 콘텐츠들은 여러 사람들에 의해 가장 일반적이고, 쉽게 접근 가능하며, 공유하기 쉬운 단어들로 이름이 부여되기 때문이다. 이런 라벨링 과정을 태깅(tagging)이라고 한다. 

폭소노미는 대표적인 예로 Flickr와 Del.icio.us를 생각해 볼 수 있다. 

< 폭소노미의 이점 >
  • 폭소노미는 택소노미(taxonomy)에 비해 체계적이지 않다. 인터넷의 유저들은 폭소노미 체계를 배워서 만드는 것이 아니라 더 편하고 유용하게 체계를 만들어가는 것이기 때문이다. 그래서 완벽한 분류 체계를 배울 필요가 없기 때문에 콘텐츠를 카테고리하는 비용이 절감될 수 있다. 
  • 폭소노미는 확장 가능하고, 유저들이 인터넷 카테고리를 하는 방식에 따라 빠르게 변화할 수 있다. 
  • 폭소노미는 사람들의 상호작용이 모인 결과이기 때문에 검색에서 적합성을 발휘한다.



관련 사이트

자료출처 : 코리아인터넷닷컴


'Data/Text/Knowledge Analysis & Mining' 카테고리의 다른 글

한글 및 한국어 정보처리 학술대회  (0) 2013.07.15
Web Science (웹 사이언스, KAIST)  (0) 2013.07.15
Freebase  (0) 2013.07.11
Crawler 운영 관리 도구  (0) 2013.07.11
DBPedia ontology  (0) 2013.07.11

WRITTEN BY
manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform

,