웹을 통한 서비스라는 것은 Database에 담겨 있는 데이타를 끄집어 내어, 그 데이타를 HTML 형태로 제공하는 것이다. HTML은 데이타를 일반 사용자들의 컴퓨터(스마트폰) 화면 상에서 표현하기 위하여, 텍스트, 이미지, 영상의 크기, 위치, 색상 등을 지정하는 방법(언어)이다. 즉, HTML은 presentation의 방법이 된다.
이 Presentation의 과정에서 DB에 담긴 구조화된 데이타(Structured Data)는 비구조화된 데이타(Unstructured Data)로 변화된다. 이것을 컴퓨터 엔지니어 관점에서는 '데이타가 훼손된 것'이라고 표현할 만 하다.
이 훼손을 만회하기 위하여 RDF, semantic web 등의 기술이 예전부터 추진되어 왔으나, 현실 웹 세상에 별로 적용이 못 되고 있는 것 같다. 현실의 HTML 기술과 너무 괴리가 있기 때문일까.
schema.org는 div태그에 itemscope와 itemtype를 지정하여, HTML5의 규격 범위내에서 할 수 있는 수준이다. 이렇게 지정해주면 검색엔진(crawler)가 내 웹페이지의 데이타가 무엇인지, 어떤 타입인지 잘 이해할 수 있게 된다.
div itemscope itemtype="http://schema.org/Movie"> <h1>Avatar</h1> <span>Director: James Cameron (born August 16, 1954)</span> <span>Science fiction</span> <a href="../movies/avatar-theatrical-trailer.html">Trailer</a> </div>
Here's a set of commonly used item types:
- Creative works: CreativeWork, Book, Movie, MusicRecording, Recipe, TVSeries ...
- Embedded non-text objects: AudioObject, ImageObject, VideoObject
- Event
- Organization
- Person
- Place, LocalBusiness, Restaurant ...
- Product, Offer, AggregateOffer
- Review, AggregateRating
You can also see a full list of all item types, listed on a single page.
'Data/Text/Knowledge Analysis & Mining' 카테고리의 다른 글
Data Visualization - javascript (0) | 2013.08.15 |
---|---|
문서 분류 (0) | 2013.08.12 |
데이타 분석, 마이닝 관련 책 (1) | 2013.07.29 |
지식 검색, 마이닝, ontology 설명 동영상 (0) | 2013.07.28 |
Zoom 과 Naver 검색: 개인화 서비스는 성공할까 (0) | 2013.07.26 |
WRITTEN BY
- manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform
,