python 및 머신러닝 교육, 슬로우캠퍼스

웹페이지를 검색엔진에게 설명해주기 - schema.org

Data/Text/Knowledge Analysis & Mining 2013. 8. 2. 15:34

share this post

웹을 통한 서비스라는 것은 Database에 담겨 있는 데이타를 끄집어 내어, 그 데이타를 HTML 형태로 제공하는 것이다. HTML은 데이타를 일반 사용자들의 컴퓨터(스마트폰) 화면 상에서 표현하기 위하여, 텍스트, 이미지, 영상의 크기, 위치, 색상 등을 지정하는 방법(언어)이다. 즉, HTML은 presentation의 방법이 된다.

이 Presentation의 과정에서 DB에 담긴 구조화된 데이타(Structured Data)는 비구조화된 데이타(Unstructured Data)로 변화된다. 이것을 컴퓨터 엔지니어 관점에서는 '데이타가 훼손된 것'이라고 표현할 만 하다.

이 훼손을 만회하기 위하여 RDF, semantic web 등의 기술이 예전부터 추진되어 왔으나, 현실 웹 세상에 별로 적용이 못 되고 있는 것 같다. 현실의 HTML 기술과 너무 괴리가 있기 때문일까.

schema.org는 div태그에 itemscope와 itemtype를 지정하여, HTML5의 규격 범위내에서 할 수 있는 수준이다. 이렇게 지정해주면 검색엔진(crawler)가 내 웹페이지의 데이타가 무엇인지, 어떤 타입인지 잘 이해할 수 있게 된다.

div itemscope itemtype="http://schema.org/Movie">
  <h1>Avatar</h1>
  <span>Director: James Cameron (born August 16, 1954)</span>
  <span>Science fiction</span>
  <a href="../movies/avatar-theatrical-trailer.html">Trailer</a>
</div>

Here's a set of commonly used item types:

Creative works: CreativeWork, Book, Movie, MusicRecording, Recipe, TVSeries ...
Embedded non-text objects: AudioObject, ImageObject, VideoObject
Event
Organization
Person
Place, LocalBusiness, Restaurant ...
Product, Offer, AggregateOffer
Review, AggregateRating

You can also see a full list of all item types, listed on a single page.

저작자표시 비영리 변경금지 (새창열림)

'Data/Text/Knowledge Analysis & Mining' 카테고리의 다른 글

Data Visualization - javascript (0)	2013.08.15
문서 분류 (0)	2013.08.12
데이타 분석, 마이닝 관련 책 (1)	2013.07.29
지식 검색, 마이닝, ontology 설명 동영상 (0)	2013.07.28
Zoom 과 Naver 검색: 개인화 서비스는 성공할까 (0)	2013.07.26

WRITTEN BY

: manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform

python 및 머신러닝 교육, 슬로우캠퍼스

웹페이지를 검색엔진에게 설명해주기 - schema.org

'Data/Text/Knowledge Analysis & Mining' 카테고리의 다른 글

티스토리툴바