python 및 머신러닝 교육, 슬로우캠퍼스

http://schema.org


웹을 통한 서비스라는 것은  Database에 담겨 있는 데이타를 끄집어 내어, 그 데이타를 HTML 형태로 제공하는 것이다.   HTML은  데이타를 일반 사용자들의 컴퓨터(스마트폰) 화면 상에서 표현하기 위하여,  텍스트, 이미지, 영상의  크기, 위치, 색상 등을 지정하는 방법(언어)이다.  즉, HTML은 presentation의 방법이 된다.


이 Presentation의 과정에서 DB에 담긴 구조화된 데이타(Structured Data)는  비구조화된 데이타(Unstructured Data)로 변화된다. 이것을  컴퓨터 엔지니어 관점에서는 '데이타가 훼손된 것'이라고 표현할 만 하다.


이 훼손을 만회하기 위하여 RDF, semantic web 등의 기술이 예전부터 추진되어 왔으나, 현실 웹 세상에 별로 적용이 못 되고 있는 것 같다. 현실의 HTML 기술과 너무 괴리가 있기 때문일까.


schema.org는 div태그에 itemscope와  itemtype를 지정하여, HTML5의 규격 범위내에서 할 수 있는 수준이다. 이렇게 지정해주면 검색엔진(crawler)가 내 웹페이지의 데이타가 무엇인지, 어떤 타입인지 잘 이해할 수 있게 된다.




div itemscope itemtype="http://schema.org/Movie">
  <h1>Avatar</h1>
  <span>Director: James Cameron (born August 16, 1954)</span>
  <span>Science fiction</span>
  <a href="../movies/avatar-theatrical-trailer.html">Trailer</a>
</div>

Here's a set of commonly used item types:

You can also see a full list of all item types, listed on a single page.


WRITTEN BY
manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform

,