- 설명 http://dbpedia.org/Downloads38
- 덤프 파일 목록 http://downloads.dbpedia.org/3.8/en/
- 덤프 파일에는 .nt, .nq, .ttl 이 있다.
- .nt, .nq는 URI를 사용
- .ttl는 IRI를 사용 (파일 크기가 더 작다)
contents-ttl.txt 파일은 wget으로 다운로드
$ wget http://downloads.dbpedia.org/3.8/en/contents-ttl.txt
모든 ttl 다운받기, 압축 풀기 스크립트
for url in `cat contents-ttl.txt`
do
echo $url
f=`basename $url`
echo $f
wget $url
bunzip2 $f
done
중요 파일들
category_labels_en.ttl disambiguations_en.ttl geo_coordinates_en.ttl images_en.ttl instance_types_en.ttl interlanguage_links_en.ttl persondata_en.ttl topical_concepts_en.ttl
- http://dbpedia.org/fct/ - Faceted Search
- http://dbpedia.org/sparql - Virtuoso SPARQL Query Editor
- http://virtuoso.openlinksw.com/ Linked Data Server
'Data/Text/Knowledge Analysis & Mining' 카테고리의 다른 글
Crawler 운영 관리 도구 (0) | 2013.07.11 |
---|---|
DBPedia ontology (0) | 2013.07.11 |
추천 관련 좋은 강의자료 (0) | 2013.04.15 |
python 기반 과학,공학,데이타 분석 도구 (0) | 2013.03.20 |
Web mining, Visualization (0) | 2013.03.13 |
WRITTEN BY
- manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform
,