python 및 머신러닝 교육, 슬로우캠퍼스


텍스트 처리, 텍스트 마이닝, 의미 검색, 지식 마이닝 관련 기술 및 솔루션 기업인 솔트룩스(http://www.saltlux.com/)의 동영상인데,

(text mining, semantic search, knowledge mining)


관련 기술에 대한 이해를 돕는 자료가 됩니다.



 솔트룩스의 시맨틱 웹 소개동영상 (시맨틱웹의 원리에 대한 설명)
- 시맨틱웹의 소개 (일반웹&시맨틱웹, 시맨틱웹정의, 강한시맨틱웹&약한시맨틱웹 )
- Ontology의 소개 (아리스토텔레스, 온톨로지정의, 온톨로지사례)
- Data Base와 Knowledge Base의 차이점 (구조의차이, 검색의차이)
- 시맨틱웹의 적용 (온톨로지 설계, KB 구축, 시맨틱 검색)
- 시맨틱웹의 미래 (문서&데이터, Linked Data, 지식소통)


동영상 #1 http://www.youtube.com/watch?v=6bXnI9zHImo

동영상 #2 http://www.youtube.com/watch?v=6q7q1tBqTZg  (솔트룩스 김태현 부장 발표)









검색의 미래(Beyond the Search)

http://www.youtube.com/watch?v=_cDZ8-NKc_I   (명승은 벤처스퀘어 대표)



http://www.youtube.com/watch?v=6e-ogxSrEuw  남상협 버즈니 대표 - 신뢰 기반의 의견 검색




빅데이타 관점에서는 아래와 같이 분류할 수 있습니다.


Big-Data 분류 

① 정형 Data : 정의된 필드에 저장된 데이터 (시스템 로그, RDBMS, 제조 공정 로그 등) 

② 반정형 Data : 스키마(schema)를 포함하는 데이터 (XML , HTML ) 

③ 비정형 Data : 형식 및 길이의 변수가 있는 데이터 (메일 본문텍스트이미지댓글 등) 

 

Big-Data 분석 종류 

기존의 분석 방법보다 복잡성과 데이터량의 방대함으로 인하여 유연성 있는 분석 기법이 적용되어야 한다. 

① Text Mining 

비정형 텍스트 데이터에서 가치와 의미를 찾아내는 기술이다. 

자연어로 이루어진 텍스트에서 의미를 찾아내는 기술로 데이터 마이닝과 차별화 된 분석 기술이다. 

② Option Mining 

Text Mining, 자연어 처리비정형 분석형태소 분석등이 적용된다. 

이는 SNS, 블로그 카페게시판 등 소비자의 의견을 분석하여 

제품 개발서비스 향상  기업 활동에 도움되는 결과를 도출하는 기술이다.  

③ Social Network Analytics 

감성 분석이 대표적. 

감성 분석은 소셜 네트워크에서 생성된 비정형 텍스트 데이터에서 감정을 파악. 

           SNS에서 내 영향력관심사성향 및 행동 패턴을 분석, 추출하는 기술.

④ Cluster Analysis 

데이터 간의 유사도 및 친밀도(거리)를 분석. 

계층적 기법과 비계층적 기법. 



http://blog.naver.com/qrrmaa112?Redirect=Log&logNo=120173965001



WRITTEN BY
manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform

,