텍스트 처리, 텍스트 마이닝, 의미 검색, 지식 마이닝 관련 기술 및 솔루션 기업인 솔트룩스(http://www.saltlux.com/)의 동영상인데,
(text mining, semantic search, knowledge mining)
관련 기술에 대한 이해를 돕는 자료가 됩니다.
솔트룩스의 시맨틱 웹 소개동영상 (시맨틱웹의 원리에 대한 설명)
- 시맨틱웹의 소개 (일반웹&시맨틱웹, 시맨틱웹정의, 강한시맨틱웹&약한시맨틱웹 )
- Ontology의 소개 (아리스토텔레스, 온톨로지정의, 온톨로지사례)
- Data Base와 Knowledge Base의 차이점 (구조의차이, 검색의차이)
- 시맨틱웹의 적용 (온톨로지 설계, KB 구축, 시맨틱 검색)
- 시맨틱웹의 미래 (문서&데이터, Linked Data, 지식소통)
동영상 #1 http://www.youtube.com/watch?v=6bXnI9zHImo
동영상 #2 http://www.youtube.com/watch?v=6q7q1tBqTZg (솔트룩스 김태현 부장 발표)
검색의 미래(Beyond the Search)
http://www.youtube.com/watch?v=_cDZ8-NKc_I (명승은 벤처스퀘어 대표)
http://www.youtube.com/watch?v=6e-ogxSrEuw 남상협 버즈니 대표 - 신뢰 기반의 의견 검색
빅데이타 관점에서는 아래와 같이 분류할 수 있습니다.
Big-Data 분류
① 정형 Data : 정의된 필드에 저장된 데이터 (시스템 로그, RDBMS, 제조 공정 로그 등)
② 반정형 Data : 스키마(schema)를 포함하는 데이터 (XML , HTML 등)
③ 비정형 Data : 형식 및 길이의 변수가 있는 데이터 (메일 본문, 텍스트, 이미지, 댓글 등)
Big-Data 분석 종류
기존의 분석 방법보다 복잡성과 데이터량의 방대함으로 인하여 유연성 있는 분석 기법이 적용되어야 한다.
① Text Mining
비정형 텍스트 데이터에서 가치와 의미를 찾아내는 기술이다.
자연어로 이루어진 텍스트에서 의미를 찾아내는 기술로 데이터 마이닝과 차별화 된 분석 기술이다.
② Option Mining
Text Mining, 자연어 처리, 비정형 분석, 형태소 분석등이 적용된다.
이는 SNS, 블로그 카페, 게시판 등 소비자의 의견을 분석하여
제품 개발, 서비스 향상 등 기업 활동에 도움되는 결과를 도출하는 기술이다.
③ Social Network Analytics
감성 분석이 대표적.
감성 분석은 소셜 네트워크에서 생성된 비정형 텍스트 데이터에서 감정을 파악.
SNS에서 내 영향력, 관심사, 성향 및 행동 패턴을 분석, 추출하는 기술.
④ Cluster Analysis
데이터 간의 유사도 및 친밀도(거리)를 분석.
계층적 기법과 비계층적 기법.
http://blog.naver.com/qrrmaa112?Redirect=Log&logNo=120173965001