웹 기반의 대용량 서비스의 제공 시스템은 대부분 Web Server , RESTful API server, Cache Server, Database server, Work Queue server 등 여러 가지 성격의 서버군들이 복잡하게 (또는 계층적으로) 구성된 분산 시스템이다.
이러한 분산 서버 구조상에서 어떤 지점에서 문제가 발생하고, 성능의 병목(bottleneck)이 있는 trace하여
전체 시스템의 latency 및 성능을 향상하는 방안을 찾는 것이 중요하다.
더 나아가서는 어떤 지점이 fail하더라도 그 지점을 우회하고, 복구할 수 있는 방안을 마련하는 것도 필요하다.
Netflix - Netflix는 미국의 1등 VOD 서비스 회사. Video streaming이 중요함. 아마존 AWS를 많이 이용하고 있으며, CDN은 Akamai를 이용하였으나 자체 CDN에도 투자 중이다. 강한 개발 문화를 가진 것으로 보인다. 회사 사이트에서 Tech blog를 제공하고 있다.
Google Dapper - 대규모 분산시스템에서의 tracing에 대한 구글의 논문(2010). 이를 기반으로 twitter zipkin 이 개발 되었다. Goto google
Zipkin (Twitter, 2012.06) - is a distributed tracing system. This like a performance profiler, tracing tool for a distributed system. Goto Twitter Engineering Blog
blitz4j - is a highly scalable logging framework. log4j기반이며, scalability 및 대규모 처리를 강화한 것이다. Goto github
'Cloud Computing' 카테고리의 다른 글
대용량 처리 서버 솔루션 (G-WAN, NXWEB) (0) | 2013.03.15 |
---|---|
C10K Problem (kegel.com 원본 보관용) (0) | 2013.03.15 |
초간단 Redis 설치, 사용 (0) | 2013.03.13 |
fabric (0) | 2013.03.13 |
부하테스트 도구 및 (0) | 2013.02.26 |
WRITTEN BY
- manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform