python 및 머신러닝 교육, 슬로우캠퍼스


웹 기반의 대용량 서비스의 제공 시스템은 대부분 Web Server , RESTful API server, Cache Server, Database server, Work Queue server 등 여러 가지 성격의 서버군들이  복잡하게 (또는 계층적으로) 구성된 분산 시스템이다.


이러한 분산 서버 구조상에서 어떤 지점에서 문제가 발생하고, 성능의 병목(bottleneck)이 있는 trace하여 

전체 시스템의 latency 및 성능을 향상하는 방안을 찾는 것이 중요하다.

더 나아가서는 어떤 지점이 fail하더라도 그 지점을 우회하고, 복구할 수 있는 방안을 마련하는 것도 필요하다.



Netflix  - Netflix는 미국의 1등 VOD 서비스 회사. Video streaming이 중요함. 아마존 AWS를 많이 이용하고 있으며, CDN은 Akamai를 이용하였으나 자체 CDN에도 투자 중이다. 강한 개발 문화를 가진 것으로 보인다. 회사 사이트에서 Tech blog를 제공하고 있다.


Chaos Monkey (Netflix, 2012.17)  - Netflix에서 개발하여 2012년 7월에 공개한 것이다. 미친 원숭이가 가위를 들고 IDC에 난입하여 LAN선과 Power선을 무작위로 자르고 있는 것과 같은 상황을 AWS 인프라 상에서 simulation하는 것이다. 한마디로 Resiliency Test Tool 이다.   Goto Netflix Tech Blog     
Chaos Monkey를 두고 일할 회사는 과연 있을까 - Goto article

Hystrix (Netflix, 2012.11)  - Netflix에서 개발하여 내부에서 사용하던 것으로, 2012년 11월에 공개하였다.  Goto Netflix Tech Blog 


Google Dapper - 대규모 분산시스템에서의 tracing에 대한 구글의 논문(2010). 이를 기반으로 twitter zipkin 이 개발 되었다.  Goto google 


Zipkin (Twitter, 2012.06)  - is a distributed tracing system. This like a performance profiler, tracing tool for a distributed system. Goto Twitter Engineering Blog 


blitz4j  - is a highly scalable logging framework.  log4j기반이며, scalability 및 대규모 처리를 강화한 것이다. Goto github 



 



Angry-monkey-family-guy


'Cloud Computing' 카테고리의 다른 글

대용량 처리 서버 솔루션 (G-WAN, NXWEB)  (0) 2013.03.15
C10K Problem (kegel.com 원본 보관용)  (0) 2013.03.15
초간단 Redis 설치, 사용  (0) 2013.03.13
fabric  (0) 2013.03.13
부하테스트 도구 및  (0) 2013.02.26

WRITTEN BY
manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform

,