http://charsyam.wordpress.com/ -- cloud 관련 전문 개발자 블로그
AWS 장애로 부터 Netflix 가 배운 교훈(201207-06)
http://techblog.netflix.com/2012/07/lessons-netflix-learned-from-aws-storm.html
http://www.ddaily.co.kr/news/news_view.php?uid=92003
2012.6 정전발생 (North Vignia) → Heroku, Pinterst 등 8시간 장애
http://aws.amazon.com/message/67457/
2011.9 아일랜드 더블린, 번개로 인한 서비스 장애
2011.4 미국 동부지역, 데이터 복제 문제 발생 (EBS)
다양한 해외 의견들을 첨부합니다.
http://blog.cloudharmony.com/2011/04/unofficial-ec2-outage-postmortem-sky-is.html
http://justinsb.posterous.com/aws-down-why-the-sky-is-falling
http://status.heroku.com/incident/151
→ 서비스 인프라를
여러 곳에 분산시키는 멀티-클라우드 전략이 필요하다고 지적하고 있다
만약 퍼블릭 클라우드 환경에서 서버를 구축할 예정인 분들께서는 사전에 아래의 여섯 가지를 꼭 확인하고 고려하셔야 합니다.
1. 클라우드는 기존의 호스팅 환경보다는 상대적으로 안전하지만 대신 문제가 생기면 오히려 복구는 더 어렵고 오랜 시간이 필요하다.
2. 클라우드 장애에 대비해 물리적으로 복수의 장소에 다중화를 해둬야 한다.
3. 복수의 서버중 어느 한 곳이 죽더라도 시스템 자체가 죽지 않도록 설계한다.
4. 물리적으로 별개의 장소에 수시로 백업을 하도록 정책을 세워야 한다.
5. 문제가 생기면 최대한 빨리 다른 클라우드나 다른 서버로 라우팅을 돌릴 수 있도록 준비해두어야 한다.
6. 일단 사고가 나더라도 대부분의 경우 데이터는 안전하게 남거나 복구 가능하니 너무 패닉에 빠지지 않는다.
'Cloud Computing > Architecture' 카테고리의 다른 글
C10M connection problem - 1천만 동접 처리하기 (0) | 2013.05.20 |
---|---|
유명 회사의 대용량 처리 서버 기술 스택 (0) | 2013.04.17 |
WRITTEN BY
- manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform