python 및 머신러닝 교육, 슬로우캠퍼스


http://charsyam.wordpress.com/  -- cloud 관련 전문 개발자 블로그


AWS 장애로 부터 Netflix 가 배운 교훈(201207-06)

http://techblog.netflix.com/2012/07/lessons-netflix-learned-from-aws-storm.html



http://www.ddaily.co.kr/news/news_view.php?uid=92003


2012.6 정전발생 (North Vignia) → Heroku, Pinterst  등 8시간 장애

http://aws.amazon.com/message/67457/


2011.9  아일랜드 더블린, 번개로 인한 서비스 장애

2011.4  미국 동부지역, 데이터 복제 문제 발생 (EBS)

다양한 해외 의견들을 첨부합니다.

http://blog.cloudharmony.com/2011/04/unofficial-ec2-outage-postmortem-sky-is.html

http://justinsb.posterous.com/aws-down-why-the-sky-is-falling

http://status.heroku.com/incident/151


→ 서비스 인프라를

여러 곳에 분산시키는 멀티-클라우드 전략이 필요하다고 지적하고 있다



만약 퍼블릭 클라우드 환경에서 서버를 구축할 예정인 분들께서는 사전에 아래의 여섯 가지를 꼭 확인하고 고려하셔야 합니다.


1. 클라우드는 기존의 호스팅 환경보다는 상대적으로 안전하지만 대신 문제가 생기면 오히려 복구는 더 어렵고 오랜 시간이 필요하다.


2. 클라우드 장애에 대비해 물리적으로 복수의 장소에 다중화를 해둬야 한다.


3. 복수의 서버중 어느 한 곳이 죽더라도 시스템 자체가 죽지 않도록 설계한다.


4. 물리적으로 별개의 장소에 수시로 백업을 하도록 정책을 세워야 한다.


5. 문제가 생기면 최대한 빨리 다른 클라우드나 다른 서버로 라우팅을 돌릴 수 있도록 준비해두어야 한다.


6. 일단 사고가 나더라도 대부분의 경우 데이터는 안전하게 남거나 복구 가능하니 너무 패닉에 빠지지 않는다.



WRITTEN BY
manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform

,