'Cloud Computing/Architecture'에 해당하는 글 3건

python 및 머신러닝 교육, 슬로우캠퍼스


http://charsyam.wordpress.com/  -- cloud 관련 전문 개발자 블로그


AWS 장애로 부터 Netflix 가 배운 교훈(201207-06)

http://techblog.netflix.com/2012/07/lessons-netflix-learned-from-aws-storm.html



http://www.ddaily.co.kr/news/news_view.php?uid=92003


2012.6 정전발생 (North Vignia) → Heroku, Pinterst  등 8시간 장애

http://aws.amazon.com/message/67457/


2011.9  아일랜드 더블린, 번개로 인한 서비스 장애

2011.4  미국 동부지역, 데이터 복제 문제 발생 (EBS)

다양한 해외 의견들을 첨부합니다.

http://blog.cloudharmony.com/2011/04/unofficial-ec2-outage-postmortem-sky-is.html

http://justinsb.posterous.com/aws-down-why-the-sky-is-falling

http://status.heroku.com/incident/151


→ 서비스 인프라를

여러 곳에 분산시키는 멀티-클라우드 전략이 필요하다고 지적하고 있다



만약 퍼블릭 클라우드 환경에서 서버를 구축할 예정인 분들께서는 사전에 아래의 여섯 가지를 꼭 확인하고 고려하셔야 합니다.


1. 클라우드는 기존의 호스팅 환경보다는 상대적으로 안전하지만 대신 문제가 생기면 오히려 복구는 더 어렵고 오랜 시간이 필요하다.


2. 클라우드 장애에 대비해 물리적으로 복수의 장소에 다중화를 해둬야 한다.


3. 복수의 서버중 어느 한 곳이 죽더라도 시스템 자체가 죽지 않도록 설계한다.


4. 물리적으로 별개의 장소에 수시로 백업을 하도록 정책을 세워야 한다.


5. 문제가 생기면 최대한 빨리 다른 클라우드나 다른 서버로 라우팅을 돌릴 수 있도록 준비해두어야 한다.


6. 일단 사고가 나더라도 대부분의 경우 데이터는 안전하게 남거나 복구 가능하니 너무 패닉에 빠지지 않는다.



WRITTEN BY
manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform

,

python 및 머신러닝 교육, 슬로우캠퍼스



C10K problem은 10여년 전의 도전과제였다. thread 및 process 기반의 방식 (예, Apache )에서 event-driven 방식으로 (예, nginx, node.js ) 변화하면서 C10K 문제를 풀 수 있었다.


아래의 글은 C10M problem을 풀기 위해서는 unix 에게 맡겨온 thread관리, IO관리, memory 접근관리를 application에서 직접 해야 한다는 요지이다.


우리가 배운 Richard Stevens의 책은 unix에 대한 내용 및 의존성이 높아서, 'network programming'을 배운 것이 아니라, unix를 배운 것이라는 코멘트가 와 닿는다.


C10M problem을 위해 device driver도 개발 필요하다고 하니, 거의 전용 OS를 만드는 수준으로 보인다. 60년도 넘은 unix를 대체할 새로운 도약이 필요하다는 댓글도 보인다.


http://highscalability.com/blog/2013/5/13/the-secret-to-10-million-concurrent-connections-the-kernel-i.html

'Cloud Computing > Architecture' 카테고리의 다른 글

아마존 AWS 장애 사례  (0) 2013.07.25
유명 회사의 대용량 처리 서버 기술 스택  (0) 2013.04.17

WRITTEN BY
manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform

,

python 및 머신러닝 교육, 슬로우캠퍼스

-- from xguru (http://xguru.net/1268)


'Cloud Computing > Architecture' 카테고리의 다른 글

아마존 AWS 장애 사례  (0) 2013.07.25
C10M connection problem - 1천만 동접 처리하기  (0) 2013.05.20

WRITTEN BY
manager@
Data Analysis, Text/Knowledge Mining, Python, Cloud Computing, Platform

,