Friday, April 29, 2011

Облачные грабли

Пришло время в очередной раз расширить классический словарь "граблей" понятием "облачных граблей". В действии эти грабли мы видели 21-22 апреля, когда лег Amazon EC2 и 26 апреля, когда хакнули игровую сеть Sony .

Облачные грабли характеризуются тем, что одновременно бьют по лбу широким слоям населения и тем самым вызывают серьезный общественный резонанс.

В проблемах у датацентров нет ничего нового. Это может быть пропадание электропитания (даже 2 фидера от 2 разных энергокомпаний могут отказать), сдохший от пыли свитч,  засбоившая карта, которая завалила кучей пакетов локальную сеть, ну и главная угроза, я бы сказал, антигерой информационных технологий - уборщица, которая выдернула "самый важный кабель".

Похоже, многие апологеты облачных технологий усилием воли удалили из своих рассуждений тот факт, что от появления приставки "облачный" проблемы с надежностью и безопасностью в датацентрах и работающих там приложениях не решаются.

Скорее наоборот, складывание яиц в одну корзину и централизация обработки приводит к эскалации проблем на всех клиентов, обслуживаемых данным "облаком"  - т.е. в случае поломки оборудования или проникновения в систему безопасности "облака" простои данных и потери от взлома мультиплицируются на всех "соседей по облаку".

Размышляя цинично (а именно так размышляют в Амазоне и всех облачных компаниях), ничего страшного в сбоях "публичных" облаков нет - SLA выполняется (SLA 99% означает 1% простоя в год - это 3 суток с половиной, да и невыполнение SLA приводит к ограниченной ответственности - в 99% клиентам просто добавят срок бесплатной подписки), клиенты хотели дешево  - получили дешево. Будет любопытно узнать данные об оттоке клиентуры с Амазона, но я бы поставил бутылку хорошего виски, что оттока не будет - у тамошней публики нет особых потребностей, а у Твиттера - особого выбора.

Другое дело - сбои в частных облаках. До меня доходили слухи, что есть проект свести всю ИТ-инфраструктуру медицинских учреждений Москвы в пару больших датацентров. Вне зависимости от SLA, в случае поломки центральной части инфраструктуры (роутера, кабельной системы), простой будет "оттранслирован" во все обслуживаемые учреждения. Хорошо, если дело ограничиться переносом планового приема пациентов на  другой день, а если хирурги не смогут загрузить из центрального хранилища снимки перед операцией?


Рассказывая страшилки, я не призываю к отказу от облаков, но осознавать границы их применимости и принимать необходимые меры - нужно.
Ведь доходит до смешного - люди покупают VPS в "облачных" IaaS, радостно развертывают там свои приложения (да пусть даже корпоративные сайты), но не интересуются бэкапами. А ведь в 99% случаях бэкап не включен в стандартный тариф VPS, а если включен - то бэкап образа ОС и дисков. А так как в 100% приложений используются СУБД в качестве бэкенда, то бэкап ОС и образа дисков с очень большой вероятностью будет содержать поломанную, "неконсистентную" копию БД.

Пугает, когда ИТ-технологии берут на вооружение не просто отдельные особо продвинутые бизнесы, получающие от такого внедрения [законную] экономию/прибыль, а чиновники от ИТ, которые начинают фактически навязывать новые ИТ-технологии в такие места, где прибыль и экономия не являются главными критериями успешности.

Все доброго здоровья и хороших праздников!

Update: В твиттере @demidov подсказал хорошую ссылку, развивающую тему.
Post a Comment