Гостиная AggreGroup: Дождаться революции. Анализируем вектор развития систем хранения данных вместе с DataCore

Сегмент систем хранения данных, кажется, остался в стороне от стремительного прогресса в развитии подходов и технологий. Ведущие аналитические компании констатируют кризис в сегменте СХД. Чтобы его преодолеть, требуется настоящая технологическая революция. Она, впрочем, не торопится наступать. И тем самым вынуждает корпорации тратить все больше на содержание данных, объемы которых увеличиваются по экспоненте.


Выход есть. Программно-определяемые хранилища (software-defined storage, или SDS) — хороший способ перестать атаковать проблему с “хранилками” в лоб. Это важный шаг в сторону, который поможет огромному числу организаций избавиться от “вендорозависимости”, по-умному распределить дисковые ресурсы и таки дождаться революции в хранении данных. В гостиной AggreGroup — Антон Иванов, региональный представитель DataCore в России и СНГ.


Антон, привет. Я много читал про проблему, обусловленную отсутствием явного прогресса в развитии. Например, исследователи IDC говорят, что рынок СХД находится в кризисе. Неужели все так плохо? И что нужно, чтобы из него выбраться?


Они несколько драматизируют, но вызовы для производителей и эксплуатантов СХД очевидны. Человечество создает больше данных чем способно хранить, даже с учетом развития технологий хранения. Для корпоративного сегмента этот вызов стоит особенно остро: объемы данных, которые надо как-то хранить, у некоторых компаний растет по экспоненте.


Запрос на революцию в СХД созрел уже давно. Исследователи пробуют разные варианты — от разработок в области голографической памяти до хранения данных внутри молекул ДНК. Впрочем, экзотические способы пока далеки от массового применения. Сейчас доминируют традиционные системы хранения - дисковые массивы.


Обычно такие массивы живут от 3 до 5 лет, после чего они достигают своего предела по производительности, емкости, либо по функциональности. Их предлагается заменить на новый еще более мощный и емкий массив, а старый просто списать и выкинуть. Просто развернуть новый массив рядом со старым можно, но вряд ли оправданно. Подружить их не получится — вендор запрещает это делать. Вот и получается, что заказчики регулярно тратят деньги либо на обновление “хранилок”, либо на поддержку целого “зоопарка” СХД. И тот, и другой вариант повышают себестоимость хранения каждой единицы данных. Только первый повышает напрямую, а второй — опосредованно, через увеличение стоимости владения инфраструктурой.


На помощь заказчикам приходит технология программно-определяемых хранилищ (software-defined storage, или SDS). Решения SDS помогают создавать виртуальные СХД, подключит к себе разнообразные дисковые ресурсы, и будет динамически распределять данные по этим ресурсам исходя из текущих потребностей организации.


При этом DataCore и другие SDS-решения не превращают клиента в заложника производителей оборудования. Они легко присоединяют к виртуальной “хранилке” старые и новые дисковые массивы. А возможность управлять массивами дает заказчику возможность по своему усмотрению распоряжаться имеющимся дисковым пространством. Например, использовать быструю память серверных SSD для функционирования бизнес-критичных информационных систем, а медленные жесткие диски — для хранения архивов данных, к которым не требуется быстрый доступ. Не особо преувеличу, если скажу: на нынешнем этапе развития технологий SDS — наиболее интеллектуальный способ хранения данных в корпоративном сегменте.


В каких сценариях SDS работает наилучшим образом?


Прежде чем ответить на этот вопрос, следует пояснить, что у каждого производителя свое определение SDS. У DataCore оно простое: если вы можете скачать нечто, что возьмет под управление все ваши дисковые массивы, перед вами определенно SDS. Если речь о ПО, которое может работать только в определенных платформах, на определенных компонентах от определенного производителя, это уже не SDS. Скорее, обычный программно-аппаратных комплекс, который продается по частям. DataCore - это именно ПО, позволяющее работать на любых платформах с любыми системами хранения от любых производителей. Такая всеядность делает DataCore “универсальными солдатом”. И помогает решать широкий круг задач. Например, SDS отлично работает при консолидации дискового пространства, когда требуется создать единую “хранилку”, используя мощности разных единиц оборудования. Либо когда следует провести аудит ресурсов и перераспределить их для повышения доступности данных, особенно при создании растянутых кластеров. Хорошо себя показывает SDS в задачах повышения производительности, особенно в окружениях с большим числом серверов и виртуальных машин (например DevOps). DataCore может также вдохнуть новую жизнь в старые дисковые системы, снабдив их новыми функциональными возможностями и новыми интерфейсами.

 

DevOps, микросервисы и контейнеры сейчас на хайпе. Как именно SDS поддержит новый подход к разработке ПО?


У использовании SDS для реализации концепции DevOps есть две стороны - концептуальная и техническая. При переходе на DevOps задача управления СХД смещается на разработчиков. Именно программисты, а не системные администраторы, начинают отвечать за предоставление дисковых ресурсов приложениям. Программисты не хотят, чтобы работа с СХД была сложной. Им нужно, чтобы инфраструктура была простой, масштабируемой и самоисцеляющейся. Тут DataCore SDS выступает как оркестратор - сама распределяет данные между разными дисковыми ресурсами, сама добавляет новые ресурсы в общий дисковый пул, сама занимается восстановлением после сбоев.


Также у DataCore есть ряд особенностей, которые делают этот продукт особенно полезным в окружениях DevOps. Виртуальные и контейнерные среды имеют две характерные черты, которые очень плохо влияют на производительность - это "эффект блендера" и "шумный сосед".


Что это такое?


“Эффект блендера” случается, когда множество нагрузок с разнообразными профилями встречаются на общей “хранилке”. У разных информационных систем разное соотношение операций чтения и записи, случайных и последовательных, с разным размером блоков. Типовой СХД очень сложно с таким справится, а для DataCore за счет технологии Parallel IO это естественная нагрузка. Высокоэффективный планировщик ввода-вывода использует мощь современных многоядерных процессоров в паре с оперативной памятью для параллельной обработки ввода-вывода.


“Шумный сосед" — это ситуация, когда одна нагрузка (виртуальная машина, контейнер или физический сервер) забирает на себя львиную долю производительности и не оставляет запаса для других. Для решения этой проблемы DataCore предоставляет эффективный механизм обеспечения качеств услуг (Quality of Service - QoS), позволяющий ограничивать нагрузки в потребляемых ресурсах.


Клиенты нередко рассматривают SDS как альтернативу отдельно стоящим СХД. И для перестраховки задают вопрос: может ли DataCore заменить “хранилку”? Или это решение, которое упорядочивает дисковые ресурсы? Поясни, как это работает.


Да, обойтись без покупки отдельной СХД можно в двух из трех типовых сценариев работы SDS — в конвергентном и гиперконвергентном. В обоих случаях для организации виртуальной СХД используются серверные жесткие диски или SSD. Наше решение создает полноценную виртуальную систему хранения данных всего из двух серверов. Если задачи заказчика не требует экстраординарных объемов, “хранилку” можно не покупать. Третий сценарий — когда СХД уже есть — также легко реализуем: ничто не мешает присоединить “хранилку” к виртуальному пулу ресурсов. Не станет препятствием, если на серверах у вас установлены SSD, а “хранилка” сформирована на основе не самых быстрых жестких дисков. DataCore оптимизирует данные даже в рамках гетерогенной системы хранения и повысит ее производительность.

 

Ты упоминал, что производители СХД фактически “берут клиентов в плен”. Поясни, почему брендозависимость в СХД - это минус прежде всего для заказчиков?


Система хранения — довольно "тяжелый" элемент инфраструктуры. В отличие от серверов, замена которых — сравнительно простое дело, переезд на новую СХД сложна и порой связана с необходимостью прерывать бизнес. Представьте, сколько нужно времени, чтобы перенести несколько петабайт (или сотни терабайт) данных с одной СХД на другую. А после переноса еще перенаправить туда серверы и перенастроить инфраструктурные службы, в числе которых мониторинг, резервное копирование и многие другие.


Отдельно стоящая СХД — на самом деле бизнес-критичный элемент инфраструктуры. Вендоры этим пользуются и загонят заказчика в жесткие условия. Кроме инвестиций в саму “железку” они настоятельно рекомендуют купить план поддержки системы. И тщательно следят, чтобы заказчик расширял возможности СХД можно только определенным набором дорогостоящих компонентов. Также клиенты зависят от жизненного цикла СХД конкретного вендора и от “дорожной карты” развития направления систем хранения конкретного вендора в целом. То есть, если вендор А наконец осуществит технологический прорыв и предложит рынку голографическую память, быстро перейти к нему у заказчика, использующего решения вендора Б, получится только путем полного отказа от оборудования и услуг поддержки. Фактически предстоит начинать с чистого листа.

  

Какие вызовы для ДИТов несет с собой применение SDS? Есть ли лучшие практики, позволяющие использовать возможности программно-определяемых систем хранения наилучшим образом?


Главный вызов для ДИТов - это захотеть перейти на новую парадигму. Отказываться от привычной практики приобретения аппаратных массивов довольно тяжело. Но в этом плане у SDS есть очевидное преимущество — DataCore и другие аналогичные решения его очень просто попробовать. Достаточно просто скачать дистрибутив, развернуть его на инфраструктуре и начать пользоваться, чтобы составить о нем собственное мнение.


Внедрение SDS во многом схоже с внедрением виртуализации. Когда только появилась общедоступная технология серверной виртуализации в виде VMware Virtual Infrastructure 3, к ней относились скептически. Виртуализация распространялась постепенно. Сначала заказчики виртуализировали неприоритетные сервисы, среды разработки и тестирования. По мере того, как ДИТы набирались опыта и учились доверять технологии, в виртуальную среду переносилось все больше и больше ИТ-сервисов, в том числе и систем Tier 1, таких как критические СУБД, ERP и прочие системы. Теперь редкое предприятие не использует системы серверной виртуализации. Такой же путь предстоит пройти решениям SDS. Можно начинать с малого, а постепенно отдавать под управления SDS все больше пространства и ИТ-систем.


Удаленка — тренд 2020 года, который, я думаю, отправится с нами в год 2021-й. Для многих компаний удаленка стала в том числе технологическим вызовом. Например, мы по запросу заказчиков дорабатывали инфраструктуру, чтобы она лучше соответствовала характеру удаленной работы. Можно ли назвать SDS решением, которая повышает эффективность функционирования компаний на удаленке?


Карантин действительно внес радикальные изменения в профиль нагрузки на корпоративную инфраструктуру. Значительно выросло использование порталов, систем удаленного доступа, файлообменников и т.д. В обычных условиях, компании поднимали производительность за счет приобретения новых "железок", но сейчас картина изменилась, и купить новое оборудование от нужного производителя стало не так просто из-за закрытых границ и скачков спроса. При использовании SDS ИТ-специалисты могут “на лету” подстраивать инфраструктуру под изменения характера нагрузки. Фиксируешь повышенную нагрузку на портал? Выдели порталу дополнительное пространство на быстрых SSD. Нагрузка упала? Портал можно отправить на шпиндельные системы, освободив быструю флеш-память для другой нагрузки. Пользователи стали чаще сохранять записи вебинаров и онлайн-встреч?  Расширяй хранилища за счет компонентов, которые есть на складе. Словом, SDS — это решение про инфраструктуру для бизнеса, а не про бизнес для инфраструктуры.


Антон, спасибо что заглянул в “Гостиную AggreGroup”, мне кажется, что у нас получился очень полезный и интересный разговор!