Ж у р н а л   о   к о м п ь ю т е р н ы х   с е т я х   и   т е л е к о м м у н и к а ц и о н н ы х   т е х н о л о г и я х
СЕТИ И СИСТЕМЫ СВЯЗИ on-line
  ПОИСК: ПОДПИСКА НА НОВОСТИ: НОМЕР:
    ДОМОЙ • Архив: Новостей | Конференций | НомеровПодписка
 
   
 
   
    
РЕДАКЦИЯ
 
Все о журнале
Подписка
Как проехать
Где купить
Отдел рекламы
График выхода журнала
Адреса в Интернет

РУБРИКАТОР
   
• Инфраструктура
• Информационные
   системы

• Сети связи
• Защита данных
• Кабельные системы
• Бизнес
• Колонка редактора
• Электронная
   коммерция

• Только на сервере
• Системы
   учрежденческой
   связи

• Новые продукты


Rambler's Top100

  

Непрерывная защита данных

Говард Маркс

Имея резервные копии данных, выполненные от 12 до 48 часов назад, невозможно восстановить ход бизнес-процесса с той стадии, на которой он был прерван в результате сбоя. Защищайте свои данные непрерывно.

Используемые сегодня технологии резервирования данных шагнули далеко вперед по сравнению с когда-то применявшимся копированием на 9-дорожечную ленту. Однако политики резервного копирования, реализуемые многими компаниями, не соответствуют специфике работы онлайновых приложений реального времени, от которых всецело зависит сегодняшний бизнес.

Чтобы защитить базу данных с ежечасно сохраняемыми результатами сотен клиентских транзакций, уже недостаточно лишь регулярного еженощного резервного копирования, — для этого требуется непрерывная защита данных (Continuous Data Protection — CDP). Средства CDP, не являющиеся альтернативой традиционным системам резервного копирования информации, сохранят немало ваших нервных клеток, если ваша ИТ-система с высокой интенсивностью трафика вдруг выйдет из строя.

Компании, хотя и медленно, принимают концепцию CDP на вооружение. В ходе опроса читателей, проведенного нами при подготовке данной статьи, 40% респондентов ответили, что средства CDP уже внедрены или будут внедрены в их компаниях в ближайшие 12 месяцев. 41% респондентов не планируют внедрения этих средств, а 19% предполагают внедрить их в течение 24 месяцев.

Итак, каково же предназначение технологии CDP в рамках ИТ-стратегии предприятия? Всесторонняя политика защиты данных призвана решать три основные задачи. Во-первых, защищать данные приложений, которые генерируют их и управляют ими, — как правило, это делается путем создания резервных копий. Если данные оказались испорченными каким-либо вредоносным процессом, например вирусом или “червем”, проникшим на сервер базы данных, то для восстановления работы этого приложения вам необходимо задействовать резервную копию, или образ данных. Чтобы не терять слишком много данных, эти образы должны выполняться достаточно часто. Хотя найдутся такие производители, которые будут утверждать, что технологии создания моментальных снимков дисков оптимально решают эту задачу, но на самом деле они имеют некоторые ограничения (и об этом чуть позже). Во-вторых, перемещать образы с устройств хранения, содержащих первичные данные, на отдельные системы. Это позволит избежать утраты первичных данных и резервных копий (или потери доступа к ним) при выходе из строя основного дискового массива. В-третьих, копировать данные с локальных систем хранения данных на удаленные (off-site backup). Катастрофоустойчивость информационной системы напрямую зависит от расстояния до удаленного хранилища. Как показал наш опрос, читатели заинтересованы в интеграции процесса CDP с процессом копирования данных на удаленные запоминающие устройства.

Системы репликации данных, реализованные на базе ПО для хостов вкупе с интеллектуальным устройством SAN или дисковым массивом, копируют данные с первичного устройства памяти центра их обработки на вторичное устройство почти в режиме реального времени. Однако репликация никак не ограничивает возможности пользователей и приложений в плане управления зарезервированными данными. Поэтому происходят казусы, подобные тому, свидетелями которого мы были: руководитель одной из компаний, решив, что ему не нужны две хранящиеся на сервере копии критически важного документа — взял, да и удалил одну из них. Такая операция привела к мгновенному исчезновению этого файла как с первичной, так и с вторичной системы памяти.

Обычный метод резервирования данных, выводящий их из-под контроля пользователей, вредоносных программ и других объектов, способных испортить эти данные, и в то же время обеспечивающий относительную свежесть копий, состоит в периодическом создании моментальных снимков дисков. В системе хранения данных на базе хоста или дискового массива с помощью технологии отсоединенного зеркала (split-mirror) или копирования при записи (copy-on-write) можно создать множество копий, позволяющих восстанавливать содержимое системы хранения, которое было в определенные моменты времени в прошлом. Однако с точки зрения защиты данных создание моментальных снимков имеет существенные ограничения. Эти снимки представляют собой дополнительные тома, созданные на том же самом хосте, на котором работает защищаемая база данных, а значит, они могут быть испорчены в результате проявления ошибок в коде ПО или воздействия вредоносных программ. Если первичные данные и их снимки хранятся на одном и том же дисковом массиве, то при сбое в работе последнего пропадет и то и другое.

Все, что вы, как правило, можете делать с созданными на дисковом массиве снимками, это монтировать их в виде дополнительных томов (обычно с атрибутом “только для чтения”) или возвращать первичный том в то состояние, в котором он находился на момент создания снимка. Если вы, являясь опытным администратором, способны восстановить производственную базу данных из моментального снимка (сделанного до того, как небрежный программист испортил ее), скрупулезно просматривая журнальные файлы с целью определения всех внесенных в базу изменений после создания этого снимка, то для защиты данных технологии создания снимков вам, возможно, будет достаточно. Однако при действительно скрупулезном выполнении такой работы вам придется засиживаться на работе до поздна.

И еще. Если вдруг вашему вице-президенту срочно потребовалась, например, таблица Excel, которую он не помнит точно, когда просматривал в последний раз, то, чтобы найти ее, вам, возможно, придется потратить уйму времени на монтирование моментальных снимков и поиск нужного файла в них. Помните и о том, что большинство систем хранят лишь несколько моментальных снимков. И если вы хотите создавать моментальные снимки каждый час в течение 12 часов, когда кто-либо из сотрудников вашей фирмы может находиться на работе, то типичная кэш-память, рассчитанная на хранение 64 моментальных снимков, позволит вам восстановить данные по их состоянию не позже чем недельной давности.

Не все данные одинаковы

Разрабатывая план защиты данных, помните о том, что не все данные одинаковы. Конечно, старые данные следует архивировать (см.: Сети и системы связи. 2005. № 11. С. 35). Что же касается свежих данных, то здесь нужно действовать не столько исходя из степени важности и полезности последних, сколько основываясь на их воспроизводимости. Например, важные документы Microsoft Word, созданные сотрудниками юридической фирмы, вполне воспроизводимы. При восстановлении содержимого файлового сервера фирмы (после сбоя в его работе) с помощью снимка часовой или двухчасовой давности сотрудники фирмы поворчат-поворчат, но все же напечатают свои новые сводки и контракты заново.

Если же выйдет из строя сервер электронной почты и для восстановления хранившихся на нем сообщений будет использован снимок часовой давности, то важная информация, содержащаяся в поступивших за последний час сообщениях, может быть утрачена навсегда. Серьезные последствия будет иметь и сбой в работе узла электронной коммерции. Исчезновение информации о совершенных в течение последнего часа транзакциях обернется потерей не только денег, но, возможно, и некоторых заказчиков. Отвечая на наш вопрос о том, что вы хотите защищать с помощью своих систем CDP, читатели в два раза чаще файлов называли транзакционные базы данных.

Идя навстречу требованиям заказчиков обеспечить защиту критически важных и невоспроизводимых данных, самые разные компании — от гигантов, подобных корпорациям Microsoft, Symantec и IBM, до компаний-новичков — анонсируют свои продукты с возможностями CDP. Однако, как показало наше тестирование, единственно общим между этими продуктами является аббревиатура “CDP” в их названиях или описаниях.

“Роза пахнет розой, хоть розой назови ее, хоть нет”

Наше первое знакомство с технологией CDP произошло в 1990 г. на торгово-промышленной выставке NetWorld, где компания Vortex Systems демонстрировала свой продукт RetroChron — внешнюю дисковую систему для файловых серверов NetWare, которая копировала записываемые данные на вторичный дисковой накопитель. Используя утилиты командной строки, можно было в любой момент смонтировать дополнительный том, содержащий данные первичного тома.

Намного опередивший свое время, но довольно медленный (для дисковой подсистемы) продукт RetroChron не имел успеха на рынке, и технология CDP не получила в то время распространения. Сегодня эта развивающаяся технология сделала доступным тот уровень защиты данных, который всего 15 лет назад казался нам несбыточной мечтой.

Специальная группа CDP SIG (Special Interest Group), действующая в рамках ассоциации SNIA (Storage Networking Industry Association), сформулировала следующее определение CDP: “Это методология, предусматривающая непрерывное отслеживание изменений, вносимых в первичные данные, и сохранение этих изменений независимо от указанных данных, и тем самым обеспечивающая возможность восстановления их по состоянию на любой момент времени в прошлом. Средства CDP могут быть основаны на блоках данных, файлах и приложениях. Они обеспечивают бесконечное число точек восстановления данных”.

Ухватившись за это определение, некоторые специалисты настаивают на том, что системой CDP можно называть только тот продукт, который позволяет делать “откат” данных в бесконечное число точек восстановления. Мы так не считаем и возражаем против использования понятия “бесконечное число”. Для нас главное заключается в том, чтобы система восстанавливала ход бизнес-процесса после сбоя в работе ИТ-системы с минимальной потерей данных. При сохранении всех изменений данных возникает неограниченное число точек их восстановления. Продукты, работа которых основана на создании снимков и их копировании, а также на других методах, не пре-дусматривающих передачу изменений в резервное хранилище данных в реальном масштабе времени, мы относим к категории псевдо-CDP. Хотя средства названной категории, в том числе Xpress Restore компании FilesX, Data Protection Manager корпорации Microsoft и NearPoint фирмы Mimosa Systems, заметно упрощают управление процессом резервного копирования данных, следует иметь в виду, что их использование чревато потерей новых данных, созданных за несколько минут до сбоя.

Нам больше нравятся продукты, подобные Backup Exec Continuous Protection Server компании Symantec. Они реплицируют данные в резервное хранилище в реальном масштабе времени, но не обеспечивают неограниченное число точек восстановления, вместо этого периодически создавая моментальные снимки файловой системы. Хотя для защиты данных в интенсивно работающих системах обработки транзакций такие продукты не являются самыми подходящими, мы не осуждаем производителей за то, что они относят их к категории CDP.

Наличие неограниченного числа точек восстановления весьма привлекательно выглядит на бумаге, но не всегда реализуемо на практике. Если вам нужно вернуть свою базу данных SQL Server в то состояние, которое было до тестирования вашим программистом новой процедуры инвентаризации, и при этом он испортил данные, то вам вряд ли захочется гадать, когда именно это произошло. необходимо, чтобы ваша система CDP учитывала специфику работы сервера базы данных SQL Server (или Oracle, или DB2) и помогала определять оптимальное время ее восстановления, основываясь на системных контрольных точках, поименованных транзакциях (named transactions) и других специфичных для данного приложения событий. А поскольку это легко сказать, но трудно сделать, то нам особенно нравятся те продукты, которые справляются с решением данной задачи.

Учтите, если вы произвольно выберите какое-то время в прошлом для восстановления файлов базы данных (по состоянию на этот момент), то вполне вероятно, что тогда имели место одна или более незавершенных транзакций или существовали другие причины для противоречивости данных. Получившаяся в результате восстановления база данных будет находиться в состоянии, которое разработчики баз данных называют “противоречивостью, возникшей вследствие сбоя” (crash inconsistency). Разработчики встраивают в процессоры баз данных специальные процедуры восстановления, распознающие это состояние и очищающие базу данных от следов незавершенных транзакций. Триггер, гарантирующий непротиворечивость базы данных (consistency trigger) и подобный триггеру службы Windows Volume Shadow Copy Service (VSS), может приводить базу в непротиворечивое состояние через каждые 10 мин. Выполненные за это время транзакции вполне реально восстановить с помощью журнала регистрации транзакций.

Создавая средства CDP, производители использовали несколько разных подходов. Поставщики систем репликации данных, такие, как компании XOsoft, FalconStor и Kashya, модифицировали свои технологические решения, захватывающие изменения данных в реальном масштабе времени и непрерывно передающие их в удаленную систему хранения. Они реализовали в этих решениях функциональность CDP, обеспечив журналирование изменений, снабдив журнал аннотациями, относящимися к определенным моментам времени и/или приложениям, и добавив механизм “отката”.

В этом отношении компания XOsoft продвинулась так далеко вперед, что сделала “откат” некорректных изменений данных стандартной возможностью своих основанных на хостах продуктов репликации WANSync. Кроме того, скомбинировав возможности захвата и “отката” изменений данных без их репликации, она разработала продукт под названием Enterprise Rewinder, который хранит свой журнал на защищаемой системе.

В дополнение к функционирующим на хостах программным средствам CDP некоторые производители в настоящее время выпускают устройства CDP. Встраивание ПО CDP в отдельное устройство позволяет пользователям ускорить внедрение данной технологии и сэкономить вычислительные ресурсы хостов для выполнения других приложений, а производителям — потратить выделенный на исследования и разработки бюджет не на перенос кода на другие платформы, а на реализацию новых функций в продуктах и их тестирование. Благодаря доступности CDP-устройств пользователи мало распространенных ОС и приложений тоже могут воспользоваться всеми преимуществами технологии CDP. Действительно, более половины респондентов, участвовавших в нашем опросе, предпочитают устройства CDP, предпочтения же остальных респондентов распределились примерно поровну между серверными CDP-приложениями и ПО CDP, интегрированным в дисковые массивы.

В качестве примера рассмотрим устройство CPS 1200 компании Revivio. Серверы и приложения “воспринимают” его как еще один дисковый массив, но в отличие от старой системы RetroChron продукт компании Revivio не хранит данные сервера. Вместо этого он записывает свои CDP-данные на дисковый массив Fibre Channel, а сервер взаимодействует с первичным массивом. Все, что вам необходимо сделать для защиты данных, это с помощью менеджера томов реализовать зеркальное отображение первичных дисков вашего приложения на логические устройства, представляемые продуктом CDP.

Поскольку устройство компании Revivio не использует агенты, то оно не может “знать”, когда ваше приложение достигает контрольных точек или когда происходят другие важные системные события. Если вам потребуется доступ к старой версии используемой приложением информации, вы сможете создать набор виртуальных томов (образ информации), содержащих данные по состоянию дел на конкретный момент времени, определенный с точностью до секунды. Далее не составит большого труда смонтировать этот образ (на хосте) и убедиться в его достоверности.

Что касается репликации данных, то для ее осуществления вам потребуются два устройства, поддерживающие протокол FCIP или передающие данные по оптоволокну по технологии Fibre Channel (FC), и широкополосный канал связи. При этом информационная безопасность обычно обеспечивается путем зонирования сети, маскирования логических устройств и другими стандартными для технологии FC методами. Если же вам необходимо шифрование данных, то для этого придется задействовать отдельное устройство, подобное производимым компаниями NeoScale Systems или Kasten Chase.

Устройство KBX5000 компании Kashya подключают к FC-сети SAN вне пути передачи данных между серверами и их первичным информационным хранилищем. Используя хост-агент или “интеллектуальный” коммутатор для сети SAN (подобный продукту MDS 9000 компании Cisco с интерфейсом SANtap, дублирующим записываемые данные), устройство KBX5000 выполняет синхронную или асинхронную репликацию данных на второе устройство KBX5000 по IP- или FC-сети, создавая локальную или удаленную копию данных. Взаимодействуя с хост-агентом, устройство будет создавать маркеры событий в работе VSS-совместимых приложений, таких, как Exchange, Oracle, SQL Server и других.

Перспективная фирма Mendocino Software недавно заключила соглашение с компанией HP (согласно которому последняя продает ее ПО RecoveryOne и встраивает его в свое устройство CDP) и с корпорацией EMC (уже использует технологию фирмы в качестве основы работы своего продукта RecoverPoint). Предоставляя агенты для ОС Unix, Linux и Windows, компания Mendocino является активным сторонником концепции систем CDP, учитывающих специфику работы приложений. Агент Mendocino захватывает записываемые на диск данные на уровне блоков и отправляет их в журнал. Кроме того, он пересылает метаданные, касающиеся достижения контрольных точек базы данных и наступления других событий, которые устройство RecoveryOne отображает вдоль временной оси, когда вы выбираете момент времени, по состоянию на который хотите восстановить данные.

Цены на устройства CDP варьируются в широких пределах. Недавно купленная фирмой SonicWall компания Lasso Logic объединила серию устройств CDP, самое дешевое из которых емкостью 160 Гбайт стоит всего около 2000 долл., с дополнительным интегрированным сервисом удаленного резервного копирования. Небольшие и средние предприятия с минимальными потребностями в архивировании информации смогут обеспечить непрерывную защиту своих данных приблизительно по цене одного ленточного автозагрузчика. Что же касается того, сколько данных и в течение какого времени можно сохранять, то здесь все зависит от скорости изменения ваших данных. Для начальной оценки этой скорости можно использовать эмпирическое правило, которое гласит, что данные объемом 50 Гбайт трижды обновляются в течение 30 дней. Хотя продукт Lasso Logic осуществляет периодическое резервное копирование данных SQL Server и Exchange с диска на диск, он обеспечивает непрерывную защиту лишь для файлов.

Учитывая заслуженную репутацию сервера Exchange, как приложения, работу которого (после сбоя) восстанавливать трудно, некоторые производители разработали системы CDP, специально предназначенные для защиты этих серверов. Например, продукт LiveServ компании Storactive не только соответствует определению CDP, данному ассоциацией SNIA, в плане защиты сервера Exchange, но и обеспечивает простое восстановление индивидуальных почтовых ящиков и/или сообщений. Система DigiVault компании Lucid8 гарантирует непрерывную защиту данных, но не предоставляет неограниченное число точек их восстановления, тогда как продукт NearPoint компании Mimosa Systems реализует уникальный метод репликации каждого 5-Мбайт транзакционного журнального файла на сервер защиты, где он используется для создания архива сообщений.

Если вам приходится иметь дело с пользователями, требующими восстановления сообщений в их почтовых ящиках, то одно из вышеупомянутых решений заметно облегчит вам жизнь, особенно если ваши пользователи не знают, где и когда они видели нужное им сообщение в последний раз. При восстановлении всего хранилища данных Exchange на поиски одного сообщения может уйти несколько дней даже в случае использования таких инструментальных средств, как EasyRecovery Email Repair компании OnTrack или Recovery Manager фирмы Quest, которые позволяют просматривать хранилище данных, не монтируя его на сервере Exchange.

CDP и традиционное резервное копирование

Хотя сохранение каждого изменения, внесенного в ваши данные, в реальном масштабе времени на неограниченный срок, возможно, и выглядит привлекательным, но его нельзя реализовать, да и не нужно. Простая система CDP обычно использует журнал изменений, работающий по принципу стека FIFO (First In, First Out): она записывает в архивное хранилище данных самые старые изменения и удаляет их из журнала по мере истечения срока их хранения или при нехватке ресурсов памяти для сохранения новых изменений. Если вы хотите восстанавливать относительно старые данные, то вам лучше выполнять обычное резервное копирование.

Некоторые более функциональные продукты, такие, как Backup Exec CPS компании Symantec, TimeData фирмы TimeSpring и InControl компании LiveVault объединяют свои журналы изменений. Это приводит к уменьшению числа точек восстановления по мере устаревания данных и позволяет сохранять, например, неограниченное число версий структур данных на протяжении одного дня, ежедневные версии в течение 10 дней и еженедельные версии в течение одного месяца. Как показывает практика, большинство запросов на восстановление данных имеют отношение к файлам, которые недавно были модифицированы, удалены или испорчены, поэтому объединенные журналы позволят вам выполнить эти запросы с высокой степенью детализации изменений и обеспечат менее детализированный доступ к более старым данным.

Важным различием между ориентированными на файлы CDP-системами, такими, как DPM компании Microsoft и Backup Exec 10d фирмы Symantec, и системами, ориентированными на блоки и тома, является реализуемый ими метод восстановления данных. Системы блочного уровня обычно создают виртуальный том, смонтировав который, можно извлекать из него нужные данные. Работающие на уровне файловой системы продукты, как правило, обеспечивают более гибкие возможности восстановления данных, позволяя пользователям находить все версии файла, не монтируя множество томов. Некоторые из этих продуктов даже дают возможность пользователям просматривать, находить и восстанавливать их собственные файлы посредством Web-интерфейса или иного пользовательского интерфейса.

Хотя технология CDP помогает решать многие проблемы с защитой данных, она еще не зрелая. Вместо оснащения своих продуктов средствами шифрования для защиты данных все производители систем CDP, кроме LiveVault, полагаются на серверные функции контроля доступа и системы сетевой безопасности.

Мы не рекомендуем заменять традиционные системы резервного копирования средствами CDP. Продолжайте использовать свою старую систему резервного копирования для защиты сервисов и приложений с низкой скоростью изменения данных.

Некоторые системы CDP поддерживают полное восстановление ИТ-систем, как говорится, на “голое железо”. Однако, даже если бы новейшие продукты CDP справлялись с этой трудной задачей так же хорошо, как это делают традиционные средства резервного копирования, применение этих продуктов для защиты системных дисков привело бы к быстрому переполнению хранилищ данных CDP в результате отслеживания всех изменений, вносимых в системные журналы и временные (temp) файлы..





  
8 '2006
СОДЕРЖАНИЕ

инфраструктура

• Тестируем клиентские устройства для БЛВС

• Презентации по радиоволнам

• 2006 - лучшие продукты года

бизнес

• Форум на Итальянских озерах

• В «сердце» Кремниевой долины

• Инструментарий для управления поставками

• Футбол и конвергенция

информационные системы

• Call-центры отечественных производителей (часть II)

• Роль гражданских институтов в построении информационного общества

сети связи

• Отечественные производители. Каждый за себя

кабельные системы

• Медиаконвертеры набирают «интеллект»

• Тестирование межкабельных наводок в полевых условиях

• Трубы для прокладки кабелей связи

защита данных

• Непрерывная защита данных

новые продукты

• Wi-Fi для СКС; Инфракрасная IP-камера компании Planet; Широкополосный шлюз «в кармане»; Система мониторинга и управления доступом на базе Linux; Новая конвергентная система связи от Samsung


• Калейдоскоп



 Copyright © 1997-2007 ООО "Сети и Системы Связи". Тел. (495) 234-53-21. Факс (495) 974-7110. вверх