Ж у р н а л   о   к о м п ь ю т е р н ы х   с е т я х   и   т е л е к о м м у н и к а ц и о н н ы х   т е х н о л о г и я х
СЕТИ И СИСТЕМЫ СВЯЗИ on-line
  ПОИСК: ПОДПИСКА НА НОВОСТИ: НОМЕР:
    ДОМОЙ • Архив: Новостей | Конференций | НомеровПодписка
 
   
 
   
    
РЕДАКЦИЯ
 
Все о журнале
Подписка
Как проехать
Где купить
Отдел рекламы
График выхода журнала
Адреса в Интернет

РУБРИКАТОР
   
• Инфраструктура
• Информационные
   системы

• Сети связи
• Защита данных
• Кабельные системы
• Бизнес
• Колонка редактора
• Электронная
   коммерция

• Только на сервере
• Системы
   учрежденческой
   связи

• Новые продукты


Rambler's Top100

  

Информационные носители для электронных архивов

Говард Маркс

Долговременное хранилище данных должно быть надежным. Мы поможем вам правильно выбрать носители для него.

Разработчики системы архивного хранения данных должны знать ответы на следующие главные вопросы: какие данные хранить? как долго? как архивировать и индексировать их, чтобы можно было быстро находить нужные сведения? на каких носителях создавать архив? Данная статья призвана дать ответ на последний вопрос. Что же касается первых двух вопросов, то ответы на них зачастую содержатся в корпоративных нормах и правилах хранения информации. Так, мы работали с одной табачной компанией, юристы которой постановили, что все документы, имеющие отношение к табачному бизнесу, должны храниться вечно, поскольку в случае судебного расследования лучше сообщить о себе всю правду, чем оказаться не в состоянии предоставить суду затребованную им информацию. Но есть примеры и противоположного характера: нам встречались компании, юристы которых предписывали сотрудникам удалять всю электронную почту по истечении 30 дней.

Виды носителей

Антикоррозийная бумага, микрофильмы и микрофиши зарекомендовали себя как надежные носители информации, обеспечивающие ее долговременное хранение. Однако они занимают много места и не позволяют быстро находить нужные сведения, поэтому лучше задействовать носители цифровых данных. Для организации электронного архива вы можете выбирать из пяти основных видов таких носителей:

• Магнитная лента, которую чаще всего используют, характеризуется высокой плотностью записи при разумной цене, но она не подходит для создания активных архивов (например, медицинских снимков), поскольку время поиска записанной на ней нужной информации слишком велико.

• Магнитные диски обеспечивают быстрый поиск данных, но с их массивами связаны более высокие эксплуатационные расходы (на электропитание, охлаждение и техническое обслуживание).

• Потребительские оптические диски CD и DVD стоят недорого, но весьма уязвимы к механическим повреждениям, и тот факт, что они ориентированы на потребительский сегмент рынка, не вселяет уверенности в их надежности, поскольку производители товаров широкого пользования больше озабочены ценообразованием, чем повышением качества.

• Профессиональные оптические диски — надежные средства долговременного хранения данных, но по плотности записи они уступают магнитной ленте.

• Сменные жесткие диски, разработанные для резервного копирования информации, во многих отношениях привлекательные носители, но пока никто не знает, как долго такой диск может сохранять записанную на нем информацию лежа на полке.

Независимо от вида выбранного носителя не стоит, как говорится, хранить все яйца в одной корзине. Прогнозы по сроку службы носителей делаются исходя из предположения о надлежащих условиях их хранения, но пожар в помещениях предприятия или их затопление могут так же легко уничтожить архив, как и первичные данные. Дублирование архивов с хранением копий в разных местах — единственный путь, гарантирующий сохранность информации.

Иногда требуется создать такой архив, который исключал бы возможность перезаписи хранящихся данных. Для этого можно задействовать носители типа WORM (Write Once, Read Many — однократная запись, многократное считывание), CD-R и DVD-R, а также оснащенные специальными программными средствами ленточные накопители (работают с WORM-картриджами) или дисковые массивы, такие, как Centera компании EMC и системы хранения данных фирмы NetApp (с ПО SnapLock). При использовании такого архива никто, даже системный администратор, не сможет внести никаких изменений в однажды записанные данные.

Слово о ленте

Магнитная лента популярна уже около 50 лет. Производители дисков неоднократно предрекали ей скорую кончину, но она “живет” и ее характеристики продолжают улучшаться. За последние несколько месяцев производители повысили физическую емкость картриджа с лентой до 800 Гбайт, а в мае 2006 г. научные сотрудники корпорации IBM объявили, что им удалось достичь колоссальной плотности записи данных — 6,67 Гбит/кв. дюйм (1 кв. дюйм = 6,45 кв. см) — на экспериментальную пленку компании FujiFilm. Когда разработанная ими технология будет реализована в коммерческих продуктах (в лучшем случае это произойдет к концу десятилетия), на рынке появятся картриджи с полудюймовой лентой емкостью 8 Тбайт.

При оптимальных условиях хранения ленты (температура воздуха — 15–20 °С, относительная влажность — 30–40%) записанные на нее данные должны оставаться считываемыми в течение 30 лет или более. Однако считать их не удастся, если спустя годы на предприятии не окажется совместимого накопителя. Приводы DLT обычно могут считывать данные с лент двух предыдущих поколений (произведенные 7–9 лет назад). В современных ленточных технологиях среднего уровня (LTO и DLT/SDLT) и предназначенных для центров обработки данных технологиях (IBM 3590/92 и StorageTek T9840–T10000) используются ленты с записанными на них на заводе-изготовителе серводанными, которые обеспечивают точное позиционирование магнитных головок. Это эффективно устраняет проблему несовместимости ленточного привода с записями, сделанными на другом накопителе. Указанная проблема возникает при использовании более старых ленточных технологий, включая QIC и DDS.

По разным оценкам, от 20 до 50% попыток восстановить нужные данные с архивных лент оканчиваются неудачей. Как же это согласуется с заявлениями о 30-летнем сроке их хранения? Наш опыт показывает, что эти неудачи чаще всего происходят по процедурным причинам: затребованные данные просто не были сохранены в свое время, поскольку, например, ИТ-отдел, добавив к серверу новый том, забыл включить его в задание на резервное копирование или выполняющая указанную функцию система пропустила важный файл, так как в тот момент он был открыт. Более разумно рассчитывать на 15-летний срок хранения информации на ленте; продолжительность хранения зависит от возможностей конкретной ленточной технологии в плане коррекции ошибок, возникающих из-за порчи носителя.

Во мнениях по вопросу, требуют ли современные ленты периодического перематывания для гарантии надлежащего натяжения в рулоне, эксперты расходятся но соглашаются с тем, что большинство отказов связаны с повреждениями краев ленты и ее износом. Для создания архива используйте только новые ленты.

Время дисков

Жесткие диски, в том числе типа SATA, работают бы-стро, что делает их пригодными для создания активных архивов. Благодаря росту емкости SATA-дисков и повышению их надежности появилась возможность создавать постоянно действующие (онлайновые) архивы долговременного хранения. Организации, которым требуется хранилище информации, не позволяющее изменять ее, могут создать его на основе систем (подобных решениям Centera и SnapLock компаний EMC и NetApp), сохраняющих данные на дисковых массивах в немодифицируемом формате.

Производители дисков корпоративного класса обычно заявляют, что среднее время безотказной работы (Mean Time Between Failures — MTBF) последних превышает миллион часов, или 114 лет. Это отнюдь не означает то, что диск способен проработать 114 лет. В данном случае речь идет о том, что ежегодно из каждых 114 дисков будет выходить из строя в среднем один. Помимо полного отказа диска, может случиться и так, что он не сможет прочитать тот или иной свой сектор. Согласно заявлениям производителей, в дисках Fibre Channel и SCSI корпоративного класса одна неисправимая ошибка считывания приходится на 1015 прочитанных битов, а в более емких SATA-моделях, предназначенных для RAID-систем, — на 1014 прочитанных битов. При возникновении ошибки считывания RAID-контроллер восстанавливает содержимое сбойного сектора, используя зеркально отраженные данные или контрольные суммы.

Когда же выходит из строя целый диск, RAID-контроллер восстанавливает массив, используя установленный новый диск (вместо отказавшего) или диск “горячего” резерва. Для восстановления массива из 14 дисков SATA емкостью 500 Гбайт каждый потребуется считать содержимое всех остальных 13 накопителей, что составляет 5,2 * 1014 битов. При таком большом объеме информации могут возникнуть неисправимые ошибки считывания, что приведет к потере части данных. Это весомый аргумент в пользу создания небольших наборов RAID или, что еще лучше, применения конфигурации RAID уровня 6 (с двойным числом блоков контрольных сумм), способной “приноравливаться” к неисправимым ошибкам считывания и восстанавливать массив без потери данных.

Существует два фактора, ограничивающие срок хранения информации на жестких дисках. Первый — это процесс термической деградации свойств магнитных носителей, который идет тем интенсивнее, чем выше плотность записи. Теоретически современные жесткие диски должны сохранять данные в течение приблизительно 20 лет, но производители на всякий случай обещают только 10.

Большее беспокойство вызывает второй фактор — устаревание дисковых массивов. Ведь после прекращения выпуска той или иной модели массива производитель поддерживает ее (поставляя запчасти и сервисные услуги), как правило, только 5 лет. Например, официально закончилась “жизнь” массива IP4700 компании EMC, и теперь его техническое обслуживание обходится в четыре раза дороже, чем раньше. Следовательно, каждые несколько лет необходимо перемещать данные в новую систему хранения.

Интересный вариант использования жестких дисков для архивного хранения информации реализован в рамках программы LOCKSS (Lots Of Copies Keep Stuff Safe) (www.lockss.org/lockss/Home). Речь идет о создании в библиотеках сети серверов, хранящих содержимое академических журналов. Серверы периодически выполняют хеш-преобразование этого контента и обмениваются полученными результатами, что позволяет выявлять испорченные копии данных и заменять их неповрежденными.

Еще одним инновационным вариантом применения жестких дисков для долговременного хранения информации является технология MAID (Massive Arrays of Inactive Disks — большой массив неактивных дисков), реализованная фирмой Copan в своих дисковых системах. Последние выключают RAID-наборы, когда к ним никто не обращается, и тем самым уменьшают износ дисков, а также снижают тепловыделение и энергопотребление. Кроме того, системы фирмы Copan периодически выполняют функцию Disk Aerobics (“аэробика” для дисков), которая контролирует “здоровье” дисков, раскручивая их шпиндели (более подробная информация о MAID-решениях представлена в статье “Архивное хранение данных на жестких дисках”, опубликованной в этом же номере журнала).

Съемные жесткие диски

В ИТ-подразделениях многих предприятий малого бизнеса сложилось негативное отношение к ленточным накопителям — отчасти из-за того, что накопители начального уровня от ряда производителей (например, фирмы Colorado Memory), не вполне соответствовали своему назначению. В последние несколько лет некоторые из этих ИТ-подразделений для резервного копирования данных стали задействовать внешние жесткие диски с интерфейсами FireWire и USB.

В своей тестовой лаборатории мы уже давно используем съемные дисковые модули, которые помогают нам запускать на компьютерах, не поддерживающих “горячую” замену дисков, разные ОС и приложения. Эти модули, производимые такими компаниями, как Kingwin и StorCase Technology, продаются по цене около 25 долл. и представляют собой стандартный жесткий диск в пластиковом или алюминиевом корпусе с разъемом типа RJ-21X или DIN, предназначенным для подключения к стыковочному блоку.

По крайней мере один производитель — компания Idealstor предлагает использовать подобные изделия для резервного копирования данных с диска на диск. Ее устройство резервного копирования, работающее под управлением серверной ОС Windows, снабжено стыковочными блоками для дисковых модулей и драйвером, который представляет Windows эти модули в виде сменных носителей. Это позволяет ПО резервного копирования в рамках выполнения одного задания записывать данные на множество дисков и учитывать содержимое снятых накопителей, как это делается при работе с другими сменными носителями.

Недавно несколько производителей по-новому реализовали идею помещать жесткий диск в специальный корпус. Речь идет о продуктах GoVault компании Quantum, RDX фирмы ProStor Systems (продается также фирмой Tandberg), Ulysses и Odyssey компании Imation. Инженеры названных фирм-производителей взяли 2,5-дюймовые мобильные диски (имеющие гораздо более высокую ударо-прочность в нерабочем состоянии, чем у моделей дисков для настольных ПК или корпоративных систем хранения данных) и упаковали их в картриджи, имеющие защиту от электростатического разряда и гасящие энергию удара элементы, которые предотвращают повреждение носителя и потерю данных при его (картриджа) падении со стола на твердый пол. Продукты GoVault, Odyssey и RDX — это решения с подключаемым к компьютеру стыковочным блоком. Они ориентированы на рынки оборудования для небольших офисов и предприятий малого бизнеса. В решении Ulysses дисковый картридж и его стыковочный блок имеют такие же габаритные размеры, как кассета и накопитель LTO соответственно. Это решение поддерживает те же самые интерфейс и набор команд, что и накопитель LTO, поэтому его можно задействовать в библиотеках лент LTO. Таким образом, термин “виртуальная ленточная библиотека” приобретает новое значение.

Основная проблема использования съемных жестких дисков для создания архива данных связана с тем, что еще никто не проводил исследований с целью определить максимально допустимый срок хранения этих накопителей вне дисковой подсистемы (на полке), в течение которого они сохраняют способность выводить записанные в них данные. Ни один производитель дисков не публикует никаких сведений об этом сроке, но мы оцениваем его примерно в 5–10 лет. Без использования решений типа технологии MAID, периодически контролирующей “здоровье” жестких дисков, включая и выключая их, мы не рекомендуем задействовать съемные жесткие диски в качестве архивных носителей.

Потребительские оптические диски

На первый взгляд записываемые диски CD и DVD являются хорошими архивными носителями. Последние имеют довольно высокую емкость, а большие объемы продаж обеспечили их дешевизну.

К сожалению, те же факторы, которые обусловили снижение цен на эти носители, привели к тому, что рынок наводнили некачественные изделия.

Производители делают сногсшибательные заявления о сроке службы дисков CD-R и DVD-R. Всего за несколько минут мы нашли в Интернете информацию о дисках со сроком службы 50, 100 и даже 300 лет, причем производители обещают предоставить новый диск в случае потери данных, записанных на старом!

В действительности же, как показали промышленные тесты (результаты одного из них опубликованы в голландском журнале PC-Active), срок службы низкокачественных записываемых носителей может составлять всего-навсего несколько лет. Разные производители используют разные рецептуры при создании активного слоя диска и разные же производственно-технологические процессы, которые существенно влияют на срок службы диска, ограничиваемый такими факторами, как ухудшение параметров активного слоя и коррозия отражающего слоя (обычно состоит из сплава алюминия и серебра).

Даже если вы используете высококачественные носители, помните о том, что они, как уже говорилось, весьма уязвимы к механическим повреждениям. Поликарбонатная основа диска имеет замечательные оптические характеристики (из этого материала, кстати, изготавливают большинство линз для очков), но она довольно мягкая, и поэтому на ней легко появляются царапины и потертости. Кроме того, диски CD уязвимы со своей верхней стороны, поверхность которой — это всего лишь тонкий слой лака, покрывающий отражающий слой. Попытавшись написать что-либо на CD-диске шариковой ручкой, вы можете деформировать этот слой и повредить записанные данные. Вообще говоря, перечень вещей, насчет которых нужно беспокоиться при использовании потребительских дисков CD и DVD для резервного копирования данных, занял бы все место, отведенное для этой статьи.

Диск DVD — менее уязвимый поликарбонатный “бутерброд”, но тут возможно другое — его расслаивание. Мы несколько раз видели, как слегка поврежденный или разбалансированный диск разрушался в высокоскоростном приводе, при этом он сам становился непригодным для дальнейшего использования и выводил из строя привод. Некоторые производители, в частности фирма Mitsui Advanced Media и подразделение Memorex компании Imation, изготавливают специально предназначенные для архивирования носители, в которых с целью повышения срока службы используются более стабильный фталоцианиновый активный слой и золотой отражающий слой, а нижняя поверхность имеет устойчивое к исцарапыванию покрытие.

Сейчас на рынке появляются потребительские оптические диски нового поколения — Blu-Ray и HD-DVD, имеющие большую емкость, но, по-видимому, страдающие от тех же проблем, что и сегодняшние диски CD и DVD.

Хотя отдельные производители, в том числе компании Hitachi и PowerFile, все еще выпускают библиотеки дисков DVD-R и DVD-RAM, другие фирмы, включая Plasmon, уходят с этого рынка, придя к выводу, что расходы на поддержку неразборчивых в выборе носителей пользователей слишком велики. Если вы все еще хотите использовать потребительские оптические диски, то знайте, что Национальный институт стандартов и технологий США провел масштабное исследование по хранению данных на дисках CD и DVD и опубликовал в Интернете итоговый документ № 500-252, доступный по адресу www.itl.nist.gov/div895/carefordisc и являющийся наилучшим руководством по использованию этих носителей.

Профессиональные оптические диски

Помимо широко распространенных форматов оптических дисков, ориентированных на использование в потребительских электронных системах, существуют и другие форматы оптических дисков, специально предназначенные для создания электронных архивов. При разработке этих профессиональных форматов упор делался не на низкую стоимость решения для хранения данных, а на высокую надежность его работы. В отличие от дисков CD и DVD профессиональные оптические диски имеют концентрические дорожки, а не спиральные и для ускорения произвольного доступа вращаются с постоянной угловой скоростью, что устраняет временную задержку, связанную с изменением скорости вращения шпинделя, которая характерна для систем, работающих с постоянной линейной скоростью. Для повышения надежности работы диск помещают в защитный картридж со шторкой, которая открывается только тогда, когда его вставляют в накопитель. Это защищает диск от воздействия света, пыли и других вредных факторов окружающей среды. В новейших накопителях установленный в них картридж даже продувается прошедшим через фильтр воздухом с целью удаления пыли с диска.

До недавнего появления ленточных форматов WORM и дисковых систем, не позволяющих изменять записанную в них информацию, использование магнитооптических (МО) дисков было единственным вариантом создания немодифицируемых архивов. Представители ряда компаний-производителей, в том числе Breece Hill/MaxOptix, Fujitsu, Plasmon и Sony, утверждают, что МО-диски обеспечивают надежное хранение данных в течение 30 лет или более. Согласно сообщениям пользователей из разных стран мира, в большинстве ИТ-подразделений предприятий не возникает никаких проблем со считыванием данных, записанных на МО-диски 10 или даже 15 лет назад. (Вместе с тем пользователи выражали недовольство громоздкими роботами, имеющимися в некоторых библиотеках МО-дисков.)

К сожалению, при значительном росте емкости жестких дисков — до 750 Гбайт — рост емкости МО-дисков остановился на уровне 9,1 Гбайт, причем данные на них записываются с двух сторон, поэтому для доступа к другой стороне диска его приходится переворачивать. Объемы продаж МО-дисков падают, поскольку предприятия сохраняют все больше данных, а для этого им нужны носители с более высокой плотностью записи.

Некоторые специалисты считают технологию сверхплотной оптической записи UDO (Ultra Dense Optical), реализованную компанией Plasmon в своих продуктах в 2004 г., логическим продолжением тех идей, на которых основана МО-технология. Накопитель UDO записывает 30 Гбайт данных на картридж того же самого размера, что и 9,1-Гбайт МО-диск, используя голубой лазер и эффект фазовых переходов. Благодаря совпадению габаритных размеров UDO-картриджа и MO-диска производители библиотек могут задействовать (и уже задействуют) идентичных роботов в библиотеках UDO и МО. Это очень похоже на использование в ленточных библиотеках имеющих разную емкость накопителей DLT или LTO в зависимости от требований пользователей к емкости хранения данных.

Расчетный срок службы UDO-картриджей и МО-дисков одинаков — 30 лет. Компания Plasmon планирует в ближайшие 5–6 лет увеличить емкость картриджа до 120 Гбайт.

Технология PDD (Professional Disk for Data), разработанная компанией Sony в 2003 г., позволяет записывать на один диск 23 Гбайт данных. Будучи относительно недорогой, эта технология, казалось, имела все шансы на успех, но OEM-производители не поддержали ее, и сейчас Sony сконцентрировала свои усилия на производстве оборудования на базе технологии Blu-Ray.

Когда-то о голографических устройствах памяти, сохраняющих огромные объемы данных на миниатюрных носителях, можно было прочитать только в фантастических романах, но сейчас компании InPhase Technologies и Maxell сделали их реальностью. Используя пространственные световые модуляторы, разработанные для видеопроекторов, и ПЗС-матрицы от цифровых камер, голографический накопитель компании InPhase записывает 300 Гбайт данных на диск толщиной 2,5 мм. Опытные образцы этих устройств в настоящее время используются в вещательных компаниях, а их серийное производство должно начаться примерно через год. В InPhase предполагают, что такой накопитель будет стоить около 17 тыс. долл., а диск — 150 долл. Согласно планам развития данной технологии, емкость диска должна возрасти до 1200 Гбайт.

Другие части “головоломки”

Отсутствия испорченных битов на архивных носителях отнюдь не достаточно для того, чтобы вы смогли считывать с них записанные документы, когда потребуется, — нужны еще подходящие накопители и программные средства. Так что, если вы представляете себе архивирование как просто резервное копирование данных в конце месяца и отправку копий на долговременное хранение, то вас ждет жестокое разочарование.

Действительность такова, что ни одна технология систем хранения данных не позволяет сохранять их более 30 или (в лучшем случае) 50 лет. Когда в армии США архивируется очень ценная информация, то вместе с носителями консервируется все, что использовалось для их записи, в том числе ленточные накопители и компьютеры с ПО архивирования. Но позволить себе такую роскошь могут не многие предприятия и организации. Поэтому самое лучшее, что мы можем посоветовать вам, — это вести журналы регистрации сохраняемых данных и каждые 10 лет перезаписывать их на носители нового формата..





  
2 '2007
СОДЕРЖАНИЕ

инфраструктура

• Информационные носители для электронных архивов

• Архивное хранение данных на жестких дисках

• «Обреченный» рынок — 2, или Большие возможности больших ИБП

• Объединенные коммуникации. Обращаться осторожно

• Тестируем устройства DNS/DHCP

• Стандарт 802.11n — на пути к принятию

• Теперь не спрячешься!

информационные системы

• Новые медиасредства для организаций — риск или выгода?

• Десять шагов к «мобилизации» предприятия

• WS-конвергенция на подходе

сети связи

• Десять рекомендаций для успешного развертывания VoIP-системы

защита данных

• Всепроникающая защита

кабельные системы

• А кто обещал, что системы 10GBase-T будут работать по СКС категории 6?

• Розетки MUTOA и противопожарная безопасность

новые продукты

• Удаленное управление инфраструктурой ЦОДов


• Калейдоскоп



 Copyright © 1997-2007 ООО "Сети и Системы Связи". Тел. (495) 234-53-21. Факс (495) 974-7110. вверх