Ж у р н а л   о   к о м п ь ю т е р н ы х   с е т я х   и   т е л е к о м м у н и к а ц и о н н ы х   т е х н о л о г и я х
СЕТИ И СИСТЕМЫ СВЯЗИ on-line
  ПОИСК: ПОДПИСКА НА НОВОСТИ: НОМЕР:
    ДОМОЙ • Архив: Новостей | Конференций | НомеровПодписка
 
   
 
   
    
РЕДАКЦИЯ
 
Все о журнале
Подписка
Как проехать
Где купить
Отдел рекламы
График выхода журнала
Адреса в Интернет

РУБРИКАТОР
   
• Инфраструктура
• Информационные
   системы

• Сети связи
• Защита данных
• Кабельные системы
• Бизнес
• Колонка редактора
• Электронная
   коммерция

• Только на сервере
• Системы
   учрежденческой
   связи

• Новые продукты


Rambler's Top100

  

Правда о надежности устройств хранения данных

Говард Маркс

Два доклада, представленные на прошедшей в феврале с. г. конференции ассоциации Usenix по технологиям хранения данных, поколебали представления ИТ-специалистов о надежности жестких дисков, уже давно используемые ими в качестве основы при проектировании информационных хранилищ. Речь идет прежде всего о показателе средней наработки на отказ (Mean Time Between Failures — MTBF), значение которого у большинства серверных дисков, судя по их спецификациям, должно составлять миллион или более часов.

Согласно обоим докладам — «Disk Failures in the Real World: What Does an MTTF of 1 Million Hours Mean to You» (авторы Бианка Шредер и Гарт А. Гибсон из Университета Карнеги-Мелона) и «Failure Trends in a Large Disk Drive Population» (авторы Эдуардо Пинхерио, Вольф-Дитрих Вебер и Луис Андре Барросо из компании Google), — фактическая ежегодная интенсивность отказов (AFR) дисков, как правило, в четыре и более раз выше уровня 0,88%, соответствующего показателю MTBF в миллион часов. Каждая группа авторов проанализировала статистику замены более 100 тыс. дисков в центрах обработки данных.

Будучи человеком, скептически относящимся к рекламным заявлениям производителей, я не слишком удивился тому факту, что в реальной жизни жесткие диски ломаются чаще одного раза в течение 1 млн ч работы. Зато меня немного обескуражил другой результат этих исследований. Так, проведенный специалистами из Университета Карнеги-Мелона анализ показал, что интенсивность отказов дисков SATA, а также корпоративных дисков SCSI и Fibre Channel (FC), примерно одинакова, что противоречит общепринятому мнению, о том, что надежность корпоративных дисков в полтора-два раза выше надежности их «собратьев» типа SATA.

Еще больше меня удивил рост интенсивности отказов дисков по мере их старения даже в течение интервала в пять лет, который большинство специалистов считают вполне разумным сроком эксплуатации дисков. Частота отказов дисков на четвертом и пятом годах их эксплуатации до 10 раз превышает частоту отказов, приводимую в спецификациях производителей.

Но особенно удручающее впечатление производят данные о возможных отказах дисков в сложных системах. Так, специалисты из Университета Карнеги-Мелона обнаружили, что при поломке какого-либо диска серверного кластера довольно высока вероятность отказа в ближайшие несколько часов других дисков данного кластера. Это плохая новость для тех, кто использует дисковые массивы RAID уровня 5. Дело в том, что емкость дисков растет гораздо быстрее скорости передачи информации через их интерфейсы, поэтому даже при наличии дисков «горячего» резерва процесс восстановления (rebuilt) дискового массива может затянуться на несколько часов. Если за это время выйдет из строя второй диск или возникнет неисправимая ошибка чтения, то произойдет потеря данных.

Итак, какие выводы можно сделать из этих академических исследований? Во-первых, выбирайте диски исходя из их емкости и производительности, не обращая особого внимания на заявления производителей относительно их необыкновенной надежности. Если вашему приложению требуется большое дисковое пространство и оно будет выполнять в основном последовательные операции ввода и вывода данных, то покупайте сравнительно дешевые диски SATA, ничуть не коря себя за то, что вы делаете это в ущерб надежности, ведь это не так. Во-вторых, поскольку вероятность выхода из строя нескольких дисков массива до его полного восстановления куда выше, чем предполагалось ранее, необходимо изучить возможности использования конфигурации RAID уровня 6, средств репликации данных или других решений, гарантирующих сохранность информации в случае отказа нескольких дисков. И наконец, поскольку все производители, начиная с Network Appliance и кончая AMCC, ускоряют процесс вычисления контрольных сумм в своих контроллерах RAID уровня 6, я рекомендую реализовывать этот уровень RAID во всех массивах, состоящих из дисков объемом 500 Гбайт или более..





  
10 '2007
СОДЕРЖАНИЕ

бизнес

• На родине Web

инфраструктура

• «Многоликое» монтажное оборудование

• Проектирование ЦОДа

• VoIP-системы громкого оповещения

• Правда о надежности устройств хранения данных

• C помощью iFind мы найдем друг друга без проблем

сети связи

• Наше мобильное будущее?

информационные системы

• Перспективы BPEL

• Тяжкое бремя Vista: смиритесь с неизбежностью

• Сlick-to-call делает вызов

• Виртуальные справочники осваивают рынок

кабельные системы

• Характеристики СКС и квалификация кабельщиков очень важны для ЦОДов

• Оптоволокно для внутриобъектовых систем

защита данных

• Интервью журнала NWC с руководителем компании Imperva Шломо Крамером

• Speermint: стандартизированный протокол SIP-пиринга

• Во всем виноват браузер

• Сертификация сайтов не решает проблему безопасности

новые продукты

• Кабельные стяжки для пищевой промышленности; Эстетичное управление шнурами; Новые ИБП для дома и офиса; Шлюз для передачи сотового трафика через DSL; О мечте парковщика


• Калейдоскоп



 Copyright © 1997-2007 ООО "Сети и Системы Связи". Тел. (495) 234-53-21. Факс (495) 974-7110. вверх