Ж у р н а л   о   к о м п ь ю т е р н ы х   с е т я х   и   т е л е к о м м у н и к а ц и о н н ы х   т е х н о л о г и я х
СЕТИ И СИСТЕМЫ СВЯЗИ on-line
  ПОИСК: ПОДПИСКА НА НОВОСТИ: НОМЕР:
    ДОМОЙ • Архив: Новостей | Конференций | НомеровПодписка
 
   
 
   
    
РЕДАКЦИЯ
 
Все о журнале
Подписка
Как проехать
Где купить
Отдел рекламы
График выхода журнала
Адреса в Интернет

РУБРИКАТОР
   
• Инфраструктура
• Информационные
   системы

• Сети связи
• Защита данных
• Кабельные системы
• Бизнес
• Колонка редактора
• Электронная
   коммерция

• Только на сервере
• Системы
   учрежденческой
   связи

• Новые продукты


Rambler's Top100

  

Измерения в системном администрировании

Дэйв Молта

Каждый день по дороге на работу я проезжаю мимо щита, рекламирующего самый крупный текущий выигрыш лотереи штата Нью-Йорк. Эту игру моя жена называет налогом, который взимают с людей, плохо знающих математику. С последней у меня всегда было все в порядке, поэтому я предпочитаю проводить досуг в казино, где могу расставаться с деньгами не так быстро. Кстати насчет математики. Во время учебы в университете я настолько был очарован статистикой, что даже назвал бы это страстью к измерениям. В конце концов знание статистики помогло мне усовершенствоваться в качестве сетевого администратора.

Для чего проводят измерения

Устанавливая сеть в небольшом учреждении или модернизируя магистраль сети офиса на 10 000 узлов, вы скоро обнаружите, что бьетесь именно над решением ключевых вопросов. Например, достаточно ли пропускной способности на входе или выходе вашего сервера? Сколько пользователей можно поддерживать на одном сегменте Ethernet? Какой емкости магистральная сеть нужна вам? Приемлемый ответ на каждый них потребует проведения тех или иных измерений.

Если вы являетесь администратором сети, первая ваша забота - обеспечение надлежащего качества услуг, предоставляемых сетью. Вопрос лишь в том, как оценить его? Без серьезного подхода к измерениям вы будете просто блуждать в потемках. И хотя многие сетевые администраторы довольно успешно следовали своей интуиции, немалое число их оказалось в проигрыше, так как не избрали более разумный путь.

Первый этап измерений

Главное на этом этапе - не ошибиться, чтобы потом долго не исправлять. Я советую вам провести долгосрочный эмпирический анализ. Для этого вы должны быть готовы к тяжелой работе, закладывая в течение многих месяцев или даже лет основу своей деятельности путем сбора и накопления данных, возможно и не очень содержательных. Кроме того, если вы администратор сети большого предприятия, то, вероятно, обнаружите нервозность некоторой части служащих, когда они узнают о начале систематического сбора данных. Вам придется убедить их, что сбор статистических данных принесет им только пользу.

Чтобы принять решения о том, какие собирать данные, потребуется какое-то время. Оно необходимо для лучшего осмысления связи между определенными характеристиками сети и качеством ее работы в понимании пользователя. Некоторые сетевые администраторы ошибаются, полагая, что для пользователей важнее всего производительность и функциональность сети. В действительности же большинство из них считают, что самый главный критерий работы сети - это ее надежность. Немалое число пользователей приспосабливаются к задержкам в сети (в разумных пределах), но редкие из них могут смириться с отказами сети в самый неподходящий момент.

Я думаю, вас не удивит тот факт, что первый этап измерений - это сбор данных о доступности всех систем сети. В частности, следует ежемесячно подсчитывать время работоспособности всех важных серверов, чтобы достичь коэффициента их использования 99,9%. Скоро вы увидите, как эти поступающие данные становятся источником гордости системных и сетевых администраторов. Они начинают думать о влиянии результатов своего труда на эти данные.

О пользе статистики

Мгновенные измерения играют важную роль. Только потратив некоторое время на процедуру "измерить и показать", вы получаете важную информацию, позволяющую вам по-новому взглянуть на качество работы сети. Уточнить оценку помогают два важных понятия математической статистики: корреляционный и продольный анализ (longitudinal analysis).

Корреляция служит мерой статистической взаимосвязи двух переменных. Например, вы обнаруживаете сильную корреляцию между появлением ошибок в сети и сбоем в работе серверов. Но эта взаимосвязь может оказаться ложной, поскольку ее истинной причиной будет нестабильное питание. Заметим, что в отличие от ассоциации корреляция не подразумевает причинно-следственных отношений и для ее определения необходимо не только понимание логики, но и эмпирическое наблюдение.

Продольный анализ - понятие несколько более сложное, так как в анализ качества обслуживания включается переменная времени. Продольный анализ может быть полезен при определении причинно-следственных отношений между проблемами, возникающими в циклических системах. Например, процедуры по завершению месяца предъявляют более жесткие требования к пропускной способности сети, и в это время возможны отказы в работе серверов, что проявляется в виде ошибок драйвера сетевого адаптера. Важно то, что продольный анализ помогает выявить длительные тенденции, осмыслив которые, вы сделаетесь более продуктивным сетевым администратором. Но собирать данные вы будете в течение длительного периода, и, чем скорее вы начнете делать это, тем быстрее получите результат.

После того как началось внедрение стандартизованных технологий, вроде протокола SNMP и удаленного мониторинга (RMON), измерять производительность сети и сервера стало гораздо легче. Весь фокус в том, чтобы определить, какие из переменных более важны для измерений и как подытожить полученные данные, чтобы затем использовать их для принятия решений в конкретных ситуациях. Например, мы проводим статистический анализ производительности наших сетей Ethernet. Для этого мы измеряем среднее значение интенсивности их использования в течение пикового периода, т. е. с восьми утра до пяти вечера. За день накапливаются данные от измерений в 108 временных точках на каждую физическую сеть. Затем мы строим временные диаграммы, отслеживаем ежедневное среднее значение интенсивности использования сетей и, если оно превышает 20%, пытаемся предпринять корректирующие действия до того, как оно достигнет 30%. Мы также собираем аналогичные данные по подсчету пакетов коллизий и ошибок (см. netsys.syr.edu/netdes).

Является ли наше измерение интенсивности использования Ethernet состоятельным? Приемлемы ли на практике наши действия? Мы думаем, да, хотя, возможно, у вас есть методы и получше нашего.

Важнее и труднее собирать данные относительно того, удовлетворены ли пользователи обслуживанием. Такие данные являются мерилом вашей успешной работы. Может быть, когда-нибудь и появится группа удаленного мониторинга, которая будет проводить подобные измерения с помощью зонда, прикрепленного к руке пользователя! Пока же единственный путь, позволяющий узнать, довольны ли люди вашим обслуживанием, - это спросить их об этом. Но сказать легче, чем сделать. Конечно, невелик труд собрать краткую информацию, используя персональные интервью. Однако, если вы хотите быть последовательным, вам придется самому разработать и применить подходящий метод исследования.

К сожалению, согласно теории вероятности, нельзя вывести точное заключение об удовлетворенности работой сети на 1000 пользователей на основании, скажем, 20%-ной выборки. Но существуют оценки и для этого вида обследований. Если, например, вы обнаружили, что половина членов такой выборки не довольны работой сети, вы с уверенностью можете говорить по крайней мере о 10% всех пользователей, которых ее работа не устраивает. И поскольку вам определенным образом отвечали лишь 50% обследуемой выборки, то вы, конечно, не можете сделать вывод, что половина всех пользователей ответят вам так же. Для подтверждения полученной информации лучше всего опросить небольшую группу пользователей. Данная процедура необязательна, но позволит вам уловить отдельные нюансы, ускользающие при статистическом исследовании.

Некоторые предостережения

Польза описанной стратегии измерений ограниченна в основном из-за ошибочных моделей реальности. Нельзя, например, измерить надежность обслуживания, основываясь только на доступности сервера, - слишком много переменных встречается на пути от клиента до сервера. Так же трудно решить, сколько времени и сил необходимо потратить на сбор и анализ данных, а сколько - на разбор "завала" жалоб на некачественное обслуживание. И если бы я любил заключать пари, то думаю, что заключил бы его с большинством из вас на то, каково же будет это соотношение.





  
2 '1998
СОДЕРЖАНИЕ

колонка редактора

• Не думай о минутах свысока

локальные сети

• Проблемы множественной адресации серверов Windows NT

• ВЛВС: стандарты p и Q на подходе

• Невыдуманные истории

корпоративные сети

• Системы ERP: основные задачи и область применения

• Сетевые тестеры и анализаторы протоколов

• Беспроводные мосты на 10 Мбит/с

• Системы видеоконференц-связи стандарта H.323

системы учрежденческой связи

• Телефакс, приносящий прибыль

услуги сетей связи

• Магистральные коммутаторы ATM для распределенных корпоративных сетей

• Средства связи подключения к ISDN

• О телефонистах замолвите слово...

• Адаптеры ISDN

• "Камень" решили сдвинуть "сверху"

• Аббревиатуры, применяемые при измерениях в ИКМ-системах

интернет и интрасети

• Звуки Интернет

• "Петербургское оптическое волокно"

• Файловая система для Интернет: WebNFS или CIFS

• Кэширование Web-трафика с помощью серверов-посредников

защита данных

• Как защитить сеть от "взлома"?

• Современные технологии сетевого резервного копирования

новые продукты

• FastStor: широкие возможности применения, Новый коммутатор Catalyst, Маленькие радости от MiLAN Technology

бизнес

• От РИФа к РИФу

только на сервере

• Измерения в системном администрировании

• Архитектура клиент–сервер или Web: выбор разработчика



 Copyright © 1997-2007 ООО "Сети и Системы Связи". Тел. (495) 234-53-21. Факс (495) 974-7110. вверх