Ж у р н а л   о   к о м п ь ю т е р н ы х   с е т я х   и   т е л е к о м м у н и к а ц и о н н ы х   т е х н о л о г и я х
СЕТИ И СИСТЕМЫ СВЯЗИ on-line
  ПОИСК: ПОДПИСКА НА НОВОСТИ: НОМЕР:
    ДОМОЙ • Архив: Новостей | Конференций | НомеровПодписка
 
   
 
   
    
РЕДАКЦИЯ
 
Все о журнале
Подписка
Как проехать
Где купить
Отдел рекламы
График выхода журнала
Адреса в Интернет

РУБРИКАТОР
   
• Инфраструктура
• Информационные
   системы

• Сети связи
• Защита данных
• Кабельные системы
• Бизнес
• Колонка редактора
• Электронная
   коммерция

• Только на сервере
• Системы
   учрежденческой
   связи

• Новые продукты


Rambler's Top100

  

Тестируем системы MoM

Брюс Бордман

Сделать все проще — вот для чего предназначена система MoM (Manager of Managers). Всегда были и будут нужны приложения, системы и инструменты, с помощью которых можно достичь максимального уровня детализации. Но когда деталей слишком много, обнаружить проблему становится трудно, а подчас и просто невозможно. MoM помогают упростить поиск неполадок, регистрируя лишь самые важные события, а затем выясняя их первоисточник.

Чтобы узнать, насколько хорошо MoM справляются с этой задачей, мы протестировали пять продуктов: Spectrum xsight от Aprisma Management Technologies, Patrol Enterprise Manager от BMC Software, Formula and Business Service Analyzer от Managed Objects, Netcool/Omnibus от Micromuse и InCharge Solutions Suite от Smarts. Поскольку испытания проводились в сети нашей лаборатории Real-World Labs в Сиракузском университете, нам были нужны продукты, напрямую поддерживающие именно агенты Knowledge Module производства BMC Software. Таким образом, мы были вынуждены отказаться от тестирования продуктов Tavve Software и Concord Communications, поскольку они не соответствовали этому критерию.

Помимо информации от агентов Knowledge Module фирмы BMC, мы собирали SNMP-данные от HP OpenView NNM производства Hewlett-Packard, Tivoli NetView производства IBM и непосредственно от сетевых устройств, поддерживающих SNMP. Эти дополнительные данные дали нам представление о сетевой и системной производительности, а также позволили определить, насколько хорошо каждая из MoM-систем интегрирована с источниками данных третьих фирм.

За основу выставления оценок мы приняли пять факторов: управление событиями, удобство и простота использования, архитектура и цена в двух различных сценариях использования продуктов (табл. 2).

Системы MoM используют управление событиями, чтобы уменьшить, сделать более четким и осмысленным море отчетов, которое генерируется сетевыми приложениями. Управление событиями включает в себя простые задачи, например фильтрацию и свертывание дублирования (de-duplication — простой подсчет числа повторяющихся событий); сравнительно сложные, вроде подавления сообщений об ошибках во входящем трафике (fault suppression), а также интеллектуальные алгоритмические. Так, нормализация, или упрощение, описаний событий позволяет оператору еще при их чтении предположить, что же на самом деле случилось.

В то же время самая трудная задача — это корреляция событий для поиска источника проблемы. Из всех протестированных нами продуктов лучше всех справился с этим

Smarts InCharge. Обладая функцией выдачи предположений об источниках проблем, он выдает список возможных причин с вероятностью каждого из событий в процентах, таким образом, давая представление о настоящих причинах лучше, чем любой из остальных продуктов нашего обзора.

Мы также принимали во внимание удобство и простоту использования. Короче говоря, работу с MoM нужно организовать интуитивно понятным образом, чтобы минимизировать трудности в процессе обучения. При этом система должна быть достаточно гибкой, чтобы соответствовать требованиям опытного оператора, — с предсказуемой и настраиваемой навигацией и таким же инструментарием.

Полную версию данной статьи смотрите в 11-ом номере журнала за 2002 год.

Кроме того, эти продукты должны быть переносимыми, т. е. доставляться пользователю посредством Web-консолей. С точки зрения удобства работы мы нашли особенно полезным прогрессивный пользовательский интерфейс Formula от Managed Objects, хотя только один этот фактор не может перевесить все недостатки продукта.

Огромное количество событий, генерируемых сетевыми устройствами и приложениями, означает, что немаловажным требованием к продукту является наличие надежной архитектуры. Речь об архитектуре должна идти в русле того, насколько распределенной и избыточной должна быть система и, что особенно важно для MoM, возможна ли интеграция с продуктами управления третьих фирм. Во всех продуктах производители предлагают функцию распределенной обработки данных и избыточность, но только Micromuse Netcool и BMC Patrol Enterprise Management имеют механизмы распределенной обработки для фильтрации потоков событий.

Вопрос цены всегда важен, особенно в отношении продуктов такого класса. Они обычно обходятся предприятию в несколько сот тысяч долларов. Это означает, что за способность продукта “продираться” сквозь джунгли бесполезной информации к источнику отказа стоит доплатить эти деньги, особенно если время простоя приложения обходится заказчику в круглую сумму.

Для нашего тестирования мы подготовили два сценария: первый — это узел сети с 5 тыс. управляемых устройств и второй — огромная организация более чем со 100 тыс. устройств в 500 филиалах и пяти региональных офисах. Рассчитывая общую стоимость владения, мы учли розничную цену, предложенную производителем, стоимость технического обслуживания, услуг экспертов и обучения (см. табл. 2).

Наиболее привлекательная цена оказалась у Aprisma Spectrum xsight в сценарии с одним узлом: 66 тыс. долл. плюс 13,2 тыс. долл. за ежегодное обслуживание, включая стоимость обучения. Любопытно, что решение Aprisma было самым дорогим в сценарии с несколькими узлами: 468 тыс. долл. плюс 93,6 тыс. долл. за ежегодное обслуживание и 1925 долл. на пользователя за трехдневные курсы. В отличие от других производителей при развитии событий по второму сценарию Aprisma рекомендует устанавливать серверы на каждом узле, в то время как решениям конкурентов достаточно центральных серверов.

Победил в наших испытаниях Smarts InCharge, в основном в силу значительного превосходства над другими продуктами в области корреляции. Spectrum от Aprisma занял второе место благодаря удобству использования и опять же возможностям по корреляции данных. А необычайно низкая цена продукта в сценарии с одним узлом лишний раз убеждает нас в его лидерстве, даже несмотря на высокую цену реализации второго сценария.

Архитектура Micromuse Netcool/Omnibus и BMC Patrol Enterprise Manager позволяет фиксировать большое число событий, но ни один из этих продуктов не способен устанавливать корреляцию между ними так, как это делают продукты производства Smarts и Aprisma.

Все системы достаточно сложны, поэтому будьте готовы прочесть руководство по эксплуатации, как минимум, трижды. И приготовьте ваши бумажники: вам потребуются услуги экспертов.

System Management Arts InCharge Solutions Suite

Только два продукта — Smarts InCharge Solutions Suite и Aprisma Spectrum xsight — выполняют автообнаружение на уровне 2. Тот факт, что Smarts хранит результаты обнаружения в объектно-ориентированном виде, помогает ему лучше понимать топологию сети и значительно совершенствует его способности точно коррелировать события.

Фактически в этой особенности автообнаружения и заключается секрет успеха Smarts, и она, эта особенность, стала причиной его победы в нашем тестировании. Для того чтобы продукт мог “оценивать” значимость каждого события в сети, он должен обладать базовой информацией о ее топологии.

Нельзя сказать, чтобы InCharge отлично разобрался с топологией нашей сети; нам пришлось запускать процесс обнаружения несколько раз до того, как фильтры начали нормально работать. Да и настройка конфигурации InCharge вручную заняла у нас массу времени. Но все же способ обработки процессов, примененный в InCharge, — разбиение сети на диапазоны адресов и использование множества фильтров в каждом из диапазонов — делает работу продукта необычайно гибкой и точной. И в конце концов нас поразило, как были представлены в нем наши агенты модулей знаний BMC, а также обнаруженная нами корреляция между этими агентами и SNMP-хостом.

Корреляция

Корреляция по таблице кодирования (codebook correlation), в которой используются уникальные сигнатуры симптомов, — запатентованная секретная технология Smarts. InCharge сканирует статус сети, выводит предположения об источниках проблем, основываясь на замеченных симптомах, и выдает вероятность каждого из событий в процентах.

Все это выглядит слишком хорошо, чтобы быть правдой, но когда дело дошло до обработки событий, технология, как ни странно, действительно начала работать. Кроме обычного выделения цветом событий в зависимости от приоритета и числа “дубликатов”, мы получили некоторые предпосылки того, что действительно произошло в каком-либо сегменте сети и почему. Например, когда от одного из наших маршрутизаторов пришло сообщение о нехватке доступной памяти, мы могли видеть, как часто превышалось пороговое значение, какие устройства от этого пострадали и какие события последовали за этим. Мы также заметили события, показывающие высокую загрузку некоторых портов; обычно с этого можно уже начинать поиск проблем.

Smarts InCharge упрощает работу, уменьшая список событий изменения состояний, посылаемый сетевым устройством или службой. Если быть точным, таких состояний — 14. Например, узел может не отвечать или находиться в состоянии частичного отказа (degrade); приложения могут находиться в нерабочем состоянии (down), в состоянии частичного отказа или коллизии (impacted); сетевые устройства могут испытывать перегрев, чрезмерную загрузку, работать с ошибками или нестабильно.

Компании Smarts предстоит еще много работы, чтобы трансформировать все множество событий и команд trap в эти несколько состояний, но нужно отметить, что она регулярно выпускает обновления. Впрочем, даже только что инсталлированная система смогла распознать большинство событий в нашей сети.

Разбираемся

То, что в продукте InCharge использованы объектно-ориентированная технология и корреляция по таблице кодирования, заставило нас потратить больше времени на его освоение. Графический интерфейс системы нельзя назвать интуитивно понятным — он много бы выиграл, будь в нем система контекстных подсказок. Одно из его достоинств — полное описание всех возможных состояний, которые могут появиться в полях любого из событий. После того как мы разобрались с интерфейсом, больше проблем не возникало. Как и все остальные продукты нашего тестирования, система полностью управляема из командной строки.

Хотя InCharge снабжен Web-консолью, это не Java-аплет, и, кроме того, в ней отсутствуют так любимые нами, появляющиеся по щелчку правой клавишей мыши контекстно-зависимые меню.

Цена решения Smarts InCharge сравнительно невысока — 85 тыс. долл. в сценарии с одним узлом и 169 тыс. долл. — с несколькими (плюс 18 % цены за ежегодное обслуживание в каждом из случаев). Компания Smarts рекомендует воспользоваться услугами специалистов в течение трех дней для первого сценария и пяти — для второго при стоимости таких услуг 2500 долл. в день. Обучение по цене 1000 долл. в день займет лишь пару дней практических занятий.

Aprisma Management Technologies Spectrum xsight

Один из старейших игроков на рынке MoM — Spectrum xsight ведет свою историю с 1991 г. Мы протестировали четыре различные версии продукта и можем честно сказать, что с годами он значительно усовершенствовался. Spectrum обладает наилучшими средствами настройки функции автообнаружения, позволяя выполнять ее на основе адресов, их диапазонов и типов. Любая из задач на автообнаружение может назначаться по собственному расписанию; таким образом, мы можем установить различные частоты обнаружения для магистральной сети (области, которая мало изменяется) и подсетей пользователей (которые меняются часто, и иногда очень неоптимально).

Результаты автообнаружения тоже хорошие. Подобно InCharge, Spectrum поддерживает обнаружение на уровне 2. Но этот процесс несовершенен. Во время испытаний мы обнаружили соединения между устройствами, которых уже не было в сети. Пусть даже эта ошибка произошла из-за сбоя в кэше, все равно это раздражает и отнимает время.

Устройства, которыми нужно управлять, можно выбирать вручную. Компания Spectrum называет этот процесс моделированием. В отличие от InCharge Spectrum снабжен фильтрами исключающего типа, которые упрощают создание подсетей и фильтров устройств.

С помощью интегрированной функции автообнаружения сети были найдены все наши узлы, но для интеграции с агентами Knowledge Module потребовался отдельный инструмент интеграции от BMC. Просмотр информации от этих агентов также требует наличия дополнительной программы SpectroGraph, Motif-подобной консоли от Spectrum.

Странно, но иногда процесс автообнаружения проходил достаточно быстро, а иногда система “задумывалась”. Возможно, это зависело от загрузки сервера (производитель никак не объяснил этот факт), но данный процесс обнаружения и моделирования может быть распределен, что сравнимо с функцией управления процессами в системах или сетевых операциях.

События

Новая и значительно усовершенствованная Web-консоль Spectrum под названием Web Operator — отличный инструмент для просмотра событий и информации о топологии сети. Результаты просмотра событий наших модулей знаний были неплохими. Технология Downstream Suppression уже в течение многих лет является отличительным признаком Spectrum; с ее помощью создается карта портов подключенных устройств и задаются установки по подавлению событий на основе этой системы соединений.

При получении сообщения о нехватке памяти в Microsoft Windows NT мы могли видеть общую информацию и детали, чтобы сделать достаточно точное предположение о причинах этого.

В другом событии, относящемся к серверу Sybase на платформе IBM AIX, было меньше деталей, но достаточно информации, четко указывающей на проблему в Sybase. В обоих случаях мы обнаружили ее источник и определили, какие устройства включали в себя проблемное оборудование и были смежными с ним. Корреляция и источник проблемы были указаны в клиенте Alarm Manager.

Spectrum определяет источник проблемы с помощью своей фирменной технологии Inductive Modeling, но ее применение не дает такого очевидного результата, как в случае с InCharge. Хотя продукт хорошо выполняет подавление аварийных сообщений входящего трафика, свертывание дублирования и работу на уровне 2, агенты BMC приходится подключать к серверам, на которых они запущены, вручную. Нельзя сказать, что это обременительно, поскольку заниматься этим придется лишь изредка, но в случае с InCharge такая операция вообще не понадобилась.

Удобство и простота использования

Motif-подобный клиент Spectrum, требующий отдельного времени на освоение, не имеет ничего общего с Motif, зато включает в себя огромное число инструментов, которые Spectrum накопил за 11-летнюю историю. В то же время Web Operator — очень полезный Java-интерфейс. Мы настойчиво рекомендуем этот набор инструментов функциональным и бизнес-подразделениям.

На экран Web Operator выводятся аварийные сигналы и фильтры; журнал аварийных сообщений имеет удобный экран просмотра, браузер устройств, отчеты и настроенные пользователем представления.

В архитектуре Spectrum широко представлены все модули сетевого управления, модули интеграции с BMC и избыточность сервера. В компании Aprisma поняли, что стоимость сетевого управления на предприятии очень высока, и взялись за решение этой проблемы, в то время как другие только говорят об этом. В сценарии с одним узлом стоимость решения составила всего лишь 66 тыс. долл., плюс 20 % этой суммы за годовое обслуживание и обучение. Эта цена гораздо ниже предложений остальных фирм. Хотя решение с несколькими узлами стоит значительно дороже, чем остальные продукты, Aprisma предпочла поставить отдельный сервер на каждом узле, а не просто установить несколько централизованных серверов, как сделали остальные производители. Это дает дополнительное преимущество Spectrum, поскольку обеспечивается запас надежности решения.

Micromuse Netcool/Omnibus

Нашедший широкое применение Netcool/Omnibus производства Micromuse известен благодаря быстрой обработке процессов, распределенной фильтрации событий и находящейся в памяти и легко масштабируемой базе данных. В сценарии с одним узлом его стоимость оказалась где-то в середине списка, а вот во втором сценарии его цена была минимальной; в то же время в использовании этот продукт сложнее большинства своих соперников.

С Netcool всегда можно было очень точно контролировать способ просмотра событий. Графический мастер (wizard) построения логических фильтров в сочетании со средствами сортировки позволяет быстро создать отображение событий в наиболее удобной форме, и неважно — для пользователя, опытного администратора или бизнес-подразделения.

Готовя свой пакет для нашего тестирования, в котором упор делался на функциональность MoM, компания Micromuse решила не включать в него инструменты работы с производительностью и топологией, поэтому мы не могли запустить процесс автообнаружения. Здесь Netcool выступал как Patrol Enterprise Manager производства BMC Software и Formula производства Managed Objects, основное внимание уделяя потокам событий платформ управления, расположенным уровнем ниже. Корреляция на основе топологии или опрос сетевых устройств в продукте отсутствовали.

С другой стороны, Netcool обладает таким большим количеством функций фильтрации и сортировки событий, что его администрирование почти искусство. Netcool можно назвать средой разработки просмотра событий. События можно пропускать через фильтры, полученные путем логических операций, что позволяет формировать фильтры любой сложности.

В Netcool нет ничего очень простого. Нельзя сказать, что разобраться со списком событий чрезвычайно сложно, все дело в наследии продукта — в нем оказались клиенты Motif, Windows NT и клиенты на основе Web. Впрочем, эта сложность ложится на плечи администратора, который должен разбираться в возможностях разных клиентов. А вот инструмент WebTop — это действительно будущее Micromuse, поскольку он позволяет получить удаленный доступ к большинству функций Netcool. WebTop нам понравился, за исключением некоторых небольших недоработок — это, например, не всегда четко работающая система помощи.

BMC Software Patrol Enterprise Manager

Patrol Enterprise Manager ведет отсчет времени с 1989 г., но еще до этого он существовал под именем Command Post и производился компанией Boole and Babbage. Фирма BMC Software обновила его интерфейс, добавила несколько различных “мастеров” и Web-клиентов, оставив при этом превосходную архитектуру сбора событий. В то же время, как оказалось, происхождение Patrol Enterprise Manager отнюдь не означает, что он должен успешно интегрироваться с агентами Knowledge Module, хотя в планах BMC есть намерение заставить в будущем все продукты работать в едином Web-окружении.

Для BMC Patrol Enterprise Manager неважно, сколько узлов или объектов присутствует в вашей среде: он обнаруживает сеть вашей организации на основе полученных событий. Это — одна из причин, почему Patrol Enterprise Ma-nager так хорошо масштабируется. Подобно Formula от Managed Objects и Netcool от Micromuse, Patrol Enterprise Manager использует управляемые им домены для сбора инвентаризационной информации. Такая схема позволяет продукту работать даже тогда, когда его конкуренты начинают “пробуксовывать”.

Управление событиями в Patrol Enterprise Manager основано на собранных данных. За много лет для Patrol Enterprise Manager были собраны события от различных устройств с последовательным интерфейсом и от приложений, работающих на мэйнфреймах.

Центр сбора событий в Patrol Enterprise Manager — это модуль Active Alert Display (AAD). Подобно Netcool от Micromuse, Patrol Enterprise Manager имеет механизмы фильтрации, выполняющие предварительную обработку событий и сокращающие количество событий, пропущенных в систему. Подобные механизмы предварительной обработки располагаются в различных местах сети — следовательно, обработка событий может выполняться вблизи их источника. Данный подход дает свободу для масштабирования.

AAD в работе с агентами Knowledge Modu-le от BMC Software, собрал массу полезной информации о событиях. Когда мы тестировали нарушение порогового значения памяти в системе Windows NT, из полученного сообщения мы сразу поняли, что проблема — в использовании операционной системой памяти на этом сервере. Нам не пришлось лезть глубже.

К сожалению, Patrol Enterprise Manager не показывает, как одно событие влияет на остальные устройства и службы сети, поскольку в нем отсутствует интеграция с находящейся уровнем ниже топологией. Таким образом, подавить поток ошибочных сообщений входящего трафика можно, но эта технология будет работать ненадежно, так как механизмы правил придется сконфигурировать таким образом, чтобы они выполняли подавления при обнаружении определенных событий. При появлении нового события вам потребуется новое правило.

Разработчики продукта решили остановиться на унифицированном Web-интерфейсе. В существующей версии для конфигурирования и администрирования продукта все еще нужен графический интерфейс Unix Motif, но пользовательский интерфейс неплохо работает и под управлением Windows. Интерфейс Web-клиента больше подойдет покупателю или бизнес-подразделению. В BMC пообещали, что для работы через Интернет будет создано больше интерфейсов, но пока придется ограничиться тем, что есть. Во время тестирования у нас возникли проблемы с операционной системой и базой данных. Да, мы получили помощь в решении обеих проблем, но в то же время считаем, что в Patrol Enterprise Manager, несмотря на его гибкость, полно таких вещей, которые требуют участия экспертов. Все это указывает на наилучшую область применения Patrol Enterprise Manager там, где множество узлов генерируют огромное количество событий, требующих фильтрации.

Цена Patrol Enterprise Manager в наших сценариях была такова: 182 тыс. долл. и 197,5 тыс. долл., плюс 20 % указанной цены за обслуживание в течение года. Стоимость в первом сценарии значительно превысила таковую у конкурентов, но во втором — оказалась в середине списка.

Managed Objects Formula и Business Service Analyzer

Продукт Formula от Managed Objects поразил нас уже в тот момент, как только мы его установили. Начиная от великолепного графического интерфейса с экраном топологии, на который не мешало бы взглянуть и другим разработчикам, и заканчивая инновационной архитектурой, Formula выглядел очень серьезным соперником. Но первое впечатление оказалось обманчивым. По правде говоря, Managed Objects подготовила свой продукт слишком уж быстро, и то, что производитель называет законченным решением, на наш взгляд, работает пока на уровне бета-версии.

Вместо обнаружения устройств на уровне 2 Formula показывает инвентаризационную информацию в виде прямого продолжения управляемых устройств. Эта информация весьма достоверна благодаря наличию фирменных агентов ORB (Object Request Broker), которые фирма Managed Objects создала для управляемых доменов. ORB-агенты на сервере управления напрямую собирают данные с систем сетевого управления на уровне API, которые затем передаются на сервер Formula и отображаются на консоли управления.

Консоль управления здесь максимально приближена к внешнему виду консоли конкретной системы. Например, топология и группы были представлены так же, как в нашем ПО Tivoli NetView. То же самое Formula повторил с HP OpenView Network Node Manager и BMC Software Patrol Console. С BMC и OpenView мы могли общаться в двух направлениях: подтверждать события и конфигурировать агенты Knowledge Module BMC.

С NetView коммуникация была односторонней — нам был доступен только просмотр.

Зная, что интеграция настолько сильна, мы не удивились, увидев множество событий BMC в консоли Formula. Корреляция в Formula выполняется посредством группирования сетевых устройств и служб. Поэтому ошибки показываются в группе с обозначением места, где могут быть проблемы. Фильтрация, которая в Formula называется “Профили”, очень подробна, и фильтры назначаются по классам, устройствам или регулярным выражениям. В каждом из профилей может быть отдельная политика сбора данных для ретроспективного анализа.

Продукт Formula даже не пытается выполнять традиционные для MoM функции свертывания дублирования и подавления потока ошибочных сообщений из входного трафика; для этого он предпочитает использовать управляющие приложения уровнем ниже. Нам не удалось собрать события в пределах одной группы, так как мы испытали затруднения со сбором данных для ретроспективного анализа. Сначала оказалось, что какие-то проблемы обнаружились в наших BMC-агентах на AIX, а затем начала сказываться перегрузка внутренней базы данных.

Консоль работает либо в виртуальной Java-машине браузера, либо с клиентом Java Web Start. Она отлично работала с JVM, но мы не смогли сконфигурировать клиент Java Web. Иногда мы наблюдали, что запущено было больше JVM, чем реально использовалось, и, кроме того, они оставались открытыми после закрытия последнего окна в конце сессии.

Во время тестирования мы пару раз производили обновление Formula. Процесс не представлял каких-либо трудностей, но мы чувствовали, что тратим слишком много времени, устраняя проблемы с инсталляцией. По цене 165 тыс. долл. за решение с одним узлом и 217 тыс. долл. с двумя, плюс 18 % от этих сумм за ежегодное обслуживание мы считаем этот продукт одним из самых дорогих решений нашего обзора.





  
11 '2002
СОДЕРЖАНИЕ

бизнес

• ИТ-консалтниг: ищите специалистов

• Азбука окупаемости инвестиций

локальные сети

• 10 Gigabit Ethernet: есть стандарт!

• Медиаконвертеры помогают развертывать оптические горизонтальные подсистемы СКС

• Системы управления СКС в реальном масштабе времени

корпоративные сети

• Коммутаторы Fibre Channel

• MoM: доктор для всей... сети

• Тестируем системы MoM

услуги сетей связи

• Устройства отображения информации для call-центров

• Планирование управления телекоммуникациями

защита данных

• ИБП средней мощности

новые продукты

• Cистема радиодоступа PacketWave; Планерки через "МиниКом"


• Калейдоскоп



 Copyright © 1997-2007 ООО "Сети и Системы Связи". Тел. (495) 234-53-21. Факс (495) 974-7110. вверх