Ж у р н а л   о   к о м п ь ю т е р н ы х   с е т я х   и   т е л е к о м м у н и к а ц и о н н ы х   т е х н о л о г и я х
СЕТИ И СИСТЕМЫ СВЯЗИ on-line
  ПОИСК: ПОДПИСКА НА НОВОСТИ: НОМЕР:
    ДОМОЙ • Архив: Новостей | Конференций | НомеровПодписка
 
   
 
   
    
РЕДАКЦИЯ
 
Все о журнале
Подписка
Как проехать
Где купить
Отдел рекламы
График выхода журнала
Адреса в Интернет

РУБРИКАТОР
   
• Инфраструктура
• Информационные
   системы

• Сети связи
• Защита данных
• Кабельные системы
• Бизнес
• Колонка редактора
• Электронная
   коммерция

• Только на сервере
• Системы
   учрежденческой
   связи

• Новые продукты


Rambler's Top100

  

Стандарт MRCP на службе у разработчиков голосовых приложений

Майкл Дж. Димариа

Все, кто разрабатывает, внедряет или использует голосовые приложения, знают, какие выгоды дает обработка речевой информации (speech processing), — она предоставляет, в частности, такие возможности, как пересылка сообщений электронной почты и системы мгновенных сообщений (IM) через УАТС на сотовые телефоны с помощью технологии преобразования TTS (TextTo-Speech). Однако реализация этих возможностей не такое простое дело, а стандартный метод обработки потоков аудиоинформации и управления ими в распределенной (сетевой) среде долгое время отсутствовал.

Рабочая группа SpeechSC (Speech Services Control) организации IETF занимается решением этой проблемы, разрабатывая версию 2 протокола управления медиаресурсами MRCPv2 (Media Resource Control Protocol). Эта спецификация позволит любому голосовому приложению управлять сетевыми медиаресурсами, такими, как синтезаторы и распознаватели речи. Конечная цель группы — стимулировать разработку новых речевых приложений и убрать “финансовый барьер”, стоящий на пути их использования.

В работе группы SpeechSC участвуют такие известные разработчики систем обработки речи, как фирмы Nuance Communications и Voxpilot, а также сетевой гигант Cisco Systems. Хотя стандарт MRCPv2 еще окончательно не принят, но уже появились продукты, поддерживающие его предварительный вариант.

Вместе с тем некоторые крупные игроки с прохладцей относятся к проекту MRCPv2. Так, компания Microsoft еще не сформулировала свою официальную позицию в отношении этого проекта. Большинство поставщиков УАТС тоже пока не высказались в поддержку нового стандарта. Правда, мы подозреваем, что MRCPv2 тихой сапой заручится их поддержкой, так как они тесно связаны с разработчиками средств обработки речи.

Облегчая взаимопонимание

Без MRCPv2 программистам, разрабатывающим голосовые приложения, необходимо приспосабливаться к особенностям фирменных механизмов обработки речи. В некоторых случаях поставщик ПО даже предлагает разные интерфейсы для каждого продаваемого продукта, что вносит еще большую путаницу. Именно для борьбы с фирменными интерфейсами компании Cisco, Nuance и Speechworks разработали протокол MRCP в 2001 г. Первоначально они вели эту работу вне структур IETF.

Первая версия MRCP была ориентирована на системы обработки речи с высокой степенью централизации, и в ней не были предусмотрены такие ключевые аспекты, как идентификация и верификация говорящего лица — SI (Speaker Identification) и SV (Speaker Verification) соответственно. По словам Эрика Бюргера, представителя компании Cantana Technology и сопредседателя группы SpeechSC, протокол MRCPv1 имел такие недостатки, как плохая масштабируемость и недостаточная информационная безопасность. Средства SI могут использоваться для интеграции телефонии c другими системами — например, если одни служащие компании участвуют в Web-конференции, а другие соединяются с ее участниками по телефону, то сервисы идентификации говорящих лиц позволят отображать их фамилии на экранах мониторов Web-пользователей, чтобы последние могли понять, кто с ними говорит. SV-сервисы могут использоваться и как биометрическое средство для контроля доступа.

В 2002 г. IETF была сформирована группа SpeechSC, ориентированная на решение всех этих вопросов, в том числе на стандартизацию интерфейсов для сервисов TTS, SI, SV и механизмов распознавания речи (Automatic Speech Recognizer — ASR). Предложенная группой базовая концепция описана в документе RFC 4313. Протокол MRCPv2 представляет собой реализацию этой концепции. Его ратификация IETF ожидается в первой половине текущего года.

Технология MRCPv2 строится на существующих протоколах IP-телефонии и передачи голосовой информации — SIP (Session Initiation Protocol), RTP (Real-Time Transport Protocol) и VoiceXML. Сопредседатели группы SpeechSC Эрик Бюргер и Дэвид Орэн (представляющий компанию Cisco) одновремен-но входят в Совет директоров Форума SIP. Г-н Бюргер также является членом Комитета MRCP Форума VoiceXML. Та-ким образом, люди, отвечаю-щие за MRCPv2, имеют возможность работать с другими специалистами, которые во многом определяют развитие систем обработки речи и IP-телефонии.

Кто за, а кто — в сторонке?

Компании Cisco, IBM и еще больше дюжины фирм внесли свой вклад в разработку MRCPv2. Большинство участников группы SpeechSC представляют компании, работающие в области систем обработки речи.

В глаза бросается демонстративное отсутствие в списке участников SpeechSC компании Microsoft. Ее продукт Microsoft Speech Server, — который базируется на собственном коммуникационном протоколе компании, известном под названием SAPI (Speech Application Programming Interface), — является важным компонентом развиваемой Microsoft концепции объединенных коммуникаций. Сервер Speech Server, например, позволяет пользователю системы Exchange 2007 получать электронную почту на мобильный телефон (при этом используются функции распознавания речи и TTS). Но Microsoft до сих пор не делала никаких официальных заявлений по поводу MRCPv2 — ни за, ни против.

Отношение Microsoft к MRCPv2 не является показателем свершившегося или надвигающегося провала стандарта. Свидетельством этого может служить история, которая была у компании со стандартом VoiceXML. Изначально Microsoft намеревалась использовать для продукта Speech Server технологию SALT (Speech Application Language Tags). Однако в апреле 2006 г. она заявила, что продукт Speech Server 2007 будет полностью поддерживать и SALT и VoiceXML. Одной из причин такого решения стал поворот рынка в сторону VoiceXML, и Microsoft поняла необходимость поддерживать эту технологию. Некоторые эксперты полагают, что Microsoft попыталась установить господство SALT, но рынку это не понравилось. Во всяком случае, мы подозреваем, что отрасль будет благосклонна к технологии MRCPv2, и Microsoft придется с этим считаться. Возможно, будет разработан транслятор SAPI — MRCP, который эффективно решит проблему, связанную с неучастием Microsoft в проекте MRCPv2.

В чем же польза?

Принятие фирмами-производителями стандарта MRCPv2 упростит и удешевит разработку речевых приложений и, следовательно, увеличит потенциал соответствующего рынка. Однако стандарт сделает проще и переход от одной системы обработки речи к другой, что, конечно, принесет пользу ИТ-службам, но выгода для самих поставщиков средств речевой обработки здесь не столь очевидна. Компания Nuance Communications полагает, что более открытый рынок полезнее, чем рынок замкнутый, и все, что способствует росту отрасли, хорошо для производителей. Рынок систем обработки речи сравнительно невелик и пока на нем не наблюдалось бурного роста; компании надеются, что принятие стандарта MRCPv2 станет катализатором этого процесса.

Выгоды от принятия стандарта MRCPv2 получают Cisco, IBM и другие фирмы, которые пользуются технологиями обработки речи, но не обязательно являются их разработчиками. Дело в том, что наличие стандартных интерфейсов облегчает разработку приложений и перенос их с одной платформы на другую, а также упрощает подбор кадров программистов..





  
7 '2007
СОДЕРЖАНИЕ

бизнес

• Пять мифов об удовлетворенности клиентов

инфраструктура

• Приключения во вселенной данных

• Совокупная стоимость владения БЛВС

• Стандарт MRCP на службе у разработчиков голосовых приложений

• Головоломка под названием «Мобилизация Linux»

• Беспроводные USB-устройства на подходе

информационные системы

• Найти общий язык

• CMDB — новая золотая жила ИТ?

• XQuery как основа трансформации СУБД

• Lemonade для мобильных пользователей

сети связи

• Когда минута уже не товар

кабельные системы

• Как ослабить натяжение в кабелях?

• На виражах кабельных трасс. Тенденции рынка

• Перспективы применения в СКС горизонтальных кабелей с повышенным волновым сопротивлением

защита данных

• Инструментальные средства обнаружения rootkit-утилит

• О данных замолвите слово

• Двухуровневое решение для безопасности БЛВС


• Калейдоскоп



 Copyright © 1997-2007 ООО "Сети и Системы Связи". Тел. (495) 234-53-21. Факс (495) 974-7110. вверх