ISSN 2225-7551

В.О. Темніков, канд. техн. наук

О.В. Петейчук, аспірант

Національний авіаційний університет, м. Київ, Україна

СИСТЕМА ГОЛОСОВОГО РОЗПІЗНАВАННЯ ОПЕРАТОРІВ ПРИ ВИКОРИСТАННІ ВСТАНОВЛЕНОЇ ФРАЗЕОЛОГІЇ

Запропонований принцип побудови підсистеми параметризації як складової системи автентифікації операторів ергатичних систем за голосом. Застосування наведеного підходу дозволяє поліпшити якість контролю за роботою операторів і запобігти доступу до систем управління ергатичних систем несанкціонованих операторів та операторів, які знаходяться у неналежному психофізіологічному стані.

Постановка проблеми

У зв’язку з передбачуваним збільшенням кількості авіарейсів, пов’язано з проведенням у 2012 році першості Європи по футболу, гостро постає питання про необхідність прийняття дієвих заходів щодо підвищення безпеки польотів.

Однією з важливих причин аварій та аварійних ситуацій в авіації є людський фактор. Статистичні дані щодо причин економічних та соціальних втрат транспортних (у тому числі авіаційних) компаній свідчать про те, що від 50 % до 80 % всіх аварій та порушень технологічного режиму трапляються з вини оперативного персоналу. В українській авіації аварійність з вини персоналу за останні роки збільшилась на 10% [1].

Важливою ланкою авіаційних ергатичних систем (ЕС) є диспетчер управління повітряним рухом (авіадиспетчер). Варто звернути увагу при цьому на те, що робота авіадиспетчера поєднана з постійною нервово-емоційною напруженістю, пов’язаною з підвищеною відповідальністю за прийняті рішення, дефіцитом часу, великим обсягом контрольованих ситуацій, високою швидкістю процесів, що відбуваються під час виконання авіадиспетчерами функціональних обов’язків [2,3].

Одним з шляхів підвищення безпеки в авіації, істотного зменшення кількості аварій та аварійних ситуацій через людський фактор є неперервний контроль за діями авіадиспетчерів як суб’єктів авіаційних ЕС у процесі виконання ними функціональних обов’язків під час робочої зміни [4].

Таким чином, велику актуальність набуває розробка автоматизованої системи контролю доступу (СКД) авіадиспетчерів до систем управління ЕС, що забезпечує вирішення таких задач, як: автентифікація авіадиспетчерів (для запобігання несанкціонованого доступу до систем управління) і моніторинг їх психофізіологічного стану (ПФС) (емоційного стану та стану втоми).

Метою даної роботи є розробка принципу побудови підсистеми параметризації як складової системи автентифікації операторів ергатичних систем за голосом на основі розпізнавання лексичних елементів мови при використанні встановленої фразеології. Відмінною рисою підсистеми параметризації є врахування особливостей роботи авіадиспетчера, які полягають у тому, що в процесі аудіозв’язку з повітряними суднами авіадиспетчери використовують встановлену фразеологію, причому вести діалог авіадиспетчери повинні рівномірним голосом, чітко вимовляючи слова та тримаючи мікрофон завжди на одній і тій самій відстані від рота.

Автентифікація та моніторинг ПФС авіадиспетчера при використанні встановленої фразеології

У статті пропонується контроль за роботою авіадиспетчера здійснювати по голосу, аналізуючи мовні відрізки, що формуються в процесі аудіообміну авіадиспетчерів з повітряними та наземними авіаційними станціями. При цьому враховується вплив ПФС авіадиспетчера на параметри його мовного сигналу.

Система розпізнавання операторів включає в себе типові складові частини, що виконують такі функції: сканування, попередня обробка сигналу, параметризація та прийняття рішення (класифікація).

На рис.1 представлена розроблена авторами структурна схема підсистеми параметризації мовного сигналу. Розроблена схема включає такі елементи: сегментація, пошук слів у неперервній (злитій) мові та параметризація лексичних елементів.

 

           
 

 

Сегментація

   

Пошук слів в неперервній (злитій) мові

 

Параметризація лексичних елементів

 

 
 

 

 

 

                

 

 

 

Рис.1. Структурна схема підсистеми параметризації

 

У процесі роботи підсистема параметризації з очищеного на етапі попередньої обробки сигналу загального мовного потоку виділяє мовний відрізок певної заданої тривалості. Далі здійснюється виділення та розпізнавання лексичних елементів (під лексичними елементами розуміємо фонеми, алофони, дифони тощо), які об’єднуються в склади та морфеми, що, у свою чергу, створюють слова та словосполучення, які порівнюються зі складами, морфемами, словами та словосполученнями, що містяться в попередньо сформованому словнику.

Отримані на даному етапі результати використовуються в подальшому для автентифікації авіадиспетчерів.

Оскільки під час робочої зміни в приміщенні знаходиться обмежена кількість осіб, доцільно використовувати як основний інформативний параметр мовного сигналу частоту основного тону (ЧОТ) та його похідні, значення формантних частот формант вище четвертої  та темпоральні характеристики мови.

Для кожного оператора притаманні свої значення частоти основного тону. На рис.2 зображено спектрограми формант «я» (рис.2 а) та «у» (рис.2 б), що вимовлені одним диктором. На рис.2 також зображені часові залежності частот основного тону та чотирьох формант.

а)                                                                          б)

Рис. 2. Спектрограми фонем «я» (а) та «у» (б)

Зауважимо, що значення ЧОТ не є сталими для конкретної особи, оскільки вони можуть коливатись у певних межах в залежності від інтонації, розміщення наголосу, ПФС (емоційного стану та стану втоми) дикторів та ін.

Одним із способів підвищення точності роботи системи автоматичної автентифікації осіб по голосу може бути використання параметрів, що відображають динаміку зміни ЧОТ (зокрема, зрізаність, дисперсію) [5].

Графік (рис.3), побудований за даними, що отримані як відношення ЧОТ фонем фрази "Говорите в микрофон" до значень ЧОТ першої фонеми, ілюструє даний підхід та робить більш помітною різницю в розподіленні ЧОТ для різних дикторів. Хоча у дикторів 1, 6 та 3, 5 середні значення ЧОТ доволі близькі, ЧОТ окремих фонем суттєво відрізняються.

 

Рис. 3. Графік розподілу ЧОТ між окремими фонемами експериментальної фрази

 

Автентифікацію операторів можна проводити також на основі аналізу значень четвертої формантної частоти. Про це свідчать результати порівняння значень четвертої формантної частоти для різних фонем, що вимовляються різними дикторами. У табл.1 та на рис.4 наведені дані для трьох дикторів.

 

Таблиця 1

Значення четвертих формантних частот різних фонем для трьох дикторів

 

Формантна частота, Гц

 

А

 

Я

 

Ю

 

Е

 

У

 

О

 

І

1 диктор

4442

4507

3931

4044

3999

3743

4371

2 диктор

3402

3375

3120

3646

3363

3633

3423

3 диктор

4062

4026

3861

3792

3866

3456

3685

 

 

Динаміка змінення ЧОТ є важливішим засобом вираження емоцій, що визначають ПФС оператора.

Експерименти показали, що середня частота основного тону має доволі чітку тенденцію до підвищення при зміні стану оператора за напрямом: депресія — норма (зосередженість) – збудження. Так, у стані підвищеного емоційного збудження середнє значення ЧОТ збільшується на 40-60 %. Наприклад, якщо частота основного тону в стані зосередженості (норма) була 120 Гц, то в стані депресії вона понижується  до 100 Гц, а при збудженні – піднімається до 200 Гц.

Рис. 4. Порівняння значень характеристики четвертих формантних частот

 

Крім того, змінюється характер зміни ЧОТ: у стані норми зміна частоти під час проголошення фрази плавна, при збудженні з’являються різкі виплески, збільшується зрізаність та діапазон зміни ЧОТ.

Крім того, в стані підвищеного емоційного збудження на 3-5 дБ підвищується середній рівень мови, приблизно на 20 %  збільшується темп мови; в стані втоми підвищується тривалість виголошеної фрази у зв’язку зі збільшенням довжини пауз та окремих звуків; при сильному стресі змінюється тембр голосу.

Висновки

Запропонований авторами підхід дозволяє проводити розпізнавання особи, яка знаходиться на даному робочому місці, та моніторинг її ПФС у режимі реального часу на основі аналізу мовного сигналу, що формується під час аудіообміну між авіадиспетчером та повітряними і наземними авіаційними станціями.

Проведення такого контролю за роботою авіадиспетчера дозволить зменшити вплив людського фактора на безпеку в різних сферах діяльності людей (на транспорті, в енергетиці та ін.), де оператори використовують певну встановлену фразеологію.

Список використаних джерел

  1. Буров О.Ю. Ергономічні основи розробки систем прогнозування працездатності людини-оператора на основі психофізіологічних моделей діяльності: дис.… д-ра техн. наук: 05.01.04 / Буров О.Ю. // НДІ проблем військової медицини Збройних сил України. – К., 2006. – 329 с.
  2. Денисов В. Г. Авиационная инженерная психология / В. Г. Денисов, В. Ф. Они­щен­ко, А. В. Скрипец. – М.: Машиностроение, 1983. – 232с.
  3. Леонтьев А.Н. Человек и техника / А.Н. Леонтьев, Б.Ф. Ломов // Вопросы психологии. – 1963. – № 5. – С. 29-37.
  4. Temnikov V.A.,Peteychuk A.V. Organization of preshift and intrashift access control of ATC to the resources of information systems //The fourth world congress “Aviation in the XXI-st century”, “Safety in Aviation and Space Technologies”. Proceedings. Volume1. Kyiv 2010. – P. 17.22-17.25.
  5. Темников В.А. Параметризация автоматического контроля доступа операторов к ресурсам информационных систем по голосу / Темников В.А., Темникова Е.Л. // Вестник Восточноукраинского национального университета им. В. Даля. – 2010. – №9 (151). – Ч.1. – С. 143-148.